AI in MySQL podatkovne baze

AI in MySQL podatkovne baze...

16 May 2025

5 min branja

To je pomembna napaka, da mnoge AI generirane podatkovne sheme trenutno težijo k uporabi VARCHAR(36) za stolpec id.

To je običajno motivirano z željo preprečiti nepooblaščen dostop s strani zlonamernih akterjev. Za dosego tega se UUID (Universal Unique Identifiers) pogosto uporabljajo kot varnostni ukrep.

Vzemimo WordPress kot primer — običajno razkrije ID-je objav v URL-ju kot ?p=45. V primerjavi s SEO-prijaznim formatom kot /2025/05/sample-post, ta numerični ID omogoča uporabnikom potencialno oceniti in dostopati do sosednje vsebine s spreminjanjem števila (npr. ?p=44). UUID so po drugi strani nesekvenčni in bistveno težji za ugibanje.

UUID so 36-znakovi nizi, ki sledijo standardnemu formatu s petimi odseki, ločenimi s črtice: 8-4-4-4-12. Vsak odsek sestavlja heksadecimalne vrednosti:

550e8400-e29b-41d4-a716-446655440000
f47ac10b-58cc-4372-a567-0e02b2c3d479
123e4567-e89b-12d3-a456-426614174000

Preprost regex za validacijo UUID-jev izgleda tako:

^[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}$

Čeprav UUID-ji zagotavljajo varnost in prenosljivost, prihajajo s kompromisi. Bistveno večji so od celih števil, kar lahko upočasni zmogljivost podatkovne baze — posebej pri uporabi kot primarni ključi v relacijskih podatkovnih bazah. Indeksiranje, uporaba pomnilnika in hitrost poizvedb vse trpi zaradi velikosti in nesekvenčne narave UUID-jev.

AI pogovor o ID strategiji

Radoveden o tej oblikovalski izbiri sem postavil to vprašanje GitHub Copilot:

Jaz:
Zakaj si se odločil definirati stolpec id kot VARCHAR(36) PRIMARY KEY v strukturi podatkovne baze?

GitHub Copilot:

Izbral sem VARCHAR(36) za ID stolpce iz več specifičnih razlogov:

UUID shranjevanje: 36-znakovna dolžina ustreza UUID vrednostim, ki sledijo standardiziranemu formatu.

Večnajemniški sistemi: UUID pomagajo izolirati najemnike z odpravo sekvenčnih ID uhajanj, poenostavljanjem migracij in izboljšanjem varnosti.

Prenosljivost podatkov: UUID zagotavljajo, da izvoženi podatki nimajo ID konfliktov pri uvozu v drugi sistem.

Kompromisi:

Večja velikost shranjevanja (36 bajtov proti 4 bajtom za INT)

Počasnejša zmogljivost indeksiranja in poizvedovanja

Višja uporaba pomnilnika

Alternativi za premislek:

AUTO_INCREMENT INT/BIGINT

BINARY(16) za shranjevanje surovih UUID bajtov bolj učinkovito

Prilagojena strategija generiranja ID

Sporoči mi, če bi raje drugačen pristop.

Jaz:
Uporabi BIGINT UNSIGNED za zmogljivost, vendar ohrani polje guid v vsakem zapisu za zunanje reference.

GitHub Copilot:

Posodobil bom shemo, da bo uporabljala BIGINT UNSIGNED za primarne ključe in dodal stolpec guid za zunanje reference. Ta hibridni pristop združuje najboljše iz obeh strategij:

Zmogljivost: Učinkovito indeksiranje in spajanje preko numeričnih primarnih ključev

Varnost in prenosljivost: GUID izpostavljeni v API-jih, ohranjajo notranje ID-je varne pred naštevanjem

Povzetek:

BIGINT UNSIGNED: Hiter, kompakten, sekvencijski

GUID (VARCHAR): Edinstven, prenosljiv, zunanje varen

NoSQL podatkovne baze in MongoDB ObjectIds

Medtem ko relacijske podatkovne baze ponujajo fleksibilnost pri izbiri med UUID, celimi števili ali hibridnimi pristopi, NoSQL sistemi kot MongoDB gredo po drugačni poti.

MongoDB uporablja vgrajeno vrsto, imenovano ObjectId za svoje polje _id. To je 12-bajtni binarni zapis, ki kodira:

4 bajti – Časovni žig (sekunde od epohe)
5 bajtov – Naključna vrednost (pogosto na osnovi stroja + ID procesa)
3 bajti – Naraščajoči števec

Primer:

507f1f77bcf86cd799439011

Zakaj MongoDB izbere ObjectId

Globalno edinstven brez koordinacije
Kot UUID, ObjectIds ne potrebujejo centralne avtoritete za zagotovitev edinstvenosti, kar jih naredi idealne za distribuirana okolja.
Časovno urejeno
Vgrajeni časovni žig pomeni, da so dokumenti v kronološkem vrstnem redu privzeto, kar lahko pomaga zmogljivosti pri poizvedbah časovnih vrst.
Kompaktno in učinkovito
Shranjeni v binarnem formatu, ObjectIds zavzamejo le 12 bajtov — veliko manj kot UUID VARCHAR(36). So tudi bolj prijazni za indeksiranje.

Primerjava ID strategij

Funkcija	UUID (VARCHAR)	BIGINT + GUID hibridni	MongoDB ObjectId
Velikost shranjevanja	36 bajtov	8 + 36 bajtov	12 bajtov
Zmogljivost indeksiranja	Slaba	Odlična	Odlična
Sekvencijski / čas	Ne	Da (le BIGINT)	Da (preko časovnega žiga)
Človeško berljiv format	Da	Da (GUID)	Ne (hex-temelji)
Ugibljiv	Ne	Ne (le GUID)	Ne
Uveljavljanje sheme	Striktno	Striktno	Fleksibilno

AI izbire v NoSQL kontekstih

Mnogi AI generirani sistemi uporabljajo NoSQL konfiguracije kot MongoDB privzeto, ko:

Pričakovani so visoki vpisi ali sharding
Sheme morajo biti fleksibilne ali polstrukturirane
Prenosljivost podatkov in distribuirano skaliranje so prioritete

V takšnih primerih je pogosto modra privzeta izbira uporabiti ObjectIds ali podobne edinstvene, časovno urejene identifikatorje.

PrimeCRM

Nazaj v Center Znanja

Ste pripravljeni?

Pripravljeni preoblikovati vaše ideje v resničnost?

Pridružite se uspešnim organizacijam, ki uporabljajo Libertas Software Research za gradnjo in oblikovanje mogočnih programskih rešitev za izpolnitev svojih potreb.

Stopite v stik

Stranke

Zaupajo nam v različnih produktih, ekipah in organizacijah

Izbor organizacij in platform, za katere gradimo rešitve, ki jih podpiramo ali s katerimi skupaj izvajamo projekte.

Najnovejši Članki Centra Znanja

Primerjalni test 15 ujemajočih se strani je pokazal, da je novo spletno mesto ATKDA na primeCRM v povprečju dostavilo HTML 9,3-krat hitreje kot prejšnje spletno mesto na WordPressu, pri čemer je bila strežniška obdelava 10,6-krat hitrejša.

Študija primera

5 min read

Študija primera: poročilo o zmogljivosti spletnega mesta ATKDA - WordPress vs primeCRM

Primerjalni test 15 ujemajočih se strani je pokazal, da je novo spletno mesto ATKDA na primeCRM v povprečju dostavilo HTML 9,3-krat hitreje kot prejšnje spletno mesto na WordPressu, pri čemer je bila strežniška obdelava 10,6-krat hitrejša.

26 Jun 2026

Preberite več

Organizacije, ki uporabljajo AI za zmanjšanje delovne sile, naredijo kratkoročni dogovor z dolgoročnimi posledicami. Tiste, ki ohranijo svoje ekipe in nalagajo v to, kako te ekipe delajo z AI, gradijo nekaj bolj trajnega.

AI inovacije

5 min read

Podjetja, ki zmanjšujejo delovno silo za umetno inteligenco, bodo izgubila tistim, ki tega niso storila

Organizacije, ki uporabljajo AI za zmanjšanje delovne sile, naredijo kratkoročni dogovor z dolgoročnimi posledicami. Tiste, ki ohranijo svoje ekipe in nalagajo v to, kako te ekipe delajo z AI, gradijo nekaj bolj trajnega.

21 May 2026

Preberite več