AI ja MySQL andmebaasid

AI ja MySQL andmebaasid...

16 May 2025

5 min lugemist

Märkimisväärne viga on see, et paljud AI poolt loodud andmebaasiskeem eelistavad praegu VARCHAR(36) kasutamist id veeru jaoks.

See on tavaliselt motiveeritud soovist vältida volitamata juurdepääsu pahatahtlike tegijate poolt. Selle saavutamiseks kasutatakse sageli UUID-sid (Universally Unique Identifiers) turvameetmena.

Võtame näiteks WordPressi — see tavaliselt paljastab postituse ID-d URL-is kui ?p=45. Võrreldes SEO-sõbraliku vorminguga nagu /2025/05/sample-post, võimaldab see numbriline ID kasutajatel potentsiaalselt ära arvata ja pääseda ligi külgnevale sisule numbri muutmisega (nt ?p=44). UUID-d teisest küljest ei ole järjestikusud ja on palju raskemini äraarvatavad.

UUID-d on 36-märgilised stringid, mis järgivad standardset vormigu viie kriipsuga eraldatud sektsiooniga: 8-4-4-4-12. Iga sektsioon koosneb kuueteistkümnendväärtustest:

550e8400-e29b-41d4-a716-446655440000
f47ac10b-58cc-4372-a567-0e02b2c3d479
123e4567-e89b-12d3-a456-426614174000

Lihtne regex UUID-de valideerimiseks näeb välja selline:

^[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}$

Kuigi UUID-d pakuvad turvalisust ja kaasaskantavust, tulevad need kompromissidega. Need on märgatavalt suuremad kui täisarvud, mis võib aeglustada andmebaasi jõudlust — eriti kui neid kasutatakse peamiste võtmetena relatsionaalsetes andmebaasides. Indekseerimine, mälukasutus ja päringu kiirus kannatavad kõik UUID-de suuruse ja mittejärjestikuse loomuse tõttu.

AI vestlus ID-strateegia kohta

Selle disainivaliku peale uudishimulik, esitasin GitHub Copilot'le järgmise küsimuse:

Mina:
Miks valisite id veeru määratlemise VARCHAR(36) PRIMARY KEY kui andmebaasi struktuuris?

GitHub Copilot:

Valisin VARCHAR(36) ID veergudele mitme konkreetse põhjuse tõttu:

UUID salvestamine: 36-märgiline pikkus mahutab UUID väärtused, mis järgivad standardiseeritud vormigu.

Mitmekliendisüsteemid: UUID-d aitavad isoleerida kliente, kõrvaldades järjestikuseid ID lekkeid, lihtsustades migratsioone ja parandades turvalisust.

Andmete kaasaskantavus: UUID-d tagavad, et eksporditud andmed ei koge ID kokkupõrkeid teise süsteemi importimisel.

Kompromissid:

Suurem salvestusmaht (36 baiti vs. 4 baiti INT jaoks)

Aeglasem indekseerimise ja päringu jõudlus

Suurem mälukasutus

Kaaluda olevad alternatiivid:

AUTO_INCREMENT INT/BIGINT

BINARY(16) tõhusamaks toore UUID baitide salvestamiseks

Kohandatud ID genereerimise strateegia

Andke teada, kui eelistate teistsugust lähenemist.

Mina:
Kasutage BIGINT UNSIGNED jõudluse jaoks, kuid hoidke guid väli igas kirjes väliste viidete jaoks.

GitHub Copilot:

Uuendan skeemi kasutamaks BIGINT UNSIGNED peamise võtmena, lisades guid veeru väliste viidete jaoks. See hübriidne lähenemine ühendab mõlema strateegia parima:

Jõudlus: Tõhus indekseerimine ja liitmised numbriliste peamiste võtmete kaudu

Turvalisus ja kaasaskantavus: GUID-d paljastatud API-des, hoides sisemised ID-d turvalisena loendamise eest

Kokkuvõte:

BIGINT UNSIGNED: Kiire, kompaktne, järjestikune

GUID (VARCHAR): Unikaalne, kaasaskantav, väliselt turvaline

NoSQL andmebaasid ja MongoDB ObjectIds

Kuigi relatsionaalsed andmebaasid pakuvad paindlikkust UUID-de, täisarvude või hübriidide vahel valides, võtavad NoSQL süsteemid nagu MongoDB teistsuguse tee.

MongoDB kasutab sisseehitatud tüüpi nimega ObjectId oma _id välja jaoks. See on 12-baidine binaarvaartus, mis kodeerib:

4 baiti – Ajatempel (sekundid epohhi ajast)
5 baiti – Juhuslik väärtus (sageli masina + protsessi ID põhjal)
3 baiti – Suurenev loendur

Näide:

507f1f77bcf86cd799439011

Miks MongoDB valib ObjectId

Globaalselt unikaalne ilma koordinatsioonita
Sarnaselt UUID-dele ei nõua ObjectIds keskset autoriteeti unikaalsuse tagamiseks, muutes need ideaalseks hajutatud keskkondades.
Ajas järjestatud
Sisseehitatud ajatempel tähendab, et dokumendid on vaikimisi kronoloogiliselt järjestatud, mis võib aidata jõudlust ajaseeria rakendustes.
Kompaktne ja tõhus
Binaarformaadis salvestatud ObjectIds võtavad ainult 12 baiti — palju vähem kui UUID VARCHAR(36). Need on ka indekseerimissõbralikumad.

ID strateegiate võrdlus

Omadus	UUID (VARCHAR)	BIGINT + GUID Hübriid	MongoDB ObjectId
Salvestusmaht	36 baiti	8 + 36 baiti	12 baiti
Indekseerimise jõudlus	Halb	Suurepärane	Suurepärane
Järjestikune / ajaline järjekord	Ei	Jah (ainult BIGINT)	Jah (ajatempli kaudu)
Loetav formaat	Jah	Jah (GUID)	Ei (hex-põhine)
Äraarvatav	Ei	Ei (ainult GUID)	Ei
Skeemi jõustamine	Range	Range	Paindlik

AI eelistused NoSQL kontekstides

Paljud AI poolt genereeritud süsteemid vaikimisi kasutavad MongoDB-taolisi NoSQL konfiguratsioone, kui:

Oodatakse kõrget kirjutamise läbilaskevõimet või sharding'ut
Skeemid peavad olema paindlikud või pool-struktureeritud
Andmete kaasaskantavus ja hajutatud skaleerimine on prioriteedid

Sellistel juhtudel on ObjectIds või sarnaste unikaalsete, ajas järjestatavate identifikaatorite kasutamine sageli mõistlik vaikimisi valik.

PrimeCRM

Tagasi Teadmiste Keskusesse

Kas olete valmis?

Valmis muutma oma ideid reaalsuseks?

Liitu edukate organisatsioonidega, kes kasutavad Libertas Software Researchi võimsate tarkvaralahenduste ehitamiseks ja kujundamiseks oma vajaduste rahuldamiseks.

Võta ühendust

Kliendid

Usaldatud eri toodetes, meeskondades ja organisatsioonides

Valik organisatsioone ja platvorme, kellele me lahendusi ehitame, keda toetame või kellega koos projekte ellu viime.

Uusimad Teadmiste Keskuse Artiklid

15 vastava lehe võrdlus näitas, et uus ATKDA veebisait primeCRM-il edastas HTML-i keskmiselt 9,3 korda kiiremini kui eelmine WordPressi sait ning serveritöötlus oli 10,6 korda kiirem.

Juhtumiuuring

5 min read

Juhtumiuuring: ATKDA veebisaidi jõudluse aruanne - WordPress vs primeCRM

15 vastava lehe võrdlus näitas, et uus ATKDA veebisait primeCRM-il edastas HTML-i keskmiselt 9,3 korda kiiremini kui eelmine WordPressi sait ning serveritöötlus oli 10,6 korda kiirem.

26 Jun 2026

Loe rohkem

Organisatsioonid, kes kasutavad AI personali vähendamiseks, teevad lühiajalised kompromissid pikaajaliste tagajärgedega. Need, kes hoiavad oma meeskondade koos ja investeerivad sellesse, kuidas need meeskonnad AI-ga töötavad, ehitavad midagi vastupidavamats.

AI innovatsioon

5 min read

Ettevõtted, kes vähendavad personali AI jaoks, kaotavad neile, kes seda ei tee

Organisatsioonid, kes kasutavad AI personali vähendamiseks, teevad lühiajalised kompromissid pikaajaliste tagajärgedega. Need, kes hoiavad oma meeskondade koos ja investeerivad sellesse, kuidas need meeskonnad AI-ga töötavad, ehitavad midagi vastupidavamats.

21 May 2026

Loe rohkem