ИИ и MySQL бази данни

ИИ и MySQL бази данни...

16 May 2025

5 мин четене

Забележима грешка е, че много AI генерирани схеми на бази данни в момента са склонни да използват VARCHAR(36) за колоната id.

Това обикновено е мотивирано от желание да се предотврати неоторизиран достъп от злонамерени участници. За да постигнат това, UUID (Universally Unique Identifiers) често се използват като мярка за сигурност.

Да вземем WordPress като пример — типично експонира ID-та на постовете в URL като ?p=45. В сравнение с SEO-дружелюбен формат като /2025/05/sample-post, този числов ID позволява на потребителите потенциално да отгатват и да получават достъп до съседно съдържание чрез промяна на числото (напр. ?p=44). UUID от друга страна не са последователни и са много по-трудни за отгатване.

UUID са 36-символни низове, които следват стандартен формат с пет секции разделени с тирета: 8-4-4-4-12. Всяка секция се състои от шестнадесетични стойности:

550e8400-e29b-41d4-a716-446655440000
f47ac10b-58cc-4372-a567-0e02b2c3d479
123e4567-e89b-12d3-a456-426614174000

Просто регулярно израз за валидиране на UUID изглежда така:

^[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}$

Въпреки че UUID предлагат сигурност и преносимост, те идват с компромиси. Те са значително по-големи от цели числа, което може да забави производителността на базата данни — особено когато се използват като първични ключове в релационни бази данни. Индексирането, използването на памет и скоростта на заявките — всички страдат поради размера и непоследователната природа на UUID.

AI разговор за стратегия за ID

Заинтересован от този избор на дизайн, попитах GitHub Copilot следния въпрос:

Аз:
Защо избрахте да дефинирате колоната id като VARCHAR(36) PRIMARY KEY в структурата на базата данни?

GitHub Copilot:

Избрах VARCHAR(36) за колоните ID по няколко специфични причини:

UUID съхранение: 36-символната дължина побира UUID стойности, които следват стандартизиран формат.

Мултитенантни системи: UUID помагат за изолиране на наемателите чрез елиминиране на последователни ID утечки, опростяване на миграциите и подобряване на сигурността.

Преносимост на данни: UUID гарантират, че експортираните данни няма да претърпят ID колизии при импортиране в друга система.

Компромиси:

По-голям размер на съхранение (36 байта срещу 4 байта за INT)

По-бавна производителност на индексиране и заявки

По-голямо използване на памет

Алтернативи за разглеждане:

AUTO_INCREMENT INT/BIGINT

BINARY(16) за по-ефективно съхранение на сурови UUID байтове

Персонализирана стратегия за генериране на ID

Уведомете ме ако предпочитате различен подход.

Аз:
Използвайте BIGINT UNSIGNED за производителност, но запазете поле guid във всеки запис за външни препратки.

GitHub Copilot:

Ще обновя схемата да използва BIGINT UNSIGNED като първичен ключ, като добавя колона guid за външни препратки. Този хибриден подход комбинира най-доброто от двете стратегии:

Производителност: Ефективно индексиране и свързвания чрез числови първични ключове

Сигурност и преносимост: GUID експонирани в API, запазвайки вътрешните ID безопасни от изброяване

Резюме:

BIGINT UNSIGNED: Бърз, компактен, последователен

GUID (VARCHAR): Уникален, преносим, външно безопасен

NoSQL бази данни и MongoDB ObjectIds

Докато релационните бази данни предлагат гъвкавост в избора между UUID, цели числа или хибриди, NoSQL системите като MongoDB вземат различен път.

MongoDB използва вграден тип наречен ObjectId за своето поле _id. Това е 12-байтова двоична стойност, която кодира:

4 байта – Времева марка (секунди от епохата)
5 байта – Случайна стойност (често базирана на машина + ID на процес)
3 байта – Инкрементален брояч

Пример:

507f1f77bcf86cd799439011

Защо MongoDB избира ObjectId

Глобално уникален без координация
Подобно на UUID, ObjectIds не изискват централен орган за гарантиране на уникалност, правейки ги идеални за разпределени среди.
Подреден по време
Вградената времева марка означава, че документите са подредени хронологично по подразбиране, което може да помогне с производителността в приложения за времеви серии.
Компактен и ефективен
Съхранявани в двоичен формат, ObjectIds заемат само 12 байта — много по-малко от UUID VARCHAR(36). Те също са по-дружелюбни към индексирането.

Сравнение на стратегии за ID

Характеристика	UUID (VARCHAR)	BIGINT + GUID Хибрид	MongoDB ObjectId
Размер на съхранение	36 байта	8 + 36 байта	12 байта
Производителност на индексиране	Лоша	Отлична	Отлична
Последователен / времеви ред	Не	Да (само BIGINT)	Да (чрез времева марка)
Четим формат	Да	Да (GUID)	Не (базиран на hex)
Отгатваемост	Не	Не (само GUID)	Не
Принуждаване на схема	Строго	Строго	Гъвкаво

AI предпочитания в NoSQL контексти

Много AI генерирани системи по подразбиране използват NoSQL конфигурации подобни на MongoDB когато:

Се очаква висока пропускателна способност за запис или шардиране
Схемите трябва да бъдат гъвкави или полуструктурирани
Преносимостта на данните и разпределеното мащабиране са приоритети

В такива случаи използването на ObjectIds или подобни уникални, подреждаеми по време идентификатори често е разумен избор по подразбиране.

PrimeCRM

Назад към Центъра за Знания

Готови ли сте?

Готови да трансформирате идеите си в реалност?

Присъединете се към успешните организации, които използват Libertas Software Research за изграждане и проектиране на мощни софтуерни решения, които отговарят на техните нужди.

Свържете се

Клиенти

Доверени партньори в различни продукти, екипи и организации

Подбрани организации и платформи, за които създаваме решения, които поддържаме или с които работим съвместно.

Най-нови Статии от Центъра за Знания

Сравнение на 15 съответстващи страници показа, че новият сайт на ATKDA върху primeCRM доставя HTML средно 9,3 пъти по-бързо от предишния WordPress сайт, а сървърната обработка е 10,6 пъти по-бърза.

Казус

5 min read

Казус: доклад за производителността на сайта ATKDA - WordPress срещу primeCRM

Сравнение на 15 съответстващи страници показа, че новият сайт на ATKDA върху primeCRM доставя HTML средно 9,3 пъти по-бързо от предишния WordPress сайт, а сървърната обработка е 10,6 пъти по-бърза.

26 Jun 2026

Прочетете повече

Организациите, които използват ИИ за намаляване на персонала, правят краткосрочни компромиси с дълготрайни последици. Тези, които держат своите екипи заедно и инвестират в начина, по който те работят с ИИ, строят нещо по-издръжливо.

AI иновации

5 min read

Компаниите, които намаляват персонала за ИИ, ще загубят пред тези, които не го правят

Организациите, които използват ИИ за намаляване на персонала, правят краткосрочни компромиси с дълготрайни последици. Тези, които держат своите екипи заедно и инвестират в начина, по който те работят с ИИ, строят нещо по-издръжливо.

21 May 2026

Прочетете повече

Една година след учредяването си Libertas Software Research премина от празна страница към реални клиенти, реални продукти и работа, която си струва да бъде отбелязана.

Разработка на Продукти

3 min read

Една година на Libertas Software Research

Една година след учредяването си Libertas Software Research премина от празна страница към реални клиенти, реални продукти и работа, която си струва да бъде отбелязана.

17 May 2026

Прочетете повече

Виж Всички Статии от Центъра за Знания

Бюлетин

Свържете се в LinkedIn

ИИ и MySQL бази данни

AI разговор за стратегия за ID

NoSQL бази данни и MongoDB ObjectIds

Защо MongoDB избира ObjectId

Сравнение на стратегии за ID

AI предпочитания в NoSQL контексти

Готови да трансформирате идеите си в реалност?

Доверени партньори в различни продукти, екипи и организации

Абонирайте се за нашия бюлетин