AI e database MySQL

AI e database MySQL...

16 May 2025

5 min di lettura

Un errore notevole è che molti schemi di database generati da IA attualmente favoriscono l'uso di VARCHAR(36) per la colonna id.

Questo è tipicamente motivato da un desiderio di prevenire accesso non autorizzato da attori malintenzionati. Per ottenere questo, gli UUID (Identificatori Universalmente Unici) sono spesso impiegati come misura di sicurezza.

Prendiamo WordPress come esempio — tipicamente espone ID di post nell'URL come ?p=45. Confrontato con un formato SEO-friendly come /2025/05/sample-post, questo ID numerico permette agli utenti di potenzialmente indovinare e accedere a contenuto adiacente alterando il numero (es., ?p=44). Gli UUID, d'altra parte, non sono sequenziali e sono molto più difficili da indovinare.

Gli UUID sono stringhe di 36 caratteri che seguono un formato standard con cinque sezioni separate da trattini: 8-4-4-4-12. Ogni sezione è composta da valori esadecimali:

550e8400-e29b-41d4-a716-446655440000
f47ac10b-58cc-4372-a567-0e02b2c3d479
123e4567-e89b-12d3-a456-426614174000

Una semplice regex per validare UUID appare così:

^[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}$

Mentre gli UUID offrono sicurezza e portabilità, vengono con compromessi. Sono significativamente più grandi degli interi, il che può rallentare le prestazioni del database — specialmente quando usati come chiavi primarie nei database relazionali. Indicizzazione, uso della memoria e velocità delle query soffrono tutte a causa delle dimensioni e della natura non sequenziale degli UUID.

Una conversazione IA sulla strategia ID

Curioso di questa scelta di design, ho chiesto a GitHub Copilot la seguente domanda:

Io:
Perché hai scelto di definire la colonna id come VARCHAR(36) PRIMARY KEY nella struttura del database?

GitHub Copilot:

Ho scelto VARCHAR(36) per le colonne ID per alcune ragioni specifiche:

Storage UUID: La lunghezza di 36 caratteri si adatta ai valori UUID, che seguono un formato standardizzato.

Sistemi Multi-Tenant: Gli UUID aiutano a isolare i tenant eliminando perdite di ID sequenziali, semplificando le migrazioni e migliorando la sicurezza.

Portabilità dei Dati: Gli UUID assicurano che i dati esportati non soffrano di collisioni di ID durante l'importazione in un altro sistema.

Compromessi:

Dimensione di storage maggiore (36 bytes vs. 4 bytes per INT)

Prestazioni di indicizzazione e query più lente

Maggiore uso della memoria

Alternative da considerare:

AUTO_INCREMENT INT/BIGINT

BINARY(16) per memorizzare bytes UUID grezzi più efficientemente

Una strategia di generazione ID personalizzata

Fammi sapere se preferisci un approccio diverso.

Io:
Usa BIGINT UNSIGNED per le prestazioni, ma mantieni un campo guid in ogni record per riferimenti esterni.

GitHub Copilot:

Aggiornerò lo schema per usare BIGINT UNSIGNED come chiave primaria aggiungendo una colonna guid per riferimenti esterni. Questo approccio ibrido combina il meglio di entrambe le strategie:

Prestazioni: Indicizzazione e join efficienti tramite chiavi primarie numeriche

Sicurezza e Portabilità: GUID esposti nelle API, rendendo gli ID interni sicuri dall'enumerazione

Riassunto:

BIGINT UNSIGNED: Veloce, compatto, sequenziale

GUID (VARCHAR): Unico, portabile, esternamente sicuro

Database NoSQL e ObjectIds MongoDB

Mentre i database relazionali offrono flessibilità nella scelta tra UUID, interi o ibridi, i sistemi NoSQL come MongoDB prendono un percorso diverso.

MongoDB usa un tipo incorporato chiamato ObjectId per il suo campo _id. Questo è un valore binario di 12 byte che codifica:

4 byte – Timestamp (secondi dall'epoca)
5 byte – Valore casuale (spesso basato su macchina + ID processo)
3 byte – Contatore incrementale

Esempio:

507f1f77bcf86cd799439011

Perché MongoDB sceglie ObjectId

Globalmente unico senza coordinazione
Simile agli UUID, gli ObjectIds non richiedono un'autorità centrale per assicurare unicità, rendendoli ideali per ambienti distribuiti.
Ordinato per tempo
Il timestamp incorporato significa che i documenti sono ordinati cronologicamente per default, il che può aiutare con le prestazioni nelle applicazioni time-series.
Compatto ed efficiente
Memorizzati in binario, gli ObjectIds occupano solo 12 byte — molto più piccoli di un UUID VARCHAR(36). Sono anche più friendly per l'indicizzazione.

Confronto delle strategie ID

Caratteristica	UUID (VARCHAR)	BIGINT + GUID Ibrido	MongoDB ObjectId
Dimensione di storage	36 byte	8 + 36 byte	12 byte
Prestazioni di indicizzazione	Scarse	Eccellenti	Eccellenti
Ordine sequenziale / temporale	No	Sì (solo BIGINT)	Sì (via timestamp)
Formato leggibile	Sì	Sì (GUID)	No (basato su hex)
Indovinabile	No	No (solo GUID)	No
Applicazione dello schema	Rigorosa	Rigorosa	Flessibile

Preferenze IA nei contesti NoSQL

Molti sistemi generati da IA utilizzano per default configurazioni NoSQL simili a MongoDB quando:

È previsto un alto throughput di scrittura o sharding
Gli schemi devono essere flessibili o semi-strutturati
La portabilità dei dati e il scaling distribuito sono priorità

In questi casi, usare ObjectIds o identificatori unici simili, ordinabili per tempo, è spesso un default sensato.

PrimeCRM

Torna al Centro di Conoscenza

Sei pronto?

Pronto a trasformare le tue idee in realtà?

Unisciti alle organizzazioni di successo che si affidano a Libertas Software Research per sviluppare soluzioni software innovative e su misura.

Contattaci

Clienti

Scelti con fiducia tra prodotti, team e organizzazioni

Una selezione di organizzazioni e piattaforme per cui realizziamo soluzioni, che supportiamo o con cui consegniamo progetti.

Ultimi Articoli del Centro di Conoscenza

Un benchmark su 15 pagine corrispondenti ha rilevato che il nuovo sito ATKDA su primeCRM consegnava l'HTML in media 9,3 volte più velocemente del precedente sito WordPress, con un'elaborazione server 10,6 volte più rapida.

Caso studio

5 min read

Caso di studio: report sulle prestazioni del sito ATKDA - WordPress vs primeCRM

Un benchmark su 15 pagine corrispondenti ha rilevato che il nuovo sito ATKDA su primeCRM consegnava l'HTML in media 9,3 volte più velocemente del precedente sito WordPress, con un'elaborazione server 10,6 volte più rapida.

26 Jun 2026

Le organizzazioni che utilizzano l'IA per ridurre il personale stanno facendo un compromesso a breve termine con conseguenze a lungo termine. Quelle che mantengono i loro team insieme e investono in come questi team operano con l'IA stanno costruendo qualcosa di più duraturo.

Innovazione IA

5 min read

Le Aziende che Riducono i Dipendenti per l'IA Perderanno Contro Quelle che Non lo Fanno

Le organizzazioni che utilizzano l'IA per ridurre il personale stanno facendo un compromesso a breve termine con conseguenze a lungo termine. Quelle che mantengono i loro team insieme e investono in come questi team operano con l'IA stanno costruendo qualcosa di più duraturo.

21 May 2026

A un anno dalla costituzione, Libertas Software Research è passata da una pagina bianca a clienti reali, prodotti reali e un lavoro che vale la pena segnare.

Sviluppo Prodotto

3 min read

Un anno di Libertas Software Research

A un anno dalla costituzione, Libertas Software Research è passata da una pagina bianca a clienti reali, prodotti reali e un lavoro che vale la pena segnare.

17 May 2026

Visualizza Tutti gli Articoli del Centro di Conoscenza

Newsletter

Connettiti su LinkedIn

AI e database MySQL

Una conversazione IA sulla strategia ID

Database NoSQL e ObjectIds MongoDB

Perché MongoDB sceglie ObjectId

Confronto delle strategie ID

Preferenze IA nei contesti NoSQL

Pronto a trasformare le tue idee in realtà?

Scelti con fiducia tra prodotti, team e organizzazioni

Iscriviti alla nostra newsletter