IA e bancos de dados MySQL

IA e bancos de dados MySQL...

16 May 2025

5 min de leitura

Um erro notável é que muitos esquemas de banco de dados gerados por IA atualmente favorecem o uso de VARCHAR(36) para a coluna id.

Isso é tipicamente motivado por um desejo de prevenir acesso não autorizado por atores maliciosos. Para conseguir isso, UUIDs (Identificadores Universalmente Únicos) são frequentemente empregados como uma medida de segurança.

Vamos usar o WordPress como exemplo — tipicamente expõe IDs de posts na URL como ?p=45. Comparado com um formato amigável para SEO como /2025/05/sample-post, este ID numérico permite aos usuários potencialmente adivinhar e acessar conteúdo adjacente alterando o número (por exemplo, ?p=44). UUIDs, por outro lado, não são sequenciais e são muito mais difíceis de adivinhar.

UUIDs são strings de 36 caracteres que seguem um formato padrão com cinco seções separadas por hífens: 8-4-4-4-12. Cada seção é composta por valores hexadecimais:

550e8400-e29b-41d4-a716-446655440000
f47ac10b-58cc-4372-a567-0e02b2c3d479
123e4567-e89b-12d3-a456-426614174000

Uma regex simples para validar UUIDs se parece com isso:

^[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}$

Enquanto UUIDs oferecem segurança e portabilidade, eles vêm com compromissos. Eles são significativamente maiores que inteiros, o que pode tornar o desempenho do banco de dados mais lento — especialmente quando usados como chaves primárias em bancos de dados relacionais. Indexação, uso de memória e velocidade de consulta todas sofrem devido ao tamanho e natureza não sequencial dos UUIDs.

Uma conversa com IA sobre estratégia de ID

Curioso sobre essa escolha de design, fiz a seguinte pergunta ao GitHub Copilot:

Eu:
Por que você escolheu definir a coluna id como VARCHAR(36) PRIMARY KEY na estrutura do banco de dados?

GitHub Copilot:

Escolhi VARCHAR(36) para colunas ID por algumas razões específicas:

Armazenamento UUID: O comprimento de 36 caracteres acomoda valores UUID, que seguem um formato padronizado.

Sistemas Multi-Inquilino: UUIDs ajudam a isolar inquilinos eliminando vazamentos de ID sequencial, simplificando migrações e melhorando a segurança.

Portabilidade de Dados: UUIDs garantem que dados exportados não sofram colisões de ID durante importação para outro sistema.

Compromissos:

Maior tamanho de armazenamento (36 bytes vs. 4 bytes para INT)

Desempenho de indexação e consulta mais lento

Maior uso de memória

Alternativas a considerar:

AUTO_INCREMENT INT/BIGINT

BINARY(16) para armazenar bytes UUID brutos mais eficientemente

Uma estratégia de geração de ID personalizada

Me avise se você prefere uma abordagem diferente.

Eu:
Use BIGINT UNSIGNED para desempenho, mas mantenha um campo guid em cada registro para referências externas.

GitHub Copilot:

Atualizarei o esquema para usar BIGINT UNSIGNED como chave primária enquanto adiciono uma coluna guid para referências externas. Esta abordagem híbrida combina o melhor de ambas as estratégias:

Desempenho: Indexação e junções eficientes através de chaves primárias numéricas

Segurança e Portabilidade: GUIDs expostos nas APIs, mantendo IDs internos seguros contra enumeração

Resumo:

BIGINT UNSIGNED: Rápido, compacto, sequencial

GUID (VARCHAR): Único, portável, externamente seguro

Bancos de dados NoSQL e ObjectIds do MongoDB

Enquanto bancos de dados relacionais oferecem flexibilidade na escolha entre UUIDs, inteiros ou híbridos, sistemas NoSQL como MongoDB tomam um caminho diferente.

MongoDB usa um tipo embutido chamado ObjectId para seu campo _id. Este é um valor binário de 12 bytes que codifica:

4 bytes – Timestamp (segundos desde a época)
5 bytes – Valor aleatório (frequentemente baseado em máquina + ID do processo)
3 bytes – Contador incremental

Exemplo:

507f1f77bcf86cd799439011

Por que o MongoDB escolhe ObjectId

Globalmente único sem coordenação
Semelhante aos UUIDs, ObjectIds não requerem uma autoridade central para garantir unicidade, tornando-os ideais para ambientes distribuídos.
Ordenado por tempo
O timestamp embutido significa que documentos são ordenados cronologicamente por padrão, o que pode ajudar com desempenho em aplicações de série temporal.
Compacto e eficiente
Armazenados em binário, ObjectIds ocupam apenas 12 bytes — muito menores que um UUID VARCHAR(36). Eles também são mais amigáveis para indexação.

Comparação de estratégias de ID

Característica	UUID (VARCHAR)	BIGINT + GUID Híbrido	MongoDB ObjectId
Tamanho de armazenamento	36 bytes	8 + 36 bytes	12 bytes
Desempenho de indexação	Ruim	Excelente	Excelente
Ordem sequencial / temporal	Não	Sim (BIGINT apenas)	Sim (via timestamp)
Formato legível	Sim	Sim (GUID)	Não (baseado em hex)
Adivinhável	Não	Não (GUID apenas)	Não
Aplicação de esquema	Rígida	Rígida	Flexível

Preferências de IA em contextos NoSQL

Muitos sistemas gerados por IA padronizam configurações NoSQL semelhantes ao MongoDB quando:

Alto throughput de escrita ou sharding é esperado
Esquemas precisam ser flexíveis ou semi-estruturados
Portabilidade de dados e scaling distribuído são prioridades

Nesses casos, usar ObjectIds ou identificadores únicos similares, ordenáveis por tempo, é frequentemente um padrão sensato.

PrimeCRM

Voltar ao Centro de Conhecimento

Está pronto?

Pronto para transformar as suas ideias em realidade?

Junte-se às organizações bem-sucedidas que usam a Libertas Software Research para construir e projetar soluções de software poderosas para atender às suas necessidades.

Entre em contacto

Clientes

Com confiança em produtos, equipas e organizações

Uma seleção de organizações e plataformas para as quais desenvolvemos soluções, que apoiamos ou com as quais entregamos projetos.

Últimos Artigos do Centro de Conhecimento

Um benchmark de 15 páginas equivalentes concluiu que o novo site ATKDA em primeCRM entregava HTML, em média, 9,3 vezes mais rápido do que o anterior site WordPress, com um processamento no servidor 10,6 vezes mais rápido.

Estudo de caso

5 min read

Estudo de caso: relatório de desempenho do website ATKDA - WordPress vs primeCRM

Um benchmark de 15 páginas equivalentes concluiu que o novo site ATKDA em primeCRM entregava HTML, em média, 9,3 vezes mais rápido do que o anterior site WordPress, com um processamento no servidor 10,6 vezes mais rápido.

26 Jun 2026

Ler mais

Organizações que usam IA para reduzir pessoal estão fazendo uma negociação de curto prazo com consequências de longo prazo. As que mantêm suas equipes unidas e investem em como essas equipes operam com IA estão construindo algo mais durável.

Inovação IA

5 min read

As Empresas que Cortam Pessoal para IA Vão Perder para as que Não Cortaram

Organizações que usam IA para reduzir pessoal estão fazendo uma negociação de curto prazo com consequências de longo prazo. As que mantêm suas equipes unidas e investem em como essas equipes operam com IA estão construindo algo mais durável.

21 May 2026

Ler mais

Um ano após a constituição, a Libertas Software Research passou de uma página em branco para clientes reais, produtos reais e trabalho que vale a pena assinalar.

Desenvolvimento de Produtos

3 min read

Um ano de Libertas Software Research

Um ano após a constituição, a Libertas Software Research passou de uma página em branco para clientes reais, produtos reais e trabalho que vale a pena assinalar.

17 May 2026

Ler mais

Ver Todos os Artigos do Centro de Conhecimento

Newsletter

Conecte-se no LinkedIn

IA e bancos de dados MySQL

Uma conversa com IA sobre estratégia de ID

Bancos de dados NoSQL e ObjectIds do MongoDB

Por que o MongoDB escolhe ObjectId

Comparação de estratégias de ID

Preferências de IA em contextos NoSQL

Pronto para transformar as suas ideias em realidade?

Com confiança em produtos, equipas e organizações

Subscreva a nossa newsletter