Com mais de 11 anos de estrada no desenvolvimento de software, a gente aprende a cheirar o hype de longe. Quando o boom das ferramentas de Inteligência Artificial Generativa estourou, o ecossistema vendeu o cenário dos sonhos: *"Baixe o Ollama, escolha o LLM do momento (DeepSeek, Qwen, Gemma, Llama), plugue no seu Cursor ou Claude Code e tenha um Engenheiro Sênior autônomo trabalhando de graça e localmente na sua máquina.

Privacidade total, custo zero de tokens, sem dados vazando para Big Techs. Lindo no papel.

Mas quando você decide tirar a IA do playground e a coloca para trabalhar em uma esteira de produção real — lidando com arquiteturas distribuídas, microsserviços em Java 21, ecossistemas com Kafka e AWS — a física do hardware e a engenharia de software cobram a conta.

Se você está pensando em migrar sua esteira de desenvolvimento inteiramente para o modelo open-source local, aqui estão os três gargalos estruturais cruciais que você vai enfrentar (e como a arquitetura está mudando para resolvê-los).

1. O Abismo da Infraestrutura Física: O Gargalo da Memória