E aí, gurizada! Deixa eu te contar uma coisa que me deixou de cara: rodei um modelo de linguagem estilo ChatGPT direto no navegador, sem API e sem servidor. Isso mesmo, tu não leu errado. Eu, Marcelo Cabral, que vivo no meio dessa loucura de IA e engenharia de software, sempre fui calejado com a dependência de APIs pra tudo que é lado. Mas essa experiência me abriu os olhos para um futuro que, até pouco tempo, parecia ficção científica. E o mais legal? A performance foi surpreendente.

Por Que Eu Fui Fuçar Nisso?

Desde que comecei a mergulhar de cabeça no mundo da Inteligência Artificial, sempre me incomodou a "caixa preta" que muitas vezes se torna a interação com modelos. A gente manda os dados pra lá, espera, e recebe a resposta. É prático, sim, mas e a privacidade? E a latência? E o custo, que vira uma bola de neve rapidinho? Meu lado gaúcho, que sempre busca a eficiência e a autonomia, me cutucava. Eu queria ver se era possível trazer essa inteligência para mais perto do usuário, para dentro do próprio dispositivo dele.

Foi aí que topei com a ideia de Edge AI – a IA na ponta, no limite da rede, onde a mágica acontece sem a necessidade de um servidor intermediário. E pensei: "Bah, se eu conseguir rodar um LLM (Large Language Model) direto no browser, a gente quebra um monte de paradigmas". E fui lá, botei a mão na massa e o resultado tá aí pra quem quiser ver, assista no YouTube.