Modelo desenvolvido na Alemanha aposta em processamento nativo para reduzir custos computacionais e ampliar acesso à inteligência artificial em língua portuguesa
Pesquisadores da Universidade de Bonn, na Alemanha, apresentaram o Tucano 2, um modelo de inteligência artificial que “pensa” em português desde sua origem. A proposta do projeto é reduzir desigualdades no acesso à tecnologia e aumentar a eficiência no processamento de linguagem natural para mais de 260 milhões de falantes do idioma.
📲Quer receber notícias direto no celular? Entre no nosso grupo no WhatsApp.
O Tucano 2 integra a iniciativa Polyglot, financiada pelo governo alemão, que busca desenvolver soluções de IA voltadas para idiomas menos privilegiados no cenário global. Tradicionalmente, modelos avançados são treinados principalmente em inglês ou chinês, o que limita a qualidade das respostas em outras línguas e amplia a dependência tecnológica.
IA em português melhora eficiência e reduz custos
Um dos principais diferenciais do Tucano 2 é o fato de realizar todo o seu raciocínio diretamente em português. Em modelos tradicionais, o processamento costuma ocorrer em outro idioma e depois é traduzido para o usuário final, o que aumenta o número de etapas e o custo computacional.
Segundo os pesquisadores, trabalhar com tokens — pequenos fragmentos de palavras usados pelos sistemas de IA — diretamente em português permite uma economia significativa. Em alguns testes, o Tucano 2 utilizou até 30% menos tokens para executar tarefas semelhantes.
Essa redução impacta diretamente o consumo de energia e o tempo de processamento, dois fatores críticos em um setor que enfrenta crescente pressão ambiental e operacional. Quanto menos tokens, menor o custo e maior a velocidade de resposta.
Além disso, o modelo tende a oferecer respostas mais adequadas ao contexto cultural e linguístico dos usuários, compreendendo melhor expressões idiomáticas e variações regionais do português.
Base de dados robusta e foco em qualidade
O Tucano 2 foi treinado com o GigaVerbo, considerado o maior banco de dados em língua portuguesa voltado para inteligência artificial. Esse conjunto reúne conteúdos produzidos por humanos e materiais sintéticos gerados por IA, passando por curadoria para avaliar qualidade educacional e níveis de toxicidade.
O projeto ainda está em fase experimental e não possui interface comercial robusta. Atualmente, a plataforma apresenta limitações como ausência de conexão automática com a internet e restrições de uso. Ainda assim, o modelo já demonstra potencial relevante para aplicações acadêmicas e corporativas.
Código aberto amplia acesso e inovação
Um dos pontos centrais do Tucano 2 é seu caráter de código aberto. Todo o conjunto — incluindo modelo, dados e ferramentas — está disponível para reprodução por empresas, universidades e instituições interessadas.
A proposta é permitir que diferentes países e organizações desenvolvam suas próprias soluções em português, sem depender exclusivamente de grandes empresas de tecnologia.
Essa abordagem também busca democratizar o acesso à inteligência artificial e incentivar o desenvolvimento de aplicações mais alinhadas às realidades locais.
Projeto mira expansão para outros idiomas
Além do português, a equipe responsável pelo Tucano 2 já trabalha na criação de bases de dados para outros idiomas considerados sub-representados, como bengali e hindi.
A iniciativa reforça a tendência de descentralização da inteligência artificial, promovendo diversidade linguística e cultural no desenvolvimento tecnológico global.
Com isso, o Tucano 2 se posiciona como um passo importante para tornar a IA mais inclusiva, eficiente e acessível a diferentes comunidades ao redor do mundo.
Leia mais:
Maioria dos serviços digitais no Brasil não verifica idade de usuários no cadastro
Inovação industrial no Brasil registra terceira queda consecutiva
Lideranças adotam IA como parte do time enquanto colaboradores temem substituição
Siga nosso perfil no Instagram, Tiktok e curta nossa página no Facebook

