Problema:
Os Modelos de Linguagem de Grande Escala (LLMs) frequentemente carecem de representatividade e precisão para línguas e dialetos menos comuns, como muitos encontrados no Brasil. Essa limitação não só prejudica a qualidade da interação e da informação, mas também negligencia a rica diversidade cultural e linguística do país.
Mudança Proposta:
Facilitar o desenvolvimento de LLMs que incorporam as línguas brasileiras pode melhorar significativamente a acessibilidade e a relevância dessas tecnologias para a população do Brasil. Ao mesmo tempo, é fundamental implementar diretrizes que garantam o respeito à cultura local, à diversidade linguística e à propriedade intelectual. Essa abordagem não apenas promoverá a inclusão digital, mas também protegerá e valorizará o patrimônio cultural do país.
O ótimo é inimigo do bom. Tem que começar de algum jeito. Se começarem a criar esse tipo de dificuldade (com temas irrelevantes) o negócio nunca vai funcionar.
É evidente a necessidade de modelos que incorporem as línguas brasileiras e seus aspectos culturais. No entanto, transformar essa necessidade em uma realidade prática exige investimentos significativos para a criação desses modelos. O principal desafio está nos recursos financeiros e computacionais, que provavelmente não estarão disponíveis em larga escala.
Uma alternativa viável seria exigir que os grandes modelos internacionais, que inevitavelmente terão amplo uso global, incluam um percentual de línguas nacionais e conteúdo específico para capturar o estilo e as características culturais do Brasil como condição para comercialização no país. Essa abordagem poderia garantir que os modelos sejam mais representativos e úteis para a população brasileira, sem sobrecarregar os recursos locais.