banner
Centro de notícias
Atendimento ao cliente excepcional

IA: são necessários mais dados galeses para melhorar a precisão, dizem empresas

Jul 20, 2023

Os desenvolvedores de tecnologia dizem que é necessária uma melhor cooperação no País de Gales para garantir o funcionamento da inteligência artificial (IA) no País de Gales.

A capacidade do Chatbot ChatGPT de compreender e se comunicar em galês impressionou os pesquisadores, com alguns dizendo que a linguagem era “parte da revolução da IA”.

Mas eles disseram que o material em língua galesa protegido por direitos autorais precisava ser disponibilizado para treinar software de computador.

O governo galês disse que a sua estratégia seria renovada em breve.

Uma empresa que já utiliza inteligência artificial para fornecer serviços bilíngues é a Haia, com sede em Anglesey.

A empresa de eventos online usa software de tradução simultânea para permitir que os palestrantes falem em galês ou inglês com legendas traduzidas.

Mas seu cofundador, Tom Burke, disse que seu produto poderia ser melhorado se mais dados em língua galesa estivessem legalmente disponíveis.

"Uma das questões que temos é quão preciso é. Se compararmos com o alemão ou o espanhol, o galês é um pequeno conjunto de dados", disse Burke.

"Muitas vezes descobriremos que há imprecisões na tradução ou transcrição e a maneira de melhorar isso é obter acesso à riqueza de dados que está realmente disponível para a língua galesa."

A tecnologia de IA de linguagem funciona com grandes modelos de linguagem computadorizados, que usam grandes quantidades de dados, como páginas da web, livros e artigos, para prever quais palavras e frases combinam.

Os dados em língua galesa também podem incluir programas de rádio e televisão.

“Se conseguirmos obter esses dados e usá-los para treinar modelos, os modelos da língua galesa se tornarão mais precisos”, acrescentou Burke.

“Isso nos dá uma vantagem inicial nessa tecnologia e nos permite olhar para outras línguas de menor uso em todo o mundo, onde podemos usar as lições que aprendemos aqui no País de Gales para impulsionar as tecnologias também nesses mercados.

"No longo prazo, isso permitirá a formação de novas empresas, permitirá novas inovações e o País de Gales poderá tornar-se um centro para tecnologias linguísticas."

Pesquisadores da Canolfan Bedwyr da Universidade de Bangor lançaram o Macsen, um protótipo de chatbot em língua galesa, há oito anos.

Agora eles o executam com ChatGPT, desenvolvido pela OpenAI nos EUA.

Além do potencial económico, o chefe da Unidade de Tecnologias da Linguagem de Canolfan Bedwyr, Gruffudd Prys, disse que o material em língua galesa deveria ser disponibilizado para tornar a tecnologia mais "adequada às necessidades da língua galesa e do País de Gales em geral ".

Ele disse: “Uma das coisas que podemos fazer para melhorar a qualidade da inteligência artificial é permitir que os dados disponíveis estejam disponíveis sob licenças permissivas, para que os modelos reflitam a realidade do País de Gales e não sejam excessivamente americanos ou modelos internacionais."

Tom Burke disse que o acesso aos dados precisava acontecer em breve.

“Já perdemos 12 meses de tempo de inovação e o que vai acontecer é que eventualmente ficaremos para trás e quando pudermos começar a utilizá-lo, o resto do mundo já o terá”, disse ele.

“Temos esta excelente posição, temos este país bilíngue.

"Temos uma universidade fantástica como Bangor trabalhando nesta tecnologia. Precisamos fazer isso agora para que as empresas possam começar a usá-la e chegar lá."

O ministro do governo galês responsável pela língua galesa, Jeremy Miles MS, disse que usar IA para desenvolver a língua galesa era "muito importante".

“Tem sido uma prioridade importante na nossa estratégia Welsh in Technology, que estamos prestes a renovar para o próximo período”, disse Miles.

“Gastamos £ 2 milhões nisso e continua sendo uma prioridade muito importante para nossa próxima estratégia, então poderemos levar todas essas questões em consideração.

"É muito importante, com o desenvolvimento tecnológico, que os disponibilizemos em galês e também em outros idiomas."

Obra de artista copiada pela IA mais vezes que Picasso

Galês? Poderia haver um dispositivo para isso

Haia - M-SParc