Navigation path

Left navigation

Additional tools

IP/08/60

Bruxelas, 18 de Janeiro de 2008

Comissão Europeia torna a tradução assistida por computador mais fácil e mais acessível

A Comissão Europeia está a avançar mais um passo nos seus esforços para fomentar o multilinguismo como componente essencial da unidade europeia na diversidade. A colecção da Comissão de cerca de 1 milhão de frases e as suas traduções de alta qualidade em 22 das 23 línguas oficiais da UE — incluindo as dos novos Estados-Membros — constituem a maior colecção de sempre em tantas línguas e estão agora totalmente disponíveis gratuitamente. Esta espécie de dados é extremamente procurada por empresas que desenvolvem sistemas de tradução automática em que o software de tradução automática "aprende", a partir de textos traduzidos manualmente, o modo como as palavras e frases são correcta e contextualmente traduzidas. Os dados podem também ajudar ao desenvolvimento de outras ferramentas de software linguístico, tais como correctores ortográficos e gramaticais, dicionários em linha e sistemas multilingues de classificação de textos.

Leonard Orban, Comissário para o Multilinguismo, afirma: "Através desta iniciativa, a Comissão Europeia pretende impulsionar as tecnologias da linguagem humana, apoiar o multilinguismo e tornar a tradução assistida por computador mais fácil, barata e acessível. Os cidadãos que pertencem às comunidades linguísticas com menores dimensões terão um acesso mais fácil a documentos e a páginas Web apenas disponíveis nas línguas mais utilizadas".

Janez Potočnik, Comissário para a Ciência e Investigação, afirma: "Esta colecção única de dados linguísticos contribui para a criação de uma nova geração de ferramentas de software para o tratamento da linguagem humana e ajuda a melhorar a competitividade da indústria linguística, que já é uma das indústrias da União Europeia com maior crescimento".

As instituições da UE possuem mais textos multilingues que qualquer outra organização, dado que a legislação da União Europeia tem de ser publicada em cada uma das suas 23 línguas oficiais. Os seus serviços de tradução trabalham com 253 pares possíveis de combinações linguísticas e produzem cerca de 1,5 milhões de páginas traduzidas por ano.

Embora possam ser encontradas na Internet, em grande quantidade, traduções de textos em inglês ou francês, tais recursos são raros para línguas tais como o letão ou o romeno, e são praticamente inexistentes no que respeita à combinação de duas línguas para as quais existem poucos recursos.

Assim sendo, a Comissão, através da cooperação entre os seus tradutores e os seus próprios cientistas, está a disponibilizar grandes colecções de frases de documentos jurídicos que abrangem questões técnicas, políticas e sociais em 22 línguas. Neste repositório de traduções é possível encontrar frases com os seus equivalentes em todas as línguas oficiais, excepto as traduções em irlandês, que ainda não estão disponíveis. Esta disponibilização de dados linguísticos constitui um bom exemplo da política aberta da Comissão de reutilizar os seus recursos de informação e segue-se à abertura das bases de dados terminológicas comunitárias Eur-Lex e IATE.

A Comissão tem uma grande experiência no desenvolvimento de ferramentas de processamento de textos multilingues e está na linha da frente do multilinguismo, oferecendo sítios de pesquisa de notícias publicamente acessíveis que chegam a cobrir 35 línguas através da sua ferramenta de monitorização dos meios de comunicação social ("European Media Monitor").

Para mais informações sobre os dados relativos à tradução, consultar:

http://langtech.jrc.it/DGT-TM.html

O European Media Monitor tem o seguinte endereço:

http://emm.jrc.it/overview.html


Side Bar