Navigation path

Left navigation

Additional tools

IP/08/60

Bruxelles den 18. januar 2008

Europa-Kommissionen gør computerstøttet oversættelse nemmere og lettere tilgængelig

Europa-Kommissionen går endnu et skridt længere med at fremme flersprogethed, som er noget helt centralt i princippet om at være forenet i mangfoldighed. Kommissionens samling af ca. 1 million sætninger og de nøjagtige oversættelser af dem til 22 af de 23 officielle sprog, deriblandt de nye medlemsstaters sprog, er den største samling, der nogen sinde har eksisteret på så mange sprog, og den er nu frit tilgængelig. Den type data er meget efterspurgt af dem, der udvikler maskinoversættelsessystemer, hvor softwaren ud fra konventionelt oversatte tekster selv "lærer", hvordan ord og ordforbindelser oversættes korrekt i forskellige sammenhænge. Dataene kan også være til hjælp for dem, der udvikler andre sproglige computerværktøjer som f.eks. grammatik- og stavekontrol, onlineordbøger og flersprogede tekstklassificeringssystemer.

Leonard Orban, EU-kommissær for flersprogethed, udtaler, at Europa-Kommissionen med dette initiativ vil sætte skub i sprogteknologien, støtte flersprogethed og gøre computerstøttet oversættelse nemmere, billigere og lettere tilgængelig. De borgere, der tilhører de mindre sprogsamfund, vil få lettere adgang til dokumenter og websider, der kun findes på de mest benyttede sprog, fortsatte han.

Janez Potočnik, EU-kommissær for videnskab og forskning, udtaler, at denne enestående samling af sprogdata er med til at skabe en ny generation af computerværktøjer til behandling af naturligt sprog og forbedre konkurrenceevnen i sprogbranchen, der er en af de hurtigst voksende brancher i EU.

På grund af kravet om, at EU's lovgivning skal foreligge på alle de officielle 23 EU-sprog, ligger EU-institutionerne inde med en større mængde flersproget tekst end nogen anden organisation. Deres oversættelsestjenester arbejder med 253 mulige sprogpar og leverer ca. 1,5 millioner oversatte sider om året.

På internettet kan man finde store mængder oversættelser af engelske og franske tekster, men sådanne ressourcer er langt mere begrænsede for andre sprog som f.eks. lettisk og rumænsk, og de findes praktisk taget slet ikke for indbyrdes kombinationer af de sprog, der kun findes begrænsede ressourcer af.

Det er grunden til, at Kommissionen via et samarbejde mellem dens egne oversættere og videnskabsfolk nu frigiver store samlinger af sætninger på 22 sprog, som kommer fra lovtekster inden for teknik, politik og samfundsforhold. I denne datasamling kan man finde hele sætninger og deres modstykke på alle de officielle sprog. Oversættelser til irsk mangler dog endnu. Denne frigivelse af sprogdata er endnu et godt eksempel på Kommissionens åbne politik for genanvendelse af informationsressourcer, som allerede har ført til fri adgang til EU's dokumentations- og terminologidatabaser Eur-Lex og IATE.

Kommissionen har mangeårige erfaringer med udvikling af værktøjer til behandling af flersproget tekst og er helt i front inden for flersprogethed. Bl.a. tilbyder den med sit European Media Monitoring-værktøj nyhedssøgning på offentligt tilgængelige websteder på op til 35 sprog. Der gives støtte til maskinoversættelse og andre sprogrelaterede teknologier inden for informations- og kommunikationsteknologiområdet af syvende rammeprogram for forskning og udvikling.

Der er flere oplysninger om oversættelsesdataene på følgende websted:

http://langtech.jrc.it/DGT-TM.html

European Media Monitor ligger på:

http://emm.jrc.it/overview.html


Side Bar