Internet en globalisering maken automatiseren van vertalen van tekst onontbeerlijk

Dankzij het wereldwijde web is een grote toename ontstaan van activiteiten die bedrijven richting het buitenland ondernemen. Dit wordt “internationalisering” of “globalisering” genoemd. Tussen landen bestaan vele verschillen. Allereerst cultureel gezien. Ondernemers dienen zich hierin te verdiepen, zodat voorkomen kan worden dat kansen missers worden. Naast culturele verschillen lopen organisaties tevens tegen taalproblematiek aan. Zonder wederzijds begrip is communicatie zinloos. Om dat begrip te verkrijgen dient men elkaars cultuur, taal en terminologie te begrijpen. Van groot belang is het dan ook dat documenten en websites vertaald kunnen worden in de taal waarmee de organisatie zaken doet of dit wenst te doen.

Vertalen van content liever niet met een vertaalmachine

Vertalen van content kan op verschillende manieren. Er bestaan machinevertalingen, waarvan Google Translate er één is. Het probleem is echter dat deze vertaalmachines vaak onvoldoende kwaliteit leveren. Handmatig vertalen blijft daarom noodzaak. Voor vertalers zijn er daarom vele verklarende woordenlijsten, en woordenboeken in omloop. Want voor elke discipline is het belangrijk dat jargon en woorden binnen de branche in de juiste context worden vertaald. Een begrip kan tenslotte meerdere betekenissen hebben. Door hierop niet te anticiperen zullen teksten onleesbaar kunnen worden.

Een ander aandachtspunt is dat dezelfde taal in diverse landen verschillen kent. Zo heeft bijvoorbeeld het Spaans dat in Spanje gesproken wordt woorden met hele andere betekenissen dan het Spaans dat gesproken wordt in Mexico of Cuba. Vertalers staan voor de uitdaging om steeds productiever te zijn, zodat vertaalkosten zo laag mogelijk blijven en de efficiëntie toeneemt. Ook dienen vertalingen van kwalitatief hoog niveau te zijn. Een slechte vertaling van content op websites houdt in dat gebruikers zich niet serieus genomen voelen, daarom sneller wegklikken, en wantrouwiger zijn over de betrouwbaarheid van de organisatie.

CAT-tools voor de vertaler

Professionele vertalers maken gebruik van CAT-tools, Computer Aided Translation tools. Hierbij worden met computerprogramma’s teksten vertaald. De te vertalen tekst wordt in segmenten verdeeld en de vertaalde tekst wordt met deze programma’s opgeslagen in databases. De opgeslagen vertaling kan vervolgens later weer gebruikt worden. Deze databases worden vertaalgeheugens genoemd en zorgen ervoor dat de productiviteit van de vertaler, de kwaliteit en consistentie van de vertaalde tekst toenemen.

De uitwisseling van deze geheugens gebeurt in TMX- bestanden of in TBX-formaat. Het TMX-formaat beschrijft de vertaling van een tekst of tekstsegment die in een database worden opgeslagen. Het TBX-formaat wisselt gegevens van terminologische databases uit. De betekenis van begrippen wordt hierin beschreven. Het Engelse woord “Project developer” bijvoorbeeld wordt omschreven als “a developer of a specific, probably large project. This maybe a speculative developer who sells on the finished project on completion.”

Er zijn diverse CAT-tools beschikbaar. Ze variëren in mogelijkheden en prijs. Invantive maakt gebruik van OmegaT. Dat is gratis open source software, die veel bestandsformaten kan verwerken, zoals Word en HTML. Guido Leenders, directeur van Invantive, schrijft het volgende erover op het blog van vertalersnieuws: “We gebruiken sinds 2007 OmegaT. In het begin waren er nog wat kleine probleempjes om de vertaalgeheugens in TMX-formaat onder versiebeheer met Subversion te krijgen, maar inmiddels loopt het als een zonnetje. Ik heb wel gemerkt dat de meeste vertalers nog weinig of geen ervaring hebben met programma’s die het vertalen ondersteunen. Ik kan het echter aanraden; het aantal woorden per uur stijgt. En dankzij de mogelijkheid om verklarende woordenlijsten toe te voegen kun je ook als relatieve leek sneller teksten in een ander vakgebied vertalen. We vertalen onze software Invantive Vision er ondertussen in tien talen mee en zelfs Chinees en Arabisch lopen er netjes doorheen”. Dit gebeurt ook voor de producten Invantive Estate en Invantive Control. Op de website van Invantive is een videofragment over het gebruik van OmegaT te zien.

Invantive Studio en OmegaT

Invantive Studio is een software-ontwikkelprogramma (CASE, Computer-Aided Software Engineering) voor bedrijfssoftware en applicaties op maat. Met Invantive Studio kan een analist verklarende woordenlijsten opvoeren die het vertalen van applicaties en schrijven van (technische) handleidingen met OmegaT vergemakkelijkt. In de verklarende woordenlijst voor Invantive Estate bijvoorbeeld, waarvan de doelgroep binnen de vastgoedbranche ligt, is vakjargon voor de vastgoed in diverse talen opgenomen. In het overzicht hieronder is deze te zien:

Vanuit Invantive Studio worden de verklarende woordenlijsten geëxporteerd naar het TBX-formaat voor gebruik door de vertalers:

20141124-exporteren-tbx-uit-case-repository