Vertalen en vertaalmachines: achter de schermen


Een tekst vertalen, wat is dat eigenlijk? In essentie: een tekst in de ene taal omzetten in een tekst in een andere taal. De eerste tekst noemen we de brontekst, de tweede de doeltekst.
Hoewel er veel verschillende visies bestaan over wat een goede vertaling is, gaan we er in dit artikel van uit dat een geslaagde vertaling de inhoud van de brontekst correct weergeeft in de doeltekst. Traditioneel doet de vertaler daarvoor vooral een beroep op zijn talenkennis, eventueel in combinatie met woordenboeken. Deze menselijke manier van vertalen kost echter veel tijd en geld. Daarom probeert men het vertalen de laatste jaren steeds meer te automatiseren. Dit betekent niet dat de menselijke vertaler overbodig is geworden. Dat zegt ook Lynne Bowker, professor aan de School of Translation and Interpretation in Ottawa, in haar boek Computer-aided Translation Technology:
“Automatisch vertalen is het proces waarbij een computer de primaire verantwoordelijkheid voor de vertaling van een tekst heeft. Een mens kan helpen bij het proces door middel van taken zoals pre- of post-editing, maar het is de computer in plaats van de mens die een daadwerkelijke ontwerpvertaling produceert.” (eigen vertaling)

Mens versus machine

Volgens professor Bowker doet een computer bij automatisch vertalen dus weliswaar het grootste werk, maar de menselijke vertaler kan nog altijd ingrijpen. Dat ingrijpen kan men dan echter niet langer vertalen noemen, maar eerder reviseren. De vertaler wordt hier dus eigenlijk revisor.

We kunnen dus om te beginnen twee types van automatisch vertalen onderscheiden:

  • de volledig automatische machinevertaling (Fully Automatic Machine Translation ofte FAMT)
  • de door de mens ondersteunde machinevertaling (Human Aided Machine Translation ofte HAMT)

Zoals professor Bowker aangeeft, kan de mens die de machinevertaling ondersteunt - de revisor dus - dat op twee manieren doen: hij kan de brontekst bewerken en hij kan de doeltekst bewerken.


Pre-editeren

In het eerste geval spreekt men van pre-editeren: de brontekst wordt zodanig aangepast dat de vertaalmachine minder moeite heeft met het omzetten. De onderzoekers Chris Callison-Burch en Philipp Koehn kwamen tot de vaststelling dat vertaalmachines vooral moeite hebben met woordvolgorde, dubbelzinnigheid op het vlak van structuur en woordenschat, gebruik van voornaamwoorden, en gebruik van de tijden. Het zijn dus vooral deze problemen waar de revisor bij het pre-editeren op moet letten.


Postediteren

In het tweede geval bewerkt de revisor niet de brontekst maar de doeltekst. Dan spreekt men van postediteren. Dit betekent dat de revisor de doeltekst grondig nakijkt. Hij moet dan opnieuw speciale aandacht hebben voor Callison-Burch en Koehns voornoemde problemen.


Regels versus statistiek

Vervolgens is het interessant om te weten dat vertaalmachines volgens verschillende principes kunnen werken.
Ofwel is een vertaalmachine regelgebaseerd, wat inhoudt dat ze kennis heeft van de grammaticale regels van bron- en doeltaal. Een regelgebaseerde vertaalmachine is in staat om de verschillende grammaticale functies die woorden kunnen aannemen (bv. onderwerp en gezegde) te onderscheiden.
Ofwel werkt een vertaalmachine volgens statistische methodes. Het uitgangspunt is dan dat elke zin of elk deel van een zin in één taal een mogelijke vertaling is van een zin of een deel van een zin in een andere taal. Tegenwoordig bestaan er ook hybride vertaalmachines die de regelgebaseerde en de statistische aanpak combineren.

Ten slotte zijn er naast de reeds besproken volledig automatische machinevertaling (FAMT) en de machinevertaling die door de mens wordt ondersteund (HAMT) ook systemen ontwikkeld waarbij de computer de vertaler helpt bij het vertaalproces. Omgekeerd dus. We spreken dan van Machine Aided Human Translation (MAHT) of Computer-aided Translation (CAT). De brontekst wordt in dit geval vertaald door een menselijke vertaler, die een computer gebruikt om bijvoorbeeld de spelling te optimaliseren of de consistentie tussen verschillende vertalingen te bevorderen.

We respecteren je privacy.
Door op deze website te surfen aanvaard je functionele en analytische cookies, bedoeld om de site goed te laten werken. Hier geen trackingcookies.