Met deze 10 pre-editeertips worden uw machinevertalingen nóg beter

Top Tien Pre-Editing TipsStel, u hebt iets te melden. Iets zodanig meldenswaardigs dat u het graag aan heel Europa laat weten. Of toch minstens aan heel de taalsector in heel Europa. Aan al uw collega-taalprofessionals. Hoe gaat u dat aanpakken?

English only? De verleiding is groot

Gaat u uw tekst in uw moedertaal schrijven en door een vertaler in het Engels laten vertalen? En laten reviseren? Laten reviewen ook? Of schrijft u meteen zelf in het Engels en laat u uw Engelse tekst door een native English eindredacteur nalezen?

Maar misschien wilt u helemaal niet in het Engels communiceren met uw collega-taalprofessionals in pakweg Spanje, Italië of Frankrijk. Kwestie van respect.

Bovendien bent u ook een voorstander van het behoud van Europa's taaldiversiteit en meertaligheid. En dat gaat niet in English only, of in English as a lingua franca voor de Europese taalsector. En dus moet er vertaald, vertaald en vertaald worden. In de 24 officiële EU-talen om te beginnen. En dan hebben we nog Catalaans, Chinees, Russisch, Arabisch, Turks en andere talen die in Europa ook van betekenis zijn.

Als u een A4"tje te melden hebt, kost dat A4"tje in vertaling al gauw 1000 à 1500 euro. En u hebt wel 5 A4"tjes te melden. Dan toch maar English only? De verleiding is groot.

Gelukkig zijn er de betere vertaalmachines

Gelukkig heeft de taalsector nog meer oplossingen te bieden: de betere vertaalmachines. Daarmee worden de 5 A4"tjes in 28 vertalingen budgettair weer haalbaar. U neemt uiteraard een kwaliteitsvolle vertaalservice (neen, niet de gratis online versie van Google Translate). De machines zijn betaalbaar, zo blijkt, waardoor er nog een budget overblijft voor een quick post-editing van alle 28 machinevertalingen. De machinevertalingen zijn goed, maar zo te zien gaan alle 28 post-editors elk dezelfde stomme afkorting moeten corrigeren. Het moet, want anders gaat de hele paragraaf de mist in. En alle 28 machinevertalingen gaan blijkbaar ook onverstaanbaar in de fout waar u in het Nederlands meldt dat de directeur zijn kat had gestuurd. Pff, dat zijn al 56 post-edits. Dat loopt snel op, zeg.

Post-editing is goed, pre-editing is beter

Het goede nieuws is dat u nog een optie hebt: pre-editeren. Met pre-editeren bedoelen we dat u uw (bron)tekst manipuleert in functie van optimale machinevertalingen. U schrijft dan zo vertaalmachinevriendelijk als mogelijk, zonder verlies van uw natuurlijke stijl wel te verstaan. Met als doel: zo veel mogelijk post-edits voorkomen en zo veel mogelijk informatie zo toegankelijk mogelijk maken voor zo veel mogelijk taalprofessionals in heel Europa in zo veel mogelijk verschillende talen. Het mag iets kosten, maar 6 à 7000 euro voor een paar A4"tjes ... niet iedereen kan het zich permitteren. Gelukkig zijn er de betere vertaalmachines. En gelukkig zijn hier nu ook de top tien tips voor een optimale pre-ediing van onze huisexpert Valentin Descamps.

Toegankelijkheid

Met een beperkt aantal relatief kleine interventies kunt u de toegankelijkheid van de machinevertaalde informatie in uw bericht, artikel, opinie of andere inhoud zeer wezenlijk verbeteren. Samengevat is zijn advies: met slechts een paar welgemikte pre-edits bespaart u vaak al snel (de tijd en de kost van) tientallen post-edits. Post-editing van machinevertalingen is goed. Pre-editing is nog veel beter ....


Gent, 21 december 2020, Valentin Descamps
- Doel van het pre-editeren is een zo begrijpelijk mogelijke machinevertaling te genereren in zoveel mogelijk verschillende talen. In de mate dat het nodig is, kan vervolgens de post-editor de machinevertaling “idiomatiseren”.

De tips die ik presenteer, verbeteren de machinevertalingen niet in alle talen in dezelfde mate. Ik heb ze getest op Franse, Russische en Spaanse machinevertalingen uit het Nederlands. De tips maken 9 op de 10 Franse en Spaanse vertalingen begrijpelijker, en 6 op de 10 Russische machinevertalingen. Het kan gebeuren dat een pre-editeertip die de Franse en Spaanse machinevertaling begrijpelijker maakt net het omgekeerde effect sorteert in de Russische vertaling.

Om het effect van de tips te evalueren heb ik Google Translate gebruikt, een gratis tool die u voor dit doel ook kunt gebruiken. In de praktijk kunnen andere vertaalmachines een licht ander effect laten zien.
Als voor u de Russische vertaling om welke reden dan ook belangrijker is dan de Spaanse of de Franse, dan kunt u een pre-editing overwegen die meer specifiek op de Slavische talen focust.


Hierna presenteer ik mijn Top Tien Pre-Editing Tips.

Wilt u graag reageren, hebt u een vraag of een suggestie? Neem dan gerust contact met mij op via Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.. Ik kijk uit naar alle mogelijke feedback.

U kunt ook de uitgebreide versie van dit artikel downloaden in pdf. De pdf illustreert elke tip met verschillende voorbeelden (NL > FR / ES / RU).

 

Tip 1: vermijd afkortingen

Vermijd afkortingen. Afkortingen zijn voor de vertaalmachines vaak moeilijk vertaalbaar. Schrijf afkortingen voluit.

 

Tip 2: vermijd zinnen zonder werkwoord

Zinnen zonder werkwoord zijn moeilijk voor de vertaalmachines. Voeg een werkwoord toe, anders riskeert er een werkwoord te ontbreken in de vertaling.

 

Tip 3: verduidelijk het geslacht van eigennamen

Personennamen kunnen specifiek zijn voor een taal of een land.

Voor een lezer zonder achtergrondkennis over het land en voor een vertaalmachine is het niet altijd duidelijk of een naam naar een man of een vrouw verwijst.

Tip: gebruik in de onmiddellijke omgeving van eigennamen zo vaak mogelijk mannelijke of vrouwelijke verwijzende woorden, zodat de machine het gender van de persoon mogelijk uit de context kan afleiden.

 

Tip 4: vermijd te lange zinnen

Hoewel neurale vertaalmachines veel langere zinnen kunnen verwerken dan de vorige generatie (op statistiek gebaseerde) machines, is het toch beter om echt lange zinnen op te splitsen.

 

Tip 5: Speel met de structuur

Hou de structuur van je zinnen zo helder mogelijk. Probeer geen twee ideeën in één zin te proppen. Als twee zinnen een logisch verband met elkaar hebben, gebruik dan verbindingswoorden om de relatie aan te geven.

 

Tip 6: speel met de context

Moderne vertaalmachines bekijken ieder woord in de context van (minstens) de hele zin. Introduceer je een moeilijk woord, introduceer het dan in een context die veel gelieerde informatie bevat die de vertaalmachines gemakkelijk kunnen verstaan. Zo verhoogt u de kans dat ze de zin correct zullen vertalen.

 

Tip 7: speel met synoniemen

Als een heel specifiek woord echt moeilijk blijkt voor de vertaalmachines, stel u dan een beetje soepel op en wees bereid om een synoniem te overwegen. Denk aan de optimale toegankelijkheid van uw informatie in zo veel mogelijk talen.
Is dat ene super precieze woord met die ene super precieze betekenis echt zo belangrijk dat het gerechtvaardigd is dat u er twintig vertaalproblemen mee creëert en twintig post-edits noodzakelijk maakt.

 

Tip 8: Vermijd taalspecifiek idioom

In het Nederlands sturen de mensen hun kat wanneer ze niet op een afspraak verschijnen. De meeste vertaalmachines vertalen zulk idioom dan letterlijk ("zijn kat sturen"), en dat is in vertaling vaak niet begrijpelijk voor de lezer. Het is beter in concrete, expliciete taal te schrijven.

 

Tip 9: corrigeer taalfouten

Leg de lat hoog. Wees streng voor de kwaliteit van je eigen tekst. Taalfouten in de brontekst kunnen tot taalfouten in de doeltekst leiden. Dus, check nog eens extra je grammatica, spelling, interpunctie en de samenhang van je brontekst. Er zijn tools die jou daarbij kunnen helpen.

 

Tip 10: schrijf in één taal

Is je tekst in het Nederlands? Schrijf zo veel mogelijk Nederlands. Dat klinkt logisch, maar sommige mensen gebruiken veel Engelse woorden en uitdrukkingen in hun Nederlandse teksten. Geen enkel probleem voor de Engelse vertaalmachine, maar wel vaak des te meer voor de andere machines, die dan minder goed presteren (in het Frans en in de andere Romaanse talen bijvoorbeeld).

 

Download de integrale versie van dit artikel (met voorbeelden) in pdf.

 

We respecteren je privacy.
Door op deze website te surfen aanvaard je functionele en analytische cookies, bedoeld om de site goed te laten werken. Hier geen trackingcookies.