87 procent winst
Ja, dat is de traditionele oplossing. Sien Accou, Localisation QA Team Manager bij Yamagata Europe: “Als je de 700 ontoegankelijke claims met de machine vertaalt, haal je een winst op vlak van begrijpelijkheid van 10 tot max. 20%.” Van 0% begrijpelijkheid naar 20%. Niet slecht. Maar voor Yamagata Europe was dat niet goed genoeg. 100% winst op vlak van begrijpelijkheid is het doel. Sien Accou: “We halen momenteel 87-88%. Anders dan te beginnen met automatische vertaling (MT) en daarna te post-editeren, zetten we de MT-engine (Systran) maar in de allerlaatste fase van het vertaalproces in. Om met automatische vertaling 87-88% begrijpelijkheid te bereiken, moeten we eerst de kwaliteit van de ruwe input voor de MT-engine fors verbeteren.”
Sien Accou laat ons zien dat de ene garagist een heel epistel nodig heeft om zijn claim te formuleren, terwijl de andere pijnlijk summier schrijft en alleen afkortingen lijkt te kennen.
Eerst opschonen
Sien Accou: “In een eerste stap kijken we of er eerder al iets van vertaald is.” Ze laat ons een batch van 53 segmenten zien, waarvan er 13 al eerder vertaald blijken. Die worden uiteraard uit het vertaalgeheugen opgehaald.
“In een tweede stap verbeteren we de vormaspecten van het materiaal,” legt Sien Accou verder uit. “Dat gaat van tekstcorrectie pur sang (spaties toevoegen, een nieuwe zin met een hoofdletter laten beginnen, enz.) tot het uitschrijven van typische afkortingen (av. = avant, enz.).
“En de derde stap is een spellingcontrole.“
In drie stappen worden de pennenvruchten van de garagisten – de input voor de MT-engine - opgeschoond. En dan pas gaat het materiaal naar de MT-engine. En uiteraard worden die engines wekelijks geüpdatet. “Human-assisted MT,” voegt Geert Benoit toe. Kaizen.