Peter Spyns: Ja, internetbedrijf Google gebruikt LASSY-klein (Large Scale Syntactic Annotation of Written Dutch). LASSY-klein is een verzameling van één miljoen woorden die voorzien zijn van handmatig gecontroleerde grammaticale informatie. Google gaat die gebruiken om de kwaliteit van het Nederlands in Google Translate en andere Googleproducten te helpen verbeteren.
Nu gebruikt Google Translate in de eerste plaats de kracht van het getal om zinnen te vertalen. Hoe vaker een (deel)zin als vertaalcombinatie voorkomt, hoe groter de kans dat die combinatie een goede vertaling is. Deze op statistiek gebaseerde aanpak kan op problemen stuiten, bijvoorbeeld bij talen die niet zo vaak gebruikt worden op het internet of waarvoor onvoldoende vertaalde combinaties van (deel)zinnen te vinden zijn. Google zal LASSY wellicht gebruiken om Google Translate onder meer verwijswoorden te leren herkennen zodat er minder woordelijk wordt vertaald en meer in grammaticale samenhang.
De Taalsector: Spraaktechnologie is tegenwoordig overal. En we zien zowel spraakherkenning als spraakgeneratie.
Peter Spyns: Spraaktechnologie is ook in toenemende mate in de wagen te vinden. Waar we in de jaren 80 alleen in een tv-reeks als ‘Knight Rider’ een pratende auto konden zien, hebben de wagens van vandaag spraakgestuurde bediening van bv. ruitenwissers, en herkent de navigatiesoftware van bv. Mercedes het adres van bestemming in het Nederlands. Intussen heeft Ford ook spraakgeneratie die sms’jes en berichten op je gsm en smartphone luidop kan uitspreken, zodat je de handen op het stuur kan houden.
Bij dit soort spraaktechnologie spelen twee STEVIN-projecten een rol: Autonomata en Autonomata Too. Ze hebben materialen ontwikkeld die het herkennen en uitspreken van eigennamen helpen verbeteren. De uitspraak van eigennamen volgt immers een eigen systematiek die meermaals afwijkt van de algemene moderne uitspraakregels. Deze materialen zijn ook nuttig in een contactcenteromgeving en voor automatische receptionisten die bellers op basis van een uitgesproken naam doorverbinden. Door deze projecten kan nu ook beter rekening gehouden worden met de manier waarop buitenlanders Nederlandstalige namen.