Peter Spyns: Taalprofessionals die nieuws willen ontvangen over de TST-Centrale en over de ontwikkelingen binnen de taal- en spraaktechnologie in Nederland en Vlaanderen kunnen zich aanmelden via
De Taalsector: Bij zulke grote onderzoeksprogramma’s hebben onderzoekers en onderzoeksinstellingen vaak het grootste voordeel. Was dat ook zo bij STEVIN, of deden er ook bedrijven mee?
Peter Spyns: Het was vanaf het begin de bedoeling dat ook het bedrijfsleven de resultaten mee moest kunnen aanwenden om innovaties door te voeren in het eigen aanbod van producten en diensten. Daarom was het zo belangrijk dat STEVIN juist basismaterialen zou opleveren, de grondstoffen die nodig zijn voor onderzoek, ontwikkeling en toepassingen in de taal- en spraaktechnologie …
De Taalsector: …, en die voor meerdere doelen en toepassingen gebruikt en hergebruikt kunnen worden?
Peter Spyns: Inderdaad. Om nuttig te zijn voor hergebruik moeten de materialen – of dat nu data of tools zijn – voldoende generiek en breed zijn.
De Taalsector: Geef eens een paar voorbeelden van zulk hergebruik.
Peter Spyns: Er werden bijvoorbeeld materialen aangeleverd die nuttig zijn voor semiautomatische vertaling, voor ruisonderdrukking bij spraakherkenning, voor opinieonderzoek in sociale media, voor een betere herkenning en uitspraak van eigennamen, voor de studie van allerlei taalkundige fenomenen in het Nederlands, voor accurater zoeken op het internet en voor onderzoek van uitspraak door kinderen en ouderen.
De Taalsector: Er is ook een corpus gemaakt van niet minder dan 500 miljoen woorden?