Tutorial OpenSoNaRAls het gaat over snel en efficiënt informatie vinden op het internet, dan zijn taalprofessionals moeilijk te kloppen.

Maar echt het verschil maak je in 2020 pas als je ook efficiënt kunt zoeken in zeer grote hoeveelheden verrijkte tekst en spraak. En dan zitten we in de bronnen die de digitale basisinfrastructuur vormen van de taal of de talen waar je mee werkt: een corpus geschreven Nederlands van 500 miljoen woorden bijvoorbeeld, of een collectie van 900 uur gestranscribeerde spraak. 

Op vrijdag 9 oktober 2020 (van 14 tot 17 uur) organiseert CLARIAH een online tutorial over OpenSoNaR, een webapplicatie waarmee je kunt zoeken in twee internationaal toonaangevende corpora: het SoNaR-corpus en het Corpus Gesproken Nederlands (CGN). Een tutorial voor beginners. Gratis. In het Nederlands.

 

Het SoNaR-corpus bevat meer dan 500 miljoen woorden uit in het Nederlands geschreven bronnen uit Nederland en Vlaanderen en uit zeer uiteenlopende domeinen en genres. Het CGN is een collectie van 900 uur getranscribeerde spraak afkomstig van Vlamingen en Nederlanders. Dat zijn ongeveer 9 miljoen woorden.

Met de webapp OpenSoNaR zoek je in deze enorme hoeveelheden geschreven en gesproken Nederlands. Je kunt eenvoudig zoeken op woorden, maar ook op specifieke taalkundige informatie waarmee de teksten verrijkt zijn (woordsoort, verbuiging en andere annotaties). En in het CGN kun je de bijbehorende spraakfragmenten beluisteren.

De tutorial zal bestaan uit enkele presentaties, waarna de deelnemers oefeningen zullen maken onder begeleiding van een team van experts. De docenten zijn Jan Odijk (Universiteit Utrecht), Jesse de Does, Katrien Depuydt, Kris Heylen en Carole Tiberius (allen Instituut voor de Nederlandse Taal). Zij hebben veel ervaring met het werken met OpenSoNaR.

CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities) is een digitale infrastructuur voor de geesteswetenschappen.


Aanmelden voor de tutorial kan tot 30 september 2020. Bij aanmelding wordt gepeild naar voorkennis en specifieke interesses (bv. in specifieke woorden, woordklassen of constructies), zodat de tutorial zo goed mogelijk afgestemd kan worden op de deelnemers.


Praktische informatie en aanmelding op de website van CLARIAH.