Elektronische Woordenbank van de Nederlandse Dialecten gelanceerdOp één centraal punt zoveel mogelijk Nederlandse dialectwoordenboeken digitaal beschikbaar en doorzoekbaar maken. Zowel voor taalkundigen als voor taalliefhebbers. Dat is het doel van de eWND ofte de Elektronische Woordenbank van de Nederlandse Dialecten die het Meertens Instituut (Amsterdam) vorige week heeft gelanceerd. Met dank aan de financiers én aan de Stichting Vrijwilligersnetwerk Nederlandse Taal.

 

Vrijwilligers
Zoals in Gent met een leger vrijwilligers ("crowdtypers") wordt gewerkt aan de digitalisering van het Woordenboek van de Vlaamse Dialecten (WVD) en van een aantal belangrijke dialectwoordenboeken (woordenbank.be), zo werkt op het Meertens Instituut in Amsterdam al anderhalf jaar een leger van 75 vrijwilligers aan de Nederlandse eWND, een online databank met Nederlandse dialectwoorden. Van die eWND is vorige week een eerste versie online gezet.

Het eWND-digitaliseringsproject is opgezet door prof. dr. Nicoline van der Sijs. Zij is als onderzoeker in de variatielinguïstiek verbonden aan het Meertens Instituut. Ze werkt al jaren samen met vrijwilligers, die voor de goede werking in een stichting zijn ondergebracht: de Stichting Vrijwilligersnetwerk Nederlandse Taal (SVNT).


Stichting Vrijwilligersnetwerk Nederlandse Taal

De vrijwilligers van de SVNT hebben sinds 2007 miljoenen woorden getranscribeerd. Een opvallend project was de digitalisering van tien laatmiddeleeuwse en vroegmoderne Bijbelvertalingen uit de periode 1477-1657. Daarmee kwam een enorme hoeveelheid materiaal digitaal, online en gratis beschikbaar: meer dan 15 miljoen woorden. Vervolgens pakten ze ook Nederlandstalige literaire en historische teksten uit de 16de tot 19de eeuw aan. Ook werkten en werken ze aan de digitalisering van duizenden handgeschreven gekaapte brieven, etymologische woordenboeken, dialectwoordenboeken en dialectvragenlijsten.

Over het vrijwilligerswerk zei Nicoline van der Sijs vorig jaar: "Het enthousiasme is nog steeds verbazingwekkend groot en onderzoekers snakken naar digitale ontsluiting van nog meer historische bronnen, dus we gaan gewoon door."
In de recentste nieuwsbrief van het Meertens Instituut zegt ze: "Ook dit project bestaat uit heel veel handwerk. Daar verkijk je je altijd weer op. Het is niet enkel woordjes overtikken, maar vooral de data verrijken, zodat de zoekmachine ze ook kan vinden."


Workflow

Het digitaliseren van een dialectwoordenboek begint met het nemen van een scan van het woordenboek. Daarna wordt het woordenboek in porties van 10 tot 15 bladzijden ingedeeld. Een eerste vrijwilliger tikt alles over, vult ontbrekende woorden aan, schrijft alle afkortingen voluit en voegt codes toe (bijvoorbeeld voor woordsoortinformatie, verklein- of meervoudsvorm). Een tweede vrijwilliger kijkt alles nog eens na. Een derde zet alles over in een tabel en een speciaal groepje taalkundestudenten ten slotte kent aan elke dialectingang een Nederlands trefwoord toe, zodat je met een modern Nederlands woord naar een (oud of misschien niet meer gebruikt) dialectwoord kunt zoeken.

Taaltechnologie
In hoeverre kan een deel van de workflow semiautomatisch ondersteund worden? Nicoline van der Sijs ziet mogelijkheden bij het vernederlandsen: "Een woord bestaat uit medeklinkers en klinkers. Vaak zijn de medeklinkers redelijk stabiel en de klinkers niet. De computer kan patronen herkennen en op basis hiervan voorspellingen doen. De computer zou bijvoorbeeld kunnen voorspellen wanneer in een bepaald dialect ie staat voor Standaardnederlands ij, en wanneer voor ie. In het ideale geval suggereert de computer voor de dialectvorm kniepstät de Standaardnederlandse vorm knijpstaart. (...) Als de computervoorspellingen redelijk goed zijn, zal dat het toevoegen van de Standaardnederlandse vormen behoorlijk kunnen versnellen."

Onderzoek
Uiteindelijk zullen een zestigtal dialectwoordenboeken onderdeel (gaan) uitmaken van de eWND. De mogelijkheden voor onderzoek worden steeds talrijker, zegt Nicoline Van der Sijs: "Straks kun je oude met jonge woordenboeken vergelijken, of uit één regio. Maar ook kun je kijken naar veranderingen binnen het Nederlandse dialectgebied, zoals de manier waarop sterke werkwoorden zwak worden."

De eWND is tot stand gekomen met ondersteuning van het Prins Bernhard Cultuurfonds, de Toon Weijnen-Stichting, de Raod veur ’t Limburgs en Time Capsule, een project van de Nederlandse nationale wetenschapsfinancier NWO (Nederlandse Organisatie voor Wetenschappelijk Onderzoek).

De Stichting Vrijwilligersnetwerk Nederlandse Taal (SVNT) is een netwerk van ongeveer honderd vrijwilligers dat zich tot doel heeft gesteld informatie in en/of over de Nederlandse taal in heden en verleden en Nederlands talig erfgoed voor iedereen beschikbaar en toegankelijk te maken, bij voorkeur digitaal en interactief.


Meer info: http://www.meertens.knaw.nl/ewnd

Meer info: http://www.meertens.knaw.nl/dialectwoordenboeken/boeken/colofon

Meer info: http://woordenbank.be/lid/wnd/f?p=104:33:0::NO:33,RP::

Meer info: http://www.etymologiebank.nl/colofon

Meer info: http://www.gekaaptebrieven.nl/tekst/medewerkers