Het Instituut voor Nederlandse Lexicologie (INL, Leiden) heeft een historisch en taalkundig belangrijke collectie van meer dan 1000 eeuwenoude brieven taalkundig verrijkt en online gezet.
De brieven komen uit de fameuze collectie gekaapte scheepspost die min of meer recent werd herontdekt. In die collectie zitten minstens 40.000 brieven en documenten van de hand van Nederlanders overzee, zeelieden of thuisblijvers die elkaar schreven.
De brieven zijn in de 17de en 18de eeuw verzonden, maar nooit aangekomen. Ze zijn destijds door Engelse kapers buit gemaakt.
Dat erfgoedmateriaal is nu gratis online toegankelijk, goed leesbaar, en snel en volledig doorzoekbaar. Met dank aan een legertje vrijwillige transcribenten (lees: crowdsourcing), taalkundige verrijking en geavanceerde zoektechnologie. Hoe is dat gegaan?
Gekaapt
Engelse kapers moeten destijds duizenden grote en kleine Nederlandse schepen gekaapt hebben. Nederlandstalige documenten aan boord van die gekaapte schepen waren voor de Engelse admiraliteit die de kapersbrieven uitgaf belangrijk bewijsmateriaal dat het wel degelijk om Nederlandse schepen ging. Daarom droegen de kapers er goed zorg voor en brachten ze de brieven in goede staat aan wal. Al die brieven zijn een paar eeuwen lang ongeopend blijven liggen in het archief van de admiraliteit in de buurt van Londen. De Nederlandse historicus Sipke Braunius ontdekte of herontdekte ze in 1980. Vandaag staan er ruim 1000 van die brieven online op de website van het INL. Ze zijn verrassend goed leesbaar, en snel en volledig doorzoekbaar.
Gecrowdsourced
Om te beginnen hebben vrijwilligers hard gewerkt om de schat aan handgeschreven brieven digitaal over te tikken. Tijdens dat transcriptiewerk hebben ze de brieven ook voorzien van alle soorten van meta-informatie: is de brief zakelijk of persoonlijk? Wie is de afzender, de ontvanger? Welke relatie of verwantschap (vriend, tante) bestaat er tussen afzender en ontvanger? Voor welk schip is de brief bestemd? Plaats van verzending? Plaats van bestemming? Enzovoort.
Dankzij het enorme transcriptiewerk en de toegevoegde meta-informatie kan men vandaag de collectie elektronisch doorzoeken en de zoekresultaten filteren op bijvoorbeeld alle brieven van vrouwen op het thuisfront aan hun man op een bepaald schip in een bepaalde periode.
Met deze creatieve vorm van crowdsourcing wordt onderzoek mogelijk dat binnen de normale werktijd van onderzoekers en binnen normale onderzoeksbudgetten onmogelijk is.
Verrijkt
Toch zouden de getranscribeerde brieven nog tamelijk lastig leesbaar en moeilijk doorzoekbaar gebleven zijn, als men ze op het INL niet ook nog eens taalkundig verrijkt had.
Concreet verschijnt bij het bewegen van de cursor over de getranscribeerde tekst bij elk oud woord het hedendaagse woord of lemma dat ermee overeenkomt. Dat maakt het lezen veel gemakkelijker. Alleen al voor het hedendaagse woord kapitein zijn er meer dan 100 oude spellingvarianten gevonden. Aan elk oud woord is dus een hedendaags lemma gekoppeld. Een bijkomend voordeel van wat men lemmatiseren noemt, is - naast de betere leesbaarheid - dat je de hele collectie met woorden van nu kunt doorzoeken. Wie zoekt op kapitein, vindt dus ook alle passages waarin een van de 100 oude spellingvarianten voorkomt.
Verder zijn de brieven ook verrijkt met informatie over de woordsoort. Je kunt de collectie dus doorzoeken op het woord "leven" en daarbij aangeven dat je alleen in het werkwoord geïnteresseerd bent.
Erfgoed
De brieven in deze historisch belangrijke erfgoedcollectie zijn zoals gezegd van de hand van Nederlandse zeelieden, Nederlanders overzee en thuisblijvers. De briefschrijvers kwamen uit de lagere en middenklasse en trokken zich destijds niets aan van enige schrijftaalnorm. Ze schreven dus alledaags Nederlands of ze dicteerden hun brief aan een "beroepsschrijver" of "openbare schrijver" op de markt of de kaai, want veel mensen konden gewoon niet lezen of schrijven.
De brieven geven inzicht in het dagelijkse leven in de 17de en 18de eeuw. Buiten deze brieven is er weinig zulk materiaal bewaard gebleven.
Groot-Brittannië en de Republiek der Zeven Verenigde Nederlanden voerden in de 17de en 18de eeuw vier oorlogen met elkaar. Bij duizenden kapingen werd alles in beslag genomen. Heldere achtergrondinformatie over de kaapvaart en de gekaapte brieven is te lezen in het onderstaande pdf-document "Brievenbus van de tijd" van Ewoud Sanders.
Brieven als buit
De hele collectie gekaapte scheepspost uit de 17de en 18de eeuw telt vermoedelijk meer dan 40.000 documenten. De ruim 1000 taalkundig verrijkte brieven waar het in dit artikel over gaat, staan zoals gezegd op de website van het INL (brievenalsbuit.inl.nl). Brieven als Buit (brievenalsbuit.nl) is voor een goed begrip een project van de Universiteit Leiden, waar taalkundig onderzoek wordt gedaan naar de brieven. Het INL heeft aan het project bijgedragen door hedendaagse lemma’s aan de oude te verbinden, en de zoekapplicatie te maken.
Het INL verzamelt, bestudeert en beschrijft de Nederlandse taal- en woordenschat van de 6de eeuw tot het heden.
Meer informatie over de werkzaamheden van het INL en over het taalkundig onderzoek dat men aan de Universiteit Leiden op deze brieven verricht, staat te lezen in een helder artikel op de website kennislink.nl.
Ten slotte hebben ook aan het Meertens Instituut (Amsterdam) meer dan honderd vrijwilligers al een paar duizend brieven getranscribeerd (onder leiding van Nicoline van der Sijs). Op de site gekaaptebrieven.nl van het Meertens Instituut zijn die brieven zowel in handgeschreven als in getranscribeerde vorm in te kijken. Ze zijn doorzoekbaar maar niet taalkundig verrijkt.
Meer info: www.brievenalsbuit.nl
Meer info: http://brievenalsbuit.inl.nl/
Meer info: www.gekaaptebrieven.nl
Meer info: http://www.gekaaptebrieven.nl/docs/sanders_bt_ned.pdf
Meer info: www.kennislink.nl/publicaties/nieuwe-vondsten-in-oude-brieven
(dd - 19/9/2013)