Massadigitalisering

Afgelopen donderdag (8 juni) was er in Leiden een symposium over het gebruik van elektronische teksten in de neerlandistiek. Ik vond het – om uiteenlopende redenen – een interessante bijeenkomst.


In de eerste plaats omdat er een aantal websites werden genoemd die ik nog niet kende. Zo vertelde Ton Harmsen, docent Nederlands aan de Leidse Universiteit, over Ceneton, een website waarop uiteindelijk alle handschriften en edities van Nederlandse toneelstukken tot 1803 komen te staan. Er staan nu al uitgebreide titelbeschrijvingen op van maar liefst 10.600 toneelstukken, de complete teksten van ruim tachtig oude toneelstukken, plus nog eens 105 toneelteksten in facsimile. Ik voel me altijd een beetje betrapt als ik op een website word gewezen die ik allang had moeten kennen, maar hé, het is gewoon niet meer bij te houden.
Erg leerzaam was ook wat Harmsen vertelde over de automatiseringafdeling van de Leidse universiteit. Op een gegeven moment kreeg hij een mailtje dat al zijn pagina’s – lees: heel Ceneton – van de oude server zouden worden verwijderd, omdat er een nieuwe server was aangeschaft. Harmsen kon Ceneton veiligstellen door het zelf, vanaf zijn eigen pc, op de nieuwe server te zetten, maar je schrikt toch wel als je hoort hoe kwetsbaar digitale informatie is.
Het leerzaamst vond ik echter dat zo duidelijk bleek dat allerlei instellingen ijverig bezig zijn met hun eigen projecten, maar dat het belang van de gebruiker daarbij niet op de eerste plaats staat.
Want wat is het belang van degenen die op internet onderzoek doen naar de Nederlandse taal- en letterkunde? Dat zij op zo weinig mogelijk plaatsen hoeven te zoeken, het allerliefst slechts op één plaats, een centrale toegangspoort tot een berg aan geordende informatie. Nu zijn alleen al op een overzichtswebsite van de Opleiding Nederlands van de Leidse universiteit zo’n duizend hyperlinks te vinden. En er zijn, nationaal en internationaal, tientallen vergelijkbare overzichtsites, inhoudelijk allemaal verschillend. Iedereen beheert zijn eigen tuin en zijn eigen pot met geld, met als gevolg dat het voor studenten en onderzoekers onmogelijk is geworden om – zelfs op dit relatief kleine vakgebied – door de bomen het bos te zien.
Waar beginnen de meeste studenten en onderzoekers op dit gebied nu? Bij de Digitale Bibliotheek voor de Nederlandse Letteren (www.dbnl.org). Op die website, waaraan sinds eind 1999 wordt gewerkt, staan momenteel 350.000 pagina’s uit primaire en secundaire bronnen over de Nederlandse taal- en letterkunde. Dat lijkt veel, en ik ben een dankbare gebruiker van de DBNL, maar afgelopen vrijdag vertelde René van Stipriaan, een van de zes medewerkers van deze digitale goudmijn, dat met die 350.000 pagina’s slechts één procent van de Nederlandse letterkunde is gedigitaliseerd. Van Stipriaan schat dat er nog zo’n 25 miljoen pagina’s te gaan zijn.
Slechts één procent in ruim vijf jaar tijd! Vergelijk dat eens met de zes miljoen Engelstalige boeken – geen pagina’s maar boeken! – die Google de komende drie jaar op internet gaat zetten. En Google is slechts een van de partijen die in het Engelse taalgebied zijn begonnen met massadigitalisering. Bedenk eens wat dit alles betekent voor de positie van het Nederlands op internet!
Het is volstrekt duidelijk wat ons te doen staat: massadigitalisering. Maar ja, de DBNL krijgt per jaar slechts 288.000 euro subsidie van de Taalunie, en de vorige Algemeen Secretaris van die instelling heeft bepaald dat dit alleen mag worden besteed aan historische letterkunde, en niet aan historische taalkunde. Om knettergek van te worden! Gelukkig lijkt het begin van een oplossing in zicht. (Wordt vervolgd)

Ewoud Sanders


Dit bericht heeft 2 reacties op “Massadigitalisering”

  1. G.J. Stemerdink zegt:

    Lang geleden heeft Hugo Brandt Corstius eens verzucht dat de computer voor de alfa-wetenschappen twee eeuwen te vroeg is gekomen en voor de beta’s twee eeuwen te laat…

  2. Joris van Zundert zegt:

    Een kleine zeurkouzige verbetering: de bijeenkomst was op donderdag 8 juni.

    Belangrijker is dat het een idee fix is dat een organisatie of instelling de ultieme portal site voor de Neerlandistiek zal bouwen. Met de middelen die over het algemeen voorhanden zijn kan dat natuurlijk niet. Wat wel kan is een zoekmachine bouwen die het internet afgraast op zoek naar alle bronnen die iets met Neerlandistiek te maken hebben, zeg maar een Google-Neerlandistiek. Helaas stuiten dergelijke voorstellen binnen de Neerlandistiek zelf atijd op ergerlijk traditionele tegengeluiden als zou zoiets geen kwaliteit kunnen bieden.

Reageren op dit bericht is niet meer mogelijk.