Digitalisering van de boeken van de Meesters
Waarom digitaliseren?

Wereldwijd worden in deze tijd miljoenen boeken gedigitaliseerd. Een gerenommeerde instantie als de Koninklijke Bibliotheek in Nederland gaat zelfs zover dat ze hiervoor boeken stuksnijdt: de rug van het boek wordt afgesneden omdat de bladzijden losliggend sneller en mooier gedigitaliseerd kunnen worden. Deze vernieling van het oorspronkelijke boek past de Koninklijke Bibliotheek alleen toe als ze minstens twee originele exemplaren hebben, zodat er één ongehavend bewaard kan worden. Maar de filosofie is duidelijk: beter een goed gedigitaliseerd boek dan een goed bewaard niet-gedigitaliseerd boek.
Waarom is het digitaliseren zo belangrijk en wat houdt het precies in? De eerste stap in het digitaliseringstraject is het scannen van alle bladzijden van een boek. De scanner neemt een digitale 'foto' van de bladzijde, en die foto wordt als een digitaal bestand opgeslagen. Deze stap is vooral belangrijk voor het bewaren van de informatie die aan het papier is toevertrouwd. Papier en inkt hebben immers maar een beperkte levensduur. En nog kritieker: door brand, overstroming, diefstal of andere onvoorziene omstandigheden kan een hele collectie waardevol materiaal onherstelbaar vernietigd worden. Een digitaal bestand daarentegen kan heel eenvoudig gekopieerd op verschillende beveiligde plaatsen bewaard worden. Geen houtworm kan het digitaal bestand aantasten, geen brand kan het enige exemplaar vernietigen. Bibliotheken en wereldorganisaties zien de digitalisering dan ook als het veilig stellen van het (papieren) cultureel erfgoed uit de wereldgeschiedenis.
Naast het bewaren is het beschikbaar stellen de tweede belangrijke drijfveer achter de wereldwijde digitaliseringsprojecten. Een digitaal bestand kan via internet aan alle geïnteresseerden beschikbaar gesteld worden. Wanneer de scans op een website geplaatst worden, kan men van overal in de wereld via de computer het boek digitaal 'doorbladeren', lezen en bestuderen.
Wanneer het lezen niet voldoende is, maar indien het ook gewenst is om de tekst te kunnen doorzoeken via de computer met een zoekterm, dan wordt het boek bovendien door de 'tekstherkenningssoftware' gehaald: het gespecialiseerde computerprogramma probeert de tekst van de foto te herkennen en om te zetten in digitale tekst. Op deze wijze probeert de computer dus het boek te lezen, zodat de bladzijde niet alleen als foto in de computer staat, maar dat de tekst op die bladzijde ook als tekst in de computer komt, met alle zoek- en bewerkingsmogelijkheden die daarbij horen. Omdat de computer nog niet 'perfect' is in het herkennen, komt hier ook nog 'handarbeid' aan te pas om scanfouten te corrigeren en andere problemen bij het interpreteren van de tekst op te lossen. Soms moet men zelfs een heel boek overtypen, omdat de computer de afwijkende zetletters die soms door drukkers vroeger werden gebruikt niet kan herkennen.