Ooit wel eens nagedacht hoe boeken in het publieke domein worden omgezet naar e-books? Ik ook niet hoor. Maar bij het opruimen van links bij Delicious kom ik deze website tegen die ik vorig jaar een keer bewaarde. De site is Distributed Proofreaders. En dit is wat zij doen:
Distributed Proofreaders provides a web-based method to ease the conversion of Public Domain books into e-books. By dividing the workload into individual pages, many volunteers can work on a book at the same time, which significantly speeds up the creation process.
Vrijwilligers die zich hebben aangemeld krijgen een gescande pagina (afbeelding) en de bijbehorende OCR-tekstfile op een webpagina aangeboden. Op deze manier kunnen de vrijwiligers de tekst en de afbeelding met elkaar vergelijken en als deze klopt terugsturen aan de site. Een tweede vrijwilliger controleert dan nogmaals de afbeelding en de tekst. Als alle pagina’s deze stappen zijn doorgelopen wordt het boek als een ebook samengesteld en wordt het aan het Project Gutenberg archief aangeboden. Door de software die gebruikt wordt is het mogelijk dat verschillende mensen tegelijkertijd aan een boek werken waardoor de ebooks sneller beschikbaar komen.
De boeken die deze groep doet zijn allemaal boeken waar geen copyrights meer op zitten. Zij vinden de boeken bij antiquariaten, bibliotheken of mensen sturen de boeken aan hen op. Zij scannen de boeken nadat zij hebben gecontroleerd of deze niet al als ebook bestaan of op het punt staan om in de Gutenberg bibliotheek opgenomen te worden.
Het vreemde is dat deze groep al vanaf 2000 bestaat en dat ik er nog niet eerder van had gehoord. En dat terwijl zij zo goed werk doen. Aanmelden als vrijwilliger kan altijd. Je wordt dan wel aangemoedigd om tenminste een pagina per dag te beoordelen. En je weet natuurlijk niet welk boek je krijgt…