Hoe is het nu met Google Books?
Binnenkort doet een Amerikaanse rechtbank over Google Book Search, de boekenzoekmachine van Google. Veel partijen zijn tegen, enkele (zoals gehandicaptenorganisaties en uitgevers die de verkoop nu al zien toe nemen via Google Books) zijn voor en het Amerikaanse ministerie van Justitie heeft de rechter aangeraden om de overeenkomst die Google wil sluiten met auteurs en uitgevers af te keuren.
Google gaat ondertussen met het verspreiden en verbeteren van de ingescande boeken die zich in de boekenzoekmachine bevinden. Het bedrijf heeft een contract gesloten met Cooler Books, een fabrikant van goedkope e-readers. De e-readers van Cooler Books kunnen het open formaat ePub aan. Google heeft onlangs meer dan een miljoen boeken in ePub beschikbaar gemaakt.
Google maakt zijn digitale boeken nu ook fysiek beschikbaar via de Espresso Book Machine van OnDemandBooks. Deze moderne drukpers kan binnen vier minuten een echt boek drukken van een digitaal bestand.
Auteursrechtelijke problemen leveren de nieuwe initiatieven van Google Books niet op omdat het om boeken uit het publieke domein gaat. Deze boeken zijn auteursrechtenvrij en mogen door iedereen gedigitaliseerd, gekopieerd en gedrukt worden.
Google wil het scannen van boeken verbeteren en heeft daarom vorige week het bedrijf ReCaptcha gekocht. ReCaptcha maakt beveiligingssoftware die webloggers, forumbeheerders en webmasters tegen spammers beschermt via de bekende lettercombinaties die internetgebruikers moeten invullen voor ze een reactie mogen plaatsen.
Captcha staat voor completely automated public Turing-test to tell computers and humans apart. Een succesvol ingevulde captcha bewijst dat de reactie afkomstig is van een echt mens en niet van een geautomatiseerd spamsysteem.
Het bedrijf ReCaptcha is een spin-off van een project aan de Carnegie Mellon University’s School of Computer Science. De lettercombinaties die ReCaptcha gebruikt zijn afkomstig uit gescande kranten en oude boeken. Ze dienen niet alleen als spambeveiligingsmethode, maar ook als een leerproces voor computers om in Optical Character Recognition (OCR) gescande teksten te lezen en om te zetten in gewone tekst.
Voor Google is ReCaptcha een interessante aankoop omdat het bedrijf een netwerk van weblogs (Blogger) heeft dat beschermd wordt via captcha’s en een reusachtig corpus ingescande tekst uit krantenarchieven en boeken (Google Books en Google News Archive Search) dat verbeterd kan worden door middel van de techniek van ReCaptcha. De captcha’s van ReCaptcha zullen voortaan bestaan uit woordcombinaties uit teksten die door Google zijn gescand.

AEX: 310,03 


Abonneer je