Tothom hem fet servir alguna vegada la tecnologia OCR (reconeixement òptic de caràcters). Els que fem servir escàners des de fa anys sabem a què ens referim: a aquells programes que ens permetien passar a text “viu” els documents escanejats, amb més o menys eficàcia.
Avui podem tornar a fer servir aquesta tècnica sense instal·lar cap aplicació. A Internet existeixen utilitats que ens permeten adjuntar arxius amb text escanejat o fotografiat i ens el tornen en format editable. Hem triat tres serveis, tots gratuïts i sense necessitat de cap registre, i els hem provat.
Les proves les hem fet amb aquesta imatge escanejada de la primera pàgina d’un Robinson Crusoe.
- NewOCR. Reconeix arxius JPEG, PNG, GIF, BMP, TIFF i PDF de múltiples pàgines, fins a 5 MB. Admet diferents idiomes i pot retornar el text en un document de MSWord. El resultat ha estat prou acceptable.
- Free-OCR. Reconeix arxius JPG, GIF, BMP, TIFF i PDF d’una sola pàgina, fins a 2 MB. Admet diferents idiomes i està limitat a 10 arxius per hora. El resultat ha estat molt similar a l’anterior.
- Online OCR. El servei gratuït és molt més escàs en possibilitats que els anteriors, però ofereixen també un servei de pagament que proporciona una gran quantitat de possibilitats: adjuntar múltiples documents d’una vegada, discriminació d’imatges i text, històric de les feines, etc. Nosaltres hem provat el servei gratuït, i és el que ha tornat el resultat més acurat de tots.
Tot i que els serveis són similars pot ser útil fer proves amb més d’un, ja que cada arxiu original pot tenir particularitat que provoquin diferències als resultats. Si els proveu, ja ens explicareu com us ha anat.