Met tekstherkenning of OCR (Optical Character Recognition) kan een gescande afbeelding doorzocht worden op tekst. De herkenningssoftware gaat dan na of er in de beeldpunten van het plaatje lettertekens zijn te herkennen.
Chris Riley gaat in Infonomics Magazine in op de vraag of er met de toename in EDI (Electronic Data Interchange) geen sprake is van een afnemende belangstelling voor tekstherkenning en geeft meteen voorbeelden van alternatieve toepassingen van OCR.
Verdwijnt OCR?
Naarmate informatieuitwisseling steeds vaker digitaal plaatsvindt zal er minder behoefte zijn om afbeeldingen van tekst op papier te scannen en vervolgens software in de gedigitaliseerde afbeelding naar tekst te laten speuren. De tekst in een document is bij elektronische uitwisseling immers al digitaal beschikbaar. Kunnen we dan stellen dat OCR op zijn retour is en misschien op termijn wel helemaal zal verdwijnen?
Alternatieve toepassingen
Riley denkt van niet, omdat hij ook allerlei alternatieve toepassingen van OCR ziet die wel degelijk een meerwaarde hebben. Hij somt er een aantal op:
- het vervaardigen en detecteren van virussen en spam
- het migreren van data uit een legacy systeem
- het herkennen van de taal van een document als de taalcodering ontbreekt
- het normaliseren van digitale formaten
- de compressie van bestanden door de pure tekst (ASCII) uit een afbeelding te extraheren
- het lezen van tekst door robots
Meer informatie over de mogelijkheden van OCR: Chris Riley – OCR and Robots?