Gemaakt op januari 14, 2010 ¬ 19:30h.Twan van ElkGeen reacties »
Met tekstherkenning of OCR (Optical Character Recognition) kan een gescande afbeelding doorzocht worden op tekst. De herkenningssoftware gaat dan na of er in de beeldpunten van het plaatje lettertekens zijn te herkennen.
Chris Riley gaat in Infonomics Magazine in op de vraag of er met de toename in EDI (Electronic Data Interchange) geen sprake is van een afnemende belangstelling voor tekstherkenning en geeft meteen voorbeelden van alternatieve toepassingen van OCR.
Verdwijnt OCR?
Naarmate informatieuitwisseling steeds vaker digitaal plaatsvindt zal er minder behoefte zijn om afbeeldingen van tekst op papier te scannen en vervolgens software in de gedigitaliseerde afbeelding naar tekst te laten speuren. De tekst in een document is bij elektronische uitwisseling immers al digitaal beschikbaar. Kunnen we dan stellen dat OCR op zijn retour is en misschien op termijn wel helemaal zal verdwijnen?
Alternatieve toepassingen
Riley denkt van niet, omdat hij ook allerlei alternatieve toepassingen van OCR ziet die wel degelijk een meerwaarde hebben. Hij somt er een aantal op:
het vervaardigen en detecteren van virussen en spam
het migreren van data uit een legacy systeem
het herkennen van de taal van een document als de taalcodering ontbreekt
het normaliseren van digitale formaten
de compressie van bestanden door de pure tekst (ASCII) uit een afbeelding te extraheren
Gemaakt op januari 4, 2010 ¬ 21:40h.Twan van ElkGeen reacties »
De Wet van Murphy stelt: Anything that can go wrong will go wrong. Ofwel: als er iets mis kàn gaan, dan zal dat ook zeker gebeuren. Zou het dan niet mooi zijn als er een mechanisme bestond, dat van tevoren zaken die mis kunnen gaan al probeert te uit te sluiten? Zo’n mechanisme bestaat: het wordt aangeduid met het Japanse begrip ‘Poka-yoke’.
Poka-yoke werd begin jaren 60 van de vorige eeuw ontwikkeld door een ingenieur van Toyota, Shigeo Shingo. In eerste instantie werd Poka-yoke geïntroduceerd als Baka-yoke. Baka-yoke betekent in feite ‘iets foolproof maken’. Omdat een dergelijke aanduiding (fool) als beledigend werd ervaren, werd het omgedoopt naar Poka-yoke.
Foutloos
Poka-yoke of ‘iets mistake-proof maken’ houdt in dat je een proces dusdanig inricht, dat je de kans dat er fouten gemaakt worden minimaliseert. Poka-yoke maakt deel uit van het bredere concept Zero Quality Control. Door Poka-yoke-technieken toe te passen om fouten te corrigeren en ‘broncontrole’ toe te passen om fouten al bij voorbaat uit te sluiten, zou je moeten kunnen voldoen aan een kwaliteitsstandaard waarbij fouten simpelweg niet meer voorkomen. Daar waar Poka-yoke wordt toegepast zijn minder vaardigheden vereist en kan er (kosten-) efficiënter en veiliger worden gewerkt.
Poka-yoke wordt niet alleen toegepast in industriële omgevingen, ook in het ontwerp van allerlei min of meer alledaagse zaken wordt van het concept gebruik gemaakt: denk aan het hoekje van een simkaartje. Dat hoekje is eraf gehaald zodat je dat kaartje er maar op één manier in kunt steken. Ander voorbeeld: een usb-stekkertje kan door zijn vorm niet verkeerd ingestoken worden. Ook in het ontwerp van (grafische) interfaces kan het concept worden ingezet om fouten te voorkomen.
Gemaakt op januari 3, 2010 ¬ 00:24h.Twan van Elk1 reactie »
In de praktijk (en de marketing) worden backup en archief nog wel eens door elkaar gehaald. Beiden zijn belangrijke begrippen in het beheer van de informatie van een organisatie, maar dienen verschillende doelen en verlopen verschillend qua proces.
Helen Streck legt op de site van de AIIM (Association for Information and Image Management) naar mijn mening helder uit, wat de verschillen tussen het maken van een backup en het archiveren van data zijn. Zij verbindt daaraan een pleidooi om het overleg tussen de afdelingen RIM (Records and Information Management) en ICT vanuit duidelijke uitgangspunten ten aanzien van de begrippen te voeren.
Backup
Een backup is een één-op-één kopie van een systeem, toepassingen en data. De informatie in een backup wordt in principe niet geïndexeerd, niet ontsloten. Je maakt de backup om in een geval van een nood (verlies of het corrupt raken van data) een recente versie van systeem, toepassingen of data terug te kunnen zetten.
Archief
Het archiveren houdt het verplaatsen van data op de productieomgeving naar een andere (fysieke) locatie in. Dat doe je op een moment dat deze data niet meer ‘in beweging’ is, niet meer actief wordt gewijzigd of gebruikt. Op die manier kan de productieomgeving optimaal ingezet worden voor de huidige bedrijfsvoering. Inactieve data wordt in het archief op de juiste manier en gedurende de juiste termijn bewaard en ontsloten.
Het gescheiden houden van de backup- en archiefprocessen brengt een aantal voordelen met zich mee: het is beter mogelijk om aan de eisen van tijdigheid, betrouwbaarheid en volledigheid te voldoen; en het brengt een grotere efficiëntie met zich mee doordat opslag beter benut kan worden en informatie sneller kan worden achterhaald.
Meer over de verschillen tussen backup en archief:
Gemaakt op januari 2, 2010 ¬ 08:24h.Twan van Elk3 reacties »
Af en toe laat ik me verrassen door een compleet andere kijk op zaken. Ik denk dat het kan helpen om je zo te laten verrassen, dat je er door kunt leren hoe je problemen vanuit onconventionele gezichtspunten kunt bekijken.
Op Loosely Assembled, het weblog van Fe Kaylius, kwam ik zo’n andere kijk op zaken tegen, in de YouTube-video van Derek Sivers die Fe op zijn blog toont.
Straatnamen
In Nederland hebben we de gewoonte straten een naam of nummer te geven. Wist ik ook niet, maar het schijnt zo te zijn dat in Japan straatnamen niet bestaan. In plaats daarvan benoemen of nummeren de Japanners het blok waar de straten omheen liggen. De straten zijn de lege banen om de huizenblokken heen.
Ook de manier waarop huisnummers worden toegekend in Japan is een andere dan wij in Nederland gewend zijn. Het eerst gebouwde huis in een Japans huizenblok krijgt namelijk nummer 1, het volgende huis wat wordt gebouwd krijgt nummer 2 en zo verder. Dat tweede huis kan daarbij best aan de andere kant van het blok liggen, dat maakt niet uit.
De komende tijd zal ik op mijn weblog regelmatig aandacht besteden aan niet-Westerse, ongebruikelijke of creatieve manieren om naar zaken te kijken.