OCR är de med optisk teckenigenkänning eller även kända på spanska som optisk teckenigenkänning. OCR är en programvara som möjliggör textigenkänning, producerar en bild av den för att förvandla den till en följd av tecken och sedan spara dem i ett visst format som kan användas i dessa textredigeringsprogram. Med andra ord, tack vare denna nya teknik kan alla typer av text eller dokument, inklusive PDF-filer, skannade papper eller till och med bilder som tas från digitala kameror, konverteras till data för att kunna redigeras.
Denna programvara fungerar på följande sätt, först analyserar den varje del av bilden i det aktuella dokumentet; distribuera sidan i delar såsom tabeller, bilder, textblock bland andra; sedan fördelas raderna i ord för att senare bli tecken; och eftersom karaktärerna redan har angivits gör programvaran jämförelsen med en grupp bilder av mönstret. Detta går enligt hypoteserien om vad varje karaktär är; och baserat på dessa hypoteser analyserar den de olika varianterna av att bryta linjer i ord och ord till tecken. Och det är efter ett stort antal analyser och bearbetning av hypoteserna att programmet äntligen presenterar texten som redan har erkänts och omvandlats med ett nytt format.
Det bör noteras att det idag finns ett antal program som datormarknaden erbjuder baserat på OCR som OmniPage, Abbyy Fine Reader eller READiris. YY som har förmågan att inte bara analysera och känna igen en text som sådan utan också känna igen format och stil, men med vissa begränsningar, vilket kräver att texten, efter att ha analyserats, redigeras för att göra de justeringar som är behöva.