Az optikai karakterfelismerés vagy az optikai karakterolvasó, amelyet gyakran rövidítettek OCR-ként, a gépelt, kézzel írt vagy nyomtatott szövegek gépi kódolású, mechanikus vagy elektronikus átalakítása, akár beolvasott dokumentumból, akár egy dokumentum fotójából, egy jelenetfotóból (például a tájképen lévő jelzéseken és hirdetőtáblákon található szöveg), vagy a feliratú szöveg egy képben (például egy televíziós műsorból) .
Széles körben használják a nyomtatott papíradatbázisok információs bejegyzését – legyen az útlevél, számlák, bankszámlakivonatok, számítógépes bevételek, névjegykártyák, levelek, statikus adatok kinyomtatása vagy bármilyen megfelelő dokumentáció – ez a nyomtatás általános digitalizálásának módja. szövegeket úgy, hogy azok elektronikusan szerkeszthetők, kereshetők, kompaktabban tárolhatók legyenek, megjeleníthetők on-line módon, és olyan gépi folyamatokban használhatók, mint a kognitív számítástechnika, a gépi fordítás, a (kivont) szöveg-beszéd, kulcsadatok és szövegbányászat.
Az OCR a mintafelismerés, a mesterséges intelligencia és a számítógépes látás kutatási területe. A korai verziókat minden karakter képével kellett képezni, és egyszerre egy betűtípussal kellett dolgoznia.
Jelenleg gyakoriak a fejlett rendszerek, amelyek nagyfokú felismerési pontosságot képesek előállítani a legtöbb betűtípus esetében, és számos digitális képfájlformátum bemenet támogatásával.
Néhány rendszer képes formázott kimenet reprodukálására, amely szorosan közelíti az eredeti oldalt, beleértve a képeket, oszlopokat és más nem szöveges összetevőket is.
Típusai
Optikai karakterfelismerés (OCR) – egyszerre írja be a gépelt szöveget, egy karakterjelet vagy karaktert.
Az optikai szófelismerés – a géppel írott szöveget, egy szóval egyidejűleg célozza (olyan nyelvek esetében, amelyek szóközként szóközt használnak). (Általában csak „OCR” -nek
hívják.)
Az intelligens karakterfelismerés (ICR) – a kézírásos nyomtatványok vagy a kurzív szövegek egy-egy karakterjelet vagy karaktert is egyidejűleg céloz, általában gépi tanulással.
Az intelligens szófelismerés (IWR) – a kézírásos nyomtatványra vagy a kurzív szövegre, egy szóval egyidejűleg is céloz. Ez különösen hasznos olyan nyelvek esetében, ahol a
karakterjelek nincsenek elkülönítve kurzív szkriptben. Az OCR általában „offline” folyamat, amely statikus dokumentumot elemez. A kézírás-mozgáselemzés használható a kézírás-felismerés beviteléhez. Ahelyett, hogy pusztán a karakterjelek és szavak alakjait használná, ez a technika képes rögzíteni mozgásokat, mint például a szegmensek rajzolásának sorrendjét, az irányt és a toll elhelyezésének és felemelésének mintáját. Ez a további információ pontosabbá teheti a végpontok közötti folyamatot. Ezt a technológiát „on-line karakterfelismerés”, „dinamikus karakterfelismerés”, „valós idejű karakterfelismerés” és „intelligens karakterfelismerés” néven is ismert.
Alkalmazások
Az OCR-motorokat sokféle tartományspecifikus OCR-alkalmazásra fejlesztették ki, például az OCR-t, az OCR-t, az OCR-t, az OCR-t, a jogi számlázási dokumentum OCR-t.
Ezek felhasználhatók:
- Adatbevitel üzleti dokumentumokhoz, pl. csekk, útlevél, számla, bankszámlakivonat és átvétel
- Automatikus számlapok felismerése
- A repülőtereken az útlevél-elismerés és az információszedés
- Az automatikus biztosítási dokumentumok kulcsfontosságú információk kivonása
- Névjegykártya-információk kinyerése a névjegyzékbe
- Gyorsabban készíthet nyomtatott dokumentumok szöveges változatait, pl. könyvolvasás a Project Gutenberg számára
- A nyomtatott dokumentumok elektronikus képeit kereshetjük, pl. Google Könyvek
- A kézírás valós idejű konvertálása számítógép vezérléséhez (tollszámítás)
- A CAPTCHA anti-bot rendszerek legyőzése, bár ezek kifejezetten az OCR megakadályozására szolgálnak.
- Segítő technológia vakok és gyengénlátók számára