Útmutató

Dokumentumok beolvasása és szöveggé alakítása (OCR)

A karakterfelismerés javítása
Az esetleges szövegfelismerési problémák

Lehetoség van a beolvasott dokumentumok szöveggé alakítására, és szövegszerkeszto programmal való szerkesztésére. OCR-nek, illetve optikai karakterfelismerésnek nevezzük azt a technológiát, amellyel a számítógépek "el tudják olvasni" a fizikai objektumokon látható szöveget. Az optikai karakterfelismeréshez szükség van a szöveg grafikus leképezésére, ami általában lapolvasóval történo beolvasásból származik.

Kövesse a Szöveg és vonalrajz témakörben leírtakat.

Importálja be a beolvasott képeket az OCR programba.

A karakterfelismerés javítása

A Threshold (Küszöbérték) csúszka elmozdításával módosítsa a küszöbértéket, a módosítás eredményét pedig kövesse figyelemmel az Elokép ablakban. A küszöbérték helyes módosításával megkönnyítheti az OCR programnak a karakterfelismerést.

Megjegyzés:
A Threshold Küszöbérték) csúszka csak akkor használható, ha az Image Type (Képtípus) beállítása Black&White (Fekete-fehér).


[A lap tetejére]

Az esetleges szövegfelismerési problémák

Az optikai karakterfelismerés eredményét nagyban befolyásolja az eredeti dokumentum szövegének minosége.

A következo típusú dokumentumok felismerése meglehetosen nehéz, ha lehet, el kell kerülni a használatukat:

Ne feledje, hogy az OCR szoftver nem képes a kézzel írt szöveg felismerésére.


[A lap tetejére]


Elozo

Következo