Jak to zrobić

Skanowanie dokumentów w celu konwersji na dane tekstowe (OCR)

Poprawianie rozpoznawania znaków
Potencjalne problemy podczas rozpoznawania tekstu

Dokumenty można skanować i konwertować na dane tekstowe, a następnie edytować te dane w aplikacji do edycji tekstów. Technologia umożliwiająca komputerom „czytanie” tekstu z obiektów fizycznych nosi nazwę OCR. Technologia OCR wymaga graficznej postaci tekstu do interpretacji, zwykle pochodzącej ze skanowanego obrazu.

Wykonaj wszystkie kroki opisane w sekcji Tekst i grafika liniowa.

Zaimportuj zeskanowany obraz do oprogramowania OCR.

Poprawianie rozpoznawania znaków

Za pomocą suwaka Threshold (Próg) można zmieniać wartość progową, sprawdzając efekt tej zmiany w oknie Preview (Podgląd). Dostosowanie wartości progowej może ułatwić rozpoznawanie znaków przez program OCR.

Uwaga:
Ustawienie Threshold (Próg) jest dostępne tylko wtedy, gdy ustawieniem opcji Image Type (Typ obrazu) jest Black&White (Czarno-biały).


[Góra]

Potencjalne problemy podczas rozpoznawania tekstu

Jakość tekstu w oryginalnym dokumencie ma znaczący wpływ na wyniki rozpoznawania przez program OCR.

Poniższe typy oryginałów mogą utrudniać rozpoznawanie tekstu i należy ich w miarę możliwości unikać:

Należy pamiętać, że oprogramowanie OCR nie rozpoznaje pisma odręcznego.


[Góra]


Poprzedni

Następny