OCR pdf
Konwersji zeskanowanych dokumentów i obrazów w edytowalne Word, PDF, Excel i TXT (tekst) formatów wyjściowych
Jak rozpoznać tekst?
Prześlij plik
Wybierz język i format wyjściowy
Konwertuj I Pobierz
Optyczne rozpoznawanie znaków
Optyczne rozpoznawanie znaków lub optyczny czytnik znaków (OCR) to taki sposób przetwarzania obrazów, w którym elektronicznie lub mechanicznie zamienia się tekst wpisany, odręczny lub drukowany na kod komputerowy. Można to zrobić na przykład ze zeskanowanego dokumentu, zdjęcia dokumentu, zdjęcia krajobrazu z widocznym tekstem na billboardach lub na tekst napisany na ekranie telewizora.
OCR, czyli optyczne rozpoznawanie znaków, to popularny sposób na digitalizację drukowanych tekstów. Dzięki niemu możemy elektronicznie edytować, przeszukiwać i przechowywać dokumenty takie jak faktury, wyciągi bankowe czy też wizytówki. OCR znajduje też zastosowanie w procesach maszynowych, jak przetwarzanie kognitywne czy tłumaczenie maszynowe. Ta dziedzina badań skupia się na rozpoznawaniu wzorców, sztucznej inteligencji i wizji komputerowej.
Wcześniejsze wersje programów do OCR wymagały szkolenia z obrazów każdego pojedynczego znaku i obsługiwały tylko jedną czcionkę na raz. Jednak teraz zaawansowane systemy potrafią uzyskać wysoki poziom dokładności przy rozpoznawaniu większości czcionek oraz obsługują wiele cyfrowych formatów plików obrazu. Niektóre z tych systemów są nawet w stanie odtworzyć sformatowane dane wyjściowe, które bardzo zbliżają się do oryginalnej strony, włączając w to obrazy, kolumny oraz inne elementy nietekstowe.