OCR pdf

Konwersji zeskanowanych dokumentów i obrazów w edytowalne Word, PDF, Excel i TXT (tekst) formatów wyjściowych

Prześlij pliki do rozpoznania lub przeciągnij i upuść je na tej stronie

Wybierz plik

lub przeciągnij i upuść plik

Jak rozpoznać tekst?

Krok 1

Prześlij plik

Musisz najpierw wybrać jakiś plik, co chcesz przekonwertować, możesz go wziąć z komputera, albo z Google Drive albo z Dropboxa, albo po prostu przeciągnąć i upuścić na stronie.

Krok 2

Wybierz język i format wyjściowy

Musisz zaznaczyć wszystkie języki, jakie występują w tym dokumencie. Możesz też wybrać dowolny format, który Ci pasuje na wyjściu, np. .doc albo jeszcze inny format, bo masz do wyboru ponad 10 różnych formatów tekstu. Prosto, prawda?

Krok 3

Konwertuj I Pobierz

No i teraz musisz kliknąć ten guzik 'Rozpoznaj'. A jak już skończy to przetwarzanie, to pobierasz plik z tekstem, który został przetłumaczony.

Optyczne rozpoznawanie znaków

Optyczne rozpoznawanie znaków lub optyczny czytnik znaków (OCR) to taki sposób przetwarzania obrazów, w którym elektronicznie lub mechanicznie zamienia się tekst wpisany, odręczny lub drukowany na kod komputerowy. Można to zrobić na przykład ze zeskanowanego dokumentu, zdjęcia dokumentu, zdjęcia krajobrazu z widocznym tekstem na billboardach lub na tekst napisany na ekranie telewizora.

OCR, czyli optyczne rozpoznawanie znaków, to popularny sposób na digitalizację drukowanych tekstów. Dzięki niemu możemy elektronicznie edytować, przeszukiwać i przechowywać dokumenty takie jak faktury, wyciągi bankowe czy też wizytówki. OCR znajduje też zastosowanie w procesach maszynowych, jak przetwarzanie kognitywne czy tłumaczenie maszynowe. Ta dziedzina badań skupia się na rozpoznawaniu wzorców, sztucznej inteligencji i wizji komputerowej.

Wcześniejsze wersje programów do OCR wymagały szkolenia z obrazów każdego pojedynczego znaku i obsługiwały tylko jedną czcionkę na raz. Jednak teraz zaawansowane systemy potrafią uzyskać wysoki poziom dokładności przy rozpoznawaniu większości czcionek oraz obsługują wiele cyfrowych formatów plików obrazu. Niektóre z tych systemów są nawet w stanie odtworzyć sformatowane dane wyjściowe, które bardzo zbliżają się do oryginalnej strony, włączając w to obrazy, kolumny oraz inne elementy nietekstowe.