FineReader 4 Sprint - Test programu
Mon, 1 July 2002
Wstęp
Zgadnijcie o czym będzie??? Tak, o wersji 4.0 programu OCR, ABBYY FineReader 4.0 Sprint. Ogólnie już na wstępie chciałbym zauważyć, że osobiście uważam ów program za drugorzędny, po Recognicie. Ale nie o tym miała być tutaj mowa. FineReader 4.0 to program przeznaczony nie tylko dla biur i pracowni informatycznych. Został on także udostępniony domowym użytkownikom. Każdy kto posiada skaner, może z niego skorzystać. Obecna wersja posiada wiele udogodnień, niemniej jednak nie jest rozbudowana aż tak jak 5.0 z którą zdążyłem się ostatnio zetknąć. Niestety nie posiadam Full'a 5'tki, dlatego zajmiemy się czwórką.
Ogólnie o programie
Jak już wspomniałem wiele użytecznych funkcji ułatwia nam pracę. Wersja (4.0) umożliwia:
- Rozpoznawanie tabel
- Rozpoznawanie tekstu w 53 językach!!!
Afrykanerski, Albański, Angielski, Baskijski, Białoruski, Bretoński, Bługarski, Chorwacki, Czeczeński, Czeski, Duński, Duński (Belgia), Estoński, Fiński, Francuski, Grecki, Hawajski, Hiszpański, Holenderski, Indonezyjski, Irlandzki, Isladzki, Kabardia, Kataloński, Litewski, Macedoński, Moaryjski, Młodawski, Niemiecki, Niemiecki (nowa pisownia), Norweski, Norweski (Bokmar), Norweski (Nynorsk), Osecki,Polski, Portugalski, Portugalski (Brazylia), Retroromański, Rosyjski, Rumuński, Samoański, Serbski, Swahili, Szwedzki, Słowacki, Sloweński, Tagalog, Tatarski (Krym), Turecki, Ukraiński, Włoski, Węgierski, Fiji, Łacina, Łotewski, a także cyfry. - Kompatybilność ze standardem TWAIN.
- Skanowanie i rozpoznawanie za “jednym kliknięciem myszy”.
- Możliwość samodzielnego skanowania przy własnych ustawieniach rozdzielczości i jasności.
- Możliwość ręcznego uruchomienia procesu rozpoznawania.
- Możliwość ręcznego zaznaczania obszarów.
- Przeglądanie efektów rozpoznawania.
- Zaznaczenie kolorem niepewnie rozpoznanych znaków.
- Zapisywanie efektów rozpoznawania w plikach TXT i RTF.
- Możliwość wysłania efektów rozpoznawania do aplikacji MS Word, Word Pro, WordPerfect, MS Excel.
- Możliwość przetwarzania wielu obrazków.
Rozpoznawanie
Cały proces sprowadza się do uruchomienia programu i kliknięciu
jednego przycisku (Skanuj&Czytaj) i to wszystko. Skanujemy w ten sposób
nasz dokument, po czym program rozpoznaje znaki i konwertuje wszystko na formę
tekstową.
Bardzo fajną rzeczą jest zmiana koloru niepewnie "przetłumaczonego"
wyrazu. Jeśli program nie jest "pewien" czy dany wyraz wyglądać ma
tak, czy inaczej, wówczas zmienia jego kolor na zielony (szczerze mówiąc
jeszcze nie znalazłem opcji umożliwiającej wyłączenie tego triku :)
Przycisk "Skanuj" umożliwia nam zeskanowanie dokumentu, bez jego
rozpoznawania.
Efekty rozpoznawania tekstu możemy zapisać do pliku *.txt lub *.rtf lub
wyeksportować do Word'a, Excel'a, WordPro, WordPerfect.
Jeżeli posiadamy dokument z grafiką, program powinien sobie poradzić. Cwaniak
rozróżnia grafikę od tekstu, nie dość, ponadto zamieszcza ją jeszcze w
naszym dokumencie w postaci elektronicznej.
Proces rozpoznawania przebiega bardzo szybko, zwykle jedna strona zostaje
skonwertowana w przeciągu zaledwie 8 sekund. Więc już po 8'śmiu sekundach
mamy gotowy dokument do zapisu.
Jak każdego innego, FinReader'a nie omijają błędy. Stronę demonstracyjną,
zawierającą tebelę, tekst i grafikę przeczytał szybko, ale z błędami.
Zawsze po takim procesie powinniśmy przenieść dokument do Word'a i poprawić
w nim błędy.
Co udało mi się zauważyć, strony pełne tekstu np. książki czyta sprawnie,
szybko i dosłownie.... prawie bezbłędnie :) Na jedną stronę przypada średnio
1 błąd w rozpoznaniu.
Poniżej znajdziesz wynik pracy rozpoznawania części strony demonstracyjnej.
Zauważ, że wystąpiły na niej błędy.
P rzez długi czas zastanawiano się jak nauczyć maszynę umiejętności człowieka - a konkretnie jak stworzyć maszynę zdolną czytać tekst. W ciągu ostatnich 50 lat to marzenie zaczęło stawać się rzeczywistością. Rozpoznawanie pisma jest jednym z kluczowych problemów AI1. Istnieje rozwiązanie bliskie ludzkiej umiejętności czytania - z użyciem zasad rozpoznawania obrazu przez organizmy żywe. Jest to metoda technologia adaptacyjnej percepcji celowościowej.
Taki tekst da się jednak odczytać. Sprawdzimy teraz jak program FineReader poradzi sobie z książką (a bliżej z fragmentem QuoVadis :)
przybyciem poczęto znów sobie szeptać, że jednak nastąpi zapewne coś nadzwyczajnego, gdyż Neronowi prócz Tygellina i Watyniusza towarzyszył Kasjusz, centurion olbrzymiej postawy i olbrzymiej siły, którego cezar brał z sobą tylko wówczas, gdy chciał mieć przy boku obrońcę, na przykład gdy przychodziła mu ochota do nocnych wypraw na Suburę, gdzie urządzał sobie zabawę zwaną sagatio, polegającą na podrzucaniu w górę na wojskowym płaszczu napotykanych po drodze dziewcząt. Spostrzeżono także, że w samym amfiteatrze zostały przedsięwzięte pewne środki ostrożności. Straże pretoriańskie powiększono, komendę zaś nad nimi miał nie centurion, ale trybun Subriusz Flawiusz, znany dotychczas ze ślepego przywiązania do Nerona. Zrozumiano wówczas, że cezar pragnie się na wszelki wypadek ubezpieczyć przed wybuchem rozpaczy Winicjusza, i ciekawość wzrosła jeszcze bardziej. Wszystkie spojrzenia zwracały się z natężonym zajęciem na miejsce, na którym siedział nieszczęsny oblubieniec. On zaś blady bardzo, z czołem pokrytym kroplami potu, niepewny był jak i inni widzowie, ale zaniepokojony do ostatnich głębin duszy. Petroniusz, sam nie wiedząc dokładnie, co nastąpi, nie powiedział mu nic, tylko zapytał go, wróciwszy od Nerwy, czy gotów jest na wszystko, a następnie, czy będzie na widowisku. Winicjusz odpowiedział na oba pytania: „Tak!", ale przy tym mrowie przeszło mu przez całe ciało, domyślił się bowiem, że Petroniusz nie pyta bez przyczyn. Sam on żył już od niejakiego czasu jakby tylko półżyciem, sam pogrążył się w śmierci i zgodził się na śmierć dla Ligii, miała ona bowiem być dla nich obojga zarazem wyzwoleniem i ślubem, ale teraz poznał, że inna rzecz jest myśleć z daleka o ostatniej chwili jak o spokojnym zaśnięciu, a inna pójść patrzeć na męczarnie istoty droższej nad życie. Wszystkie dawniej przebyte bóle odezwały się w nim na nowo. Uciszona rozpacz poczęła znów krzyczeć w duszy, ogarnęła go dawna chęć ratowania Ligii za wszelką cenę. Od rana chciał się dostać do cuniculów, by się przekonać, czy Ligia w nich się znajduje, ale straże pretoriańskie pilnowały wszystkich wejść i rozkazy były tak surowe, że żołnierze, nawet znajomi, nie dali się zmiękczyć ni prośbą, ni złotem. Winicjuszowi wydawało się, że niepewność 541
Jak widać rozpoznawanie przebiegło prawie bezbłędnie. Wyrazy
pogrubione to słowa, których program nie był pewien/ lub które
nie występują w jego słowniku. Jednak wszystkie odczytał prawidłowo.
Dla kogo?
Jeśli dużo dokumentów przepisujesz na formę elektroniczną ten program jest właśnie dla Ciebie. Jednak jeśli są to dokumenty napisane ręcznie, są marne szansę powodzenia. Tekst napisany ręcznie udało mu się odczytać następująco:
Oryginał:To jest tekst napisany ręcznie. :)Rozpoznane:
To ieot któ nzoiptóci^u^ '^Cwu(,Nigdy nie umiałem ładnie pisać... ;)
Zakończenie
Dość już wynudziłem więc kończę wypociny. Jeśli macie jakieś pytanka, ślijcie je na adres: lukas.home.page@gmail.com . To w zasadzie wszystko. Dodam jeszcze, że wersja "Sprint" nie ma zbyt rozwiniętych możliwości konfiguracyjnych, a dokładniej prawie w ogóle nie można nic skonfigurować. Dla większych zapaleńców polecam wersję Office 5.0.




