Optikai karakterfelismerő
Abbyy FineReader OCR 9.0 Professional
A FineReader 9.0 szövegfelismerő (OCR) szoftver hazai bevezetése kapcsán tartott előadásokat az ABBYY Software House.
A nemrég megjelent magyar szoftverrel Budapesten ismerkedhetett meg a szakmai közönség. Az előadásokat a magyar képviselet, a Licencia Kft. két disztributorral (SVED Zrt. és Szervizpark Kft.) együttműködve rendezte meg. Az előadások súlyponti témája a 9.0 verzióban megjelent technológiai újítás, az ADRT (Adaptív Dokumentum Felismerési Technológia) volt. A piacvezető optikai karakterfelismerő programok ma már mind kielégítő szintet érnek el a felismerésben, és hathatósan alakítják át szerkeszthető szöveggé a beszkennelt dokumentumokat. Ez sok más extra mellett már a FineReader előző kiadásait is jellemezte, így az új verzióra nézve az a kérdés merült fel bennünk, hogy vajon mit lehetett még beletenni egy OCR-alkalmazásba.
Minthogy a felismerés pontosságán mindig lehet javítani, a gyártó adatai szerint a FineReader 9-es 35 százalékkal pontosabb. Különösen akkor javul a pontosság, ha digitális kamerával fotózott dokumentumot olvastatunk el, illetve táblázatot vagy jogi szöveget tartalmaznak az oldalak. Valóban, jó eredményt ad a program akár faxok felismerése során vagy gyenge minőségű képek esetében is. A helyzet azonban az, hogy ebben az irányban olyan sokkal tovább nem vezet út, hiszen a legtöbb irodai dokumentum megfelelően olvasható: valami más hiányzik ahhoz, hogy jobban menjen a munka.
Abbyy FineReader OCR 9.0 Professional
• Adatok:- Optikai karakterfelismerés
- 179 nyelv támogatása, beépített helyesírás-ellenőrzés 36 nyelven
- Automatikus nyelvfelismerés
- Gyenge minőségű szövegek felismerése
- Digitális fényképezőgéppel rögzített dokumentumok értelmezése
- Többoldalas dokumentumok folytonos logikai struktúraként való kezelése
- DOCX, XLSX és XPS formátumok támogatása
- Magyar nyelvű felület
- Magyar nyelvű helyesírás-ellenőrző
• Forgalmazó: Licencia Kft.
• Ár: 36 000 Ft
• Értékelés: 8
Gyakorlatilag egy szinttel magasabb célt tűztek ki maguk elé a FineReader fejlesztői. A program új verzióját - habár OCR-nek, azaz optikai karakterfelismerőnek hívják - célszerűbb lett volna optikai oldal- vagy még inkább dokumentumfelismerőnek nevezni. Mivel a napi munkában a szöveg begépelése mellett a szövegblokkok, a sor- és oldalszámozás, valamint a formázás helyreállítása is igen sok időt vehet el, ezért ebben az irányban lépett nagyot előre a program, bevezetve az ADRT (Adaptive Document Recognition Technology, adaptív dokumentumfelismerési technológia) módszert. Az elegáns hangzású fejlesztés lényege, hogy a program nem szövegorientáltan kezeli a beolvasottakat, hanem mint egybefüggő dokumentumot dolgozza fel az oldalak sorát. Ennek megfelelően felismeri, és a végeredményben is megtartja az anyag logikai formátumát, azaz a sorszámozásokat, listákat, fej- és lábléceket, lábjegyzeteket, a hasábokat, szövegdobozokat és a szövegfolyamot, továbbá természetesen a különféle illusztrációkat, képeket is, aláírással együtt. Továbbfejlesztették a táblázatok felismerését, ily módon azok könnyebben szerkeszthetők Wordben, illetve Excelben. Még a betűtípusok "utánzására" is jobban ügyel a program.
Számos OCR-alkalmazás képes az eredetihez megjelenésében közel álló dokumentumok készítésére (kereshető PDF), a FineReaderrel azonban ezt követően is könnyebb a munka. Az eddigieknél egyszerűbben továbbfeldolgozható és -szerkeszthető anyagot szolgáltat. Természetesen automatikusan nem ad mindig tökéletes eredményt, nem mindig sikerül jól eldöntenie egy fehér hátterű képernyőképről, hogy azzal képként vagy szövegként bánjon-e, és a blokkok sem milliméter pontosan oda kerülnek, ahol az eredetiben voltak, illetve előfordulnak szövegtúlfolyások.
Hála a megújult kezelőfelületnek, az eddigieknél kevesebb kattintás árán juthatunk el a célig, és erről nem csupán a leggyakoribb funkciókat listázó indítómenü gondoskodik. Azonnali előnézetet kapunk az oldal felismerési zónáinak szerkesztéséhez, és közvetlenül beleszerkeszthetünk a formázásba is, még mentés előtt. A felismerés már a háttérben elkezdődik, ily módon hamarabb belepillanthatunk a többoldalas dokumentumok elejébe.
A program drágább, Corporate változata ugyanezt a tudást egy kisebb iroda számára teszi könnyen elérhetővé. Egyrészt több munkaállomáson futtatható ugyanazzal a licenccel, másrészt képes hálózati mappákat figyelni, és az oda behelyezett dokumentumokat automatikusan, ütemezés szerint feldolgozni.
A FineReader 9 valóban szintet lépett, oldalfelismerőből dokumentumfelismerővé avanzsált, gyakorlatilag azonos áron. Reméljük, tovább tökéletesedik majd, addig is már most nagy segítség azoknak, akik nemcsak egy PDF-archívumot kívánnak létrehozni, hanem továbbdolgoznak a beolvasott dokumentumokon.




