Jak rozpoznat text pomocí aplikace ABBYY FineReader: pokyny krok za krokem. Jak rozpoznat naskenovaný text pomocí Abbyy FineReader

Aby bylo možné použít program ABBYY FineReader, který je určen pro rozpoznávání textu z neupravitelných a grafických formátů. nejprve si jej musíte stáhnout a nainstalovat do počítače a poté se podívat na video níže, vše je podrobně popsáno o tomto programu.

Tento program je určen pro skenování textu a práce, jeho rozpoznávání.

Samozřejmě jej lze použít a k provedení tohoto použití můžete, aniž byste opustili samotný program Finereader, ve kterém pracujete, rozpoznat text souboru a dále jej transformovat z naskenované kopie dokumentu na klasický formát, Word programy. Pak se ukáže, že ho používáte.

Finereader je program pro skenování a OCR s exportem informací do oblíbených kancelářské balíky. Princip práce s ním lze ve zkratce popsat takto: vezmeme papírový list s vytištěným textem, naskenujeme jej skenerem, získáme určitý grafický soubor bitmapový formát. Poté, aniž bychom opustili program Finereader, rozpoznáme text souboru a dalším krokem je vytvoření dokumentu aplikace Word z naskenované kopie. Předtím lze rozpoznaný text prohlížet a upravovat. Výsledný wordový dokument lze dále doplňovat a upravovat.

Abbyyfinereader je bezpochyby lídrem mezi těmito programy.

Má velmi široké možnosti pro rozpoznávání textu z neupravitelných a grafických formátů.

Program bude schopen rozpoznat text od takových základních formátů, jako jsou (neupravitelné pdf, digitální formáty souborů jpeg, jpg, Djvu, gif, png atd.).

ABBYY FineReader také dobře funguje s téměř všemi modely skenerů.

Hlavní funkce programu jsou:

Skenování dokumentů ve formátech: Microsoft Word, Microsoft Excel, Pdf, skenování a ukládání obrázků, PDF nebo obrázků do Microsoft Word, převod fotografií do Microsoft Word.

Pracovní oblast ABBYY Finereader:

Chcete-li přidat nový úkol, musíte kliknout na tlačítko **nový úkol**, které se nachází v levé horní části pracovní plochy programu.

Otevře okno nová úloha

V okně, které se otevře, vyberte úlohu, kterou chcete provést.

Řekněme, že máme fotografii dokumentu, který chceme převést do formátu dokumentu Microsoft Word. Chcete-li to provést, v okně nová úloha najít aktivní titulek Převést fotografii do aplikace Microsoft Word a klikněte na tento štítek. Otevře okno průzkumníka programu s náhledem :

V okně, které se otevře, vyberte fotografii textový soubor který je třeba rozpoznat a převést do formátu, který potřebujete.

Otevře okno s měřítkem procesu rozpoznávání:

Poté, co program zpracuje fotografii a pokusí se rozpoznat text.

Uvidíte následující:

Zde můžete vybrat oblast vaší fotografie pro rozpoznání textu.

Po výběru oblasti klikněte na tlačítko uznat která se nachází v horní menu programy. Program začne převádět vybranou fotografii na text. Po zpracování obrázku klikněte na šipku vedle tlačítka Uložit a vyberte požadovaný formát pro vytvoření textového dokumentu:

Výkonný a funkční program ABBYY FineReader, je určen pro kvalitní skenování a přesné rozpoznávání (v závislosti na nastaveném rozlišení při skenování) různých papírových médií s tištěným textem (knihy, časopisy, noviny apod.), ale i obrázků v digitálním formátu.

Program podporuje různé jazyky rozpoznávání, lze ukládat do: Microsoft Word, PDF, obrázkových formátů a dalších formátů. Vzhledem k tomu, že program má intuitivní rozhraní, je pohodlné s ním pracovat.

Takže prvním krokem je nejprve nastavit nastavení a skenovat dokumentu, získáme obrázek, jehož text následuje za programem uznat. Po rozpoznání můžete text opravit (pokud jsou nějaké nepřesnosti) a uložit jej v požadovaném formátu.

Jedna z nejoblíbenějších funkcí pro práci se skenováním a zpracováním souborů různé typy- Dobrá čtečka. Funkčnost softwarového produktu byla vyvinuta ruskou společností ABBYY, umožňuje dokumenty nejen rozpoznávat, ale i zpracovávat (překládat, měnit formáty atd.). Mnoho uživatelů může pouze nainstalovat, ale nemohou okamžitě zjistit, jak používat ABBYY FineReader. Odpovědi na mnoho otázek najdete v tomto článku.

Program umožňuje skenovat a rozpoznávat text - a nejen to

Abychom podrobně pochopili, jaký druh programu ABBYY FineReader 12 je, je nutné podrobně zvážit všechny jeho funkce. První a nejjednodušší funkcí je skenování dokumentu. Existují dvě možnosti skenování: s rozpoznáním a bez něj. V případě běžného skenování vytištěného listu obdržíte naskenovaný obrázek do určené složky na vašem počítačovém zařízení.

POZORNOST. List musí být umístěn na snímací části tiskárny přesně podle obrysů vyznačených na tiskárně. Nemanipulujte se zdrojem, může to vést k špatná kvalita finální skenování.

Musíte se sami rozhodnout, co je pro vás FineReader, protože utilita má významnou funkcionalitu, například si můžete vybrat, v jaké barvě chcete získat obrázek, je možné převést všechny fotografie na černobílé. V černobílém rozpoznávání barev je rychlejší, kvalita zpracování se zvyšuje.

Pokud máte zájem o funkci rozpoznávání textu aplikace ABBYY FineReader, musíte před skenováním stisknout speciální tlačítko. V tomto případě existuje několik možností, jak informace získat. Ve výchozím nastavení se na vaší obrazovce zobrazí rozpoznaný kus listu, který můžete zkopírovat nebo upravit ručně.

Pokud zvolíte jiné funkce, můžete soubor okamžitě získat jako dokument Word nebo tabulku Excel. Volba funkcí je velmi jednoduchá, menu je intuitivní, snadno konfigurovatelné díky tomu, že všechna potřebná tlačítka máte na očích.

DŮLEŽITÉ. Před rozpoznáním Text ABBYY FineReader, musíte přesně vybrat jazyk zpracování. Navzdory skutečnosti, že nástroj funguje zcela automaticky, stává se to nízká kvalita zdrojový kód vám neumožňuje pochopit, jaký jazyk byl ve zdrojovém kódu. To značně snižuje kvalitu konečných výsledků aplikace.

Více provozních režimů

Chcete-li plně pochopit, jak používat ABBYY FineReader 12, musíte vyzkoušet dva provozní režimy: „Through“ a „Quick Recognition“. Druhý režim je vhodný pro vysoce kvalitní snímky, zatímco první režim je vhodný pro soubory s nízkou kvalitou. Důkladný režim trvá zpracování souborů 3-5krát déle.

Na obrázku je výsledek programu – rozpoznání textu z obrázku

Jaké další funkce existují?

Rozpoznávání textu v program ABBYY FineReader není jediný užitečná funkce. Pro větší uživatelské pohodlí existuje

ABBYY® FineReader 12 Rychlý průvodce uživatel Tento dokument obsahuje základní informace o provozu aplikace ABBYY FineReader. Plný..."

ABBYY® FineReader 12

Rychlá uživatelská příručka

Tento dokument obsahuje základní informace o aplikaci ABBYY FineReader. Kompletní průvodce Podle

práce s aplikacemi ABBYY FineReader, Screenshot Reader a Hot Folder je k dispozici na webových stránkách společnosti

ABBYY. Pokud nemáte trvalé připojení k internetu, můžete si stáhnout příručku

uživatele ve formátu PDF.

Co je ABBYY FineReader

Instalace a spuštění aplikace ABBYY FineReader

Požadavky na systém

Instalace programu

Spuštění aplikace ABBYY FineReader

Práce s ABBYY FineReader

Vestavěné úkoly

Konverze dokumentů krok za krokem

Analýza struktury dokumentu a úpravy oblastí

Aktivace a registrace programu

Aktivace aplikace ABBYY FineReader

Registrace aplikace ABBYY FineReader

Bezpečnost dat

Co je ABBYY FineReader ABBYY FineReader je systém optického rozpoznávání znaků (OCR). Je určen pro převod naskenovaných dokumentů, dokumentů PDF a obrazových souborů, včetně digitálních fotografií, do upravitelných formátů.

Výhody ABBYY FineReader 12 Rychlost a vysoká přesnost rozpoznávání Podpora většiny světových jazyků Kontrola výsledků rozpoznávání Jednoduché a přehledné rozhraní Rozpoznávání vyfotografovaných dokumentů Ukládání dokumentů v různých formátech a jejich odesílání na online úložiště Bezplatná technická podpora pro registrované uživatele Instalace a spuštění ABBYY FineReader Systémové požadavky 1. 32bitový (x86) nebo 64bitový (x64) procesor s hodinová frekvence 1 gigahertz (GHz) nebo vyšší.

2. Operační sál systém Microsoft® Windows® 8, Microsoft® Windows® 7, Microsoft Windows Vista, Microsoft Windows XP, Microsoft Windows Server 2012/2012 R2, Microsoft Windows Server 2008/2008 R2, Microsoft Windows Server 2003.

Pro práci s lokalizovaným rozhraním musí operační systém poskytovat nezbytnou jazykovou podporu.

3. RAM - 1024 MB.

Při běhu na vícejádrových systémech je pro každé další jádro vyžadováno dalších 512 MB RAM.

4. Volné místo na disku: 850 MB pro instalaci všech součástí programu, 700 MB pro spuštění programu.

5. Grafická karta a monitor s rozlišením alespoň 1024768 pixelů.

6. Klávesnice, myš nebo jiné polohovací zařízení.

Instalace programu

Chcete-li nainstalovat ABBYY FineReader 12:

1. Spusťte soubor Setup.exe z instalačního CD nebo z distribuční složky programu.

ABBYY FineReader 12 Corporate můžete nainstalovat do lokální síť. Průvodce pro správce systému ve formátu PDF lze stáhnout z webu ABBYY.

Spuštění aplikace ABBYY FineReader

Spuštění aplikace ABBYY FineReader 12:

Rychlý průvodce ABBYY FineReader 12 Vyberte ABBYY FineReader 12 (ABBYY FineReader 12 Corporate) z nabídky StartPrograms nebo aplikace společnosti Microsoft Office, klikněte na spouštěcí tlačítko ABBYY FineReader umístěné na panelu FineReader 12 nebo Průzkumník Windows vyberte obrazový soubor a vyberte Otevřít pomocí ABBYY FineReader nebo možnost převést do požadovaného formátu v jeho kontextové nabídce.

Práce s ABBYY FineReader

Zpracování dokumentů pomocí aplikace ABBYY FineReader se skládá ze čtyř fází:

Získání obrázku;

Rozpoznávání dokumentů;

Kontrola a úprava přijatého textu;

Ukládání výsledků rozpoznávání.

Tento proces často sestává ze stejné sekvence akcí, například skenování, rozpoznání a uložení rozpoznaného textu ve specifickém formátu. Pro provádění nejběžnějších úloh poskytuje program vestavěné úlohy, které umožňují získat rozpoznaný text kliknutím na tlačítko. Chcete-li rozpoznat dokumenty se složitou strukturou, můžete každou fázi zpracování nastavit a spustit sami.

Vestavěné úlohy Vestavěné úlohy se spouštějí z okna Úlohy, které se ve výchozím nastavení otevře při spuštění aplikace. Pokud je okno zavřené, klikněte na tlačítko Úloha na hlavním panelu nástrojů programu.

ABBYY FineReader 12 Stručná úvodní příručka

Chcete-li převést dokument pomocí vestavěných úloh:

1. V okně Úloha vyberte potřebnou kartu s úkoly:

Základní – obsahuje nejčastěji používané vestavěné úlohy v ABBYY FineReader;

Microsoft Word - úlohy pro převod do dokumentu Microsoft Word;

Microsoft Excel - úlohy pro tvorbu tabulek Microsoft Excel;

– – –

Moje úkoly – můžete si vytvořit své vlastní úkoly skládající se z kroků, které jsou pro vás vyžadovány (pouze pro verzi ABBYY FineReader Corporate).

2. V seznamu Jazyk dokumentu zadejte jazyky rozpoznávání.

3. Uvedeno Barevný režim vyberte barevný režim:

Barva - barevné schéma dokumentu se nezmění;

Černobílé – Stránky dokumentu budou černobílé, což zmenší velikost dokumentu FineReader. V porovnání s barevným režimem zabere tento režim zpracování dokumentu méně času.

ABBYY FineReader 12 Stručná úvodní příručka Pozor! Po zvolení černobílého režimu nebude možné obnovit barevný vzhled dokumentu. Chcete-li získat barevný dokument, otevřete soubor, který obsahuje barevné obrázky stránek, nebo naskenujte papírový dokument v barevném režimu.

4. V případě potřeby nastavte další možnosti pro úlohy převodu do dokumentu Microsoft Word, do dokumentu Microsoft Excel a dokumentu Adobe PDF na pravé straně okna.

5. Klepněte na tlačítko pro požadovanou úlohu.

Úlohy aplikace ABBYY FineReader se provádějí podle nastavení zadaných v dialogovém okně Nastavení (nabídka Nastavení nástrojů...).

Po spuštění se na obrazovce objeví lišta průběhu úlohy, která obsahuje indikátor průběhu úlohy, seznam kroků a také tipy a varování.

V důsledku provedení úlohy se vytvoří dokument požadovaný formát a obrázky budou přidány do dokumentu FineReader. V případě potřeby můžete upravit vybrané oblasti na snímcích, zkontrolovat rozpoznaný text a uložit výsledky rozpoznání v jiném formátu.

Konverze dokumentů krok za krokem vlastní nastavení a spusťte každou fázi zpracování dokumentu, použijte hlavní okno aplikace ABBYY FineReader.

ABBYY FineReader 12 Stručná úvodní příručka

1. Na hlavním panelu nástrojů v rozevíracím seznamu Jazyk dokumentu určete jazyky rozpoznávání.

2. Naskenujte nebo otevřete obrázky.

Ve výchozím nastavení se analýza a rozpoznávání dokumentů spustí automaticky. Tato nastavení můžete změnit na kartě Skenovat/otevřít v dialogovém okně Možnosti (nabídka Možnosti nástrojů...).

3. V okně Obrázek zaškrtněte vybrané oblasti a v případě potřeby je upravte.

4. Pokud jste změnili oblasti, klepněte na hlavním panelu nástrojů na tlačítko Rozpoznat.

5. V okně Text zkontrolujte a v případě potřeby upravte výsledky rozpoznávání.

Analýza struktury dokumentu a oblastí úprav Kvalita získaná jako výsledek převodu dokumentu závisí na mnoha faktorech: na původním obrázku, nastavení rozpoznávání, parametrech ukládání. Jeden z kritické kroky je rozbor logické struktury dokumentu, tzn. výběr oblastí s textem, obrázky, tabulkami a čárovými kódy. Oblasti se přidělují, aby systému řekly, jak rozpoznat určité části obrazu a v jakém pořadí. Tím se reprodukuje původní návrh dokumentu.

ABBYY FineReader 12 Stručná uživatelská příručka Ve výchozím nastavení se analýza dokumentů v aplikaci ABBYY FineReader provádí automaticky.

Ve složitých dokumentech však nemusí být některé oblasti zvýrazněny správně. Často je výhodnější opravit pouze je, než znovu vybrat všechny oblasti Nástroje pro ruční označování a úpravu oblastí se nacházejí na panelu okna Obrázek a také na vyskakovacích panelech nástrojů pro Text, Obrázek, Obrázek na pozadí a oblasti tabulky. Vedle aktivní oblasti se zobrazí vyskakovací panel nástrojů. Chcete-li vybrat oblast, klikněte na ni levým tlačítkem myši.

Pomocí nástrojů pro ruční rozvržení můžete:

Přidejte nebo odeberte oblast

– – –

Posunout hranice oblasti nebo samotnou oblast Přidat/odebrat obdélníkovou část oblasti Přečíslovat oblasti Po dokončení všech operací s úpravami oblastí spusťte rozpoznávání znovu.

Zjistěte více o tom, jak pracovat s nástroji pro ruční rozvržení a jak na to nestandardní situace, jehož řešení může vyžadovat pokročilé nastavení, úplnou nápovědu si můžete přečíst na webu ABBYY.

Aktivace a registrace programu Aktivace ABBYY FineReader Chcete-li používat ABBYY FineReader 12 v plně funkčním režimu, může být nutné produkt aktivovat. Aktivace je zcela bezpečná a anonymní.

Nejjednodušší a rychlý způsob- aktivovat program přes internet. Program můžete také aktivovat pomocí e-mailem nebo telefon/fax. Podrobné informace o aktivaci naleznete na webu ABBYY.

Registrace ABBYY FineReader ABBYY vás zve, abyste se stali registrovaným uživatelem ABBYY

FineReader 12. Registrací získáte řadu výhod:

bezplatná technická podpora;

Schopnost používat aplikaci ABBYY Screenshot Reader navrženou tak, aby rozpoznávala text ze snímků obrazovky oblastí obrazovky (snímky obrazovky);

Obnovení sériového čísla v případě jeho ztráty;

Automatická aktualizace produktu;

Schopnost přijímat informace o speciální nabídky pro produkty ABBYY.

Svou kopii programu můžete zaregistrovat jedním z následujících způsobů:

Během procesu aktivace programu vyplňte registrační kartu. Pokud jste program nezaregistrovali během procesu aktivace, můžete tak učinit později, kdykoli vám to bude vyhovovat.

ABBYY FineReader 12 Rychlý průvodce Z nabídky Nápověda vyberte Registrovat... a vyplňte registrační formulář.

Zaregistrujte se na webu ABBYY.

Zabezpečení dat Během procesu registrace souhlasíte s dobrovolným předáním vašich osobních údajů společnosti ABBYY. Rovněž vyjadřujete svůj souhlas se shromažďováním, zpracováním a používáním vašich osobních údajů společností ABBYY za podmínek důvěrnosti a v souladu s platnými zákony v souladu s licenční smlouvou. Vámi poskytnuté osobní údaje budou použity pouze v rámci skupiny společností ABBYY a nebudou poskytnuty třetím stranám, s výjimkou případů stanovených příslušným zákonem podle Licenční smlouvy nebo samotné Licenční smlouvy.

Společnost ABBYY má právo zasílat vám e-maily obsahující novinky o produktech, změnách cen, speciálních nabídkách a další informace o produktech nebo společnosti pouze v případě, že jste zaškrtnutím příslušného políčka při registraci potvrdili svůj souhlas se zasíláním informací od společnosti ABBYY. Svou adresu můžete ze seznamu předplatitelů kdykoli odstranit kontaktováním společnosti ABBYY.

ABBYY FineReader 12 Stručná úvodní příručka

Informace obsažené v tomto dokumentu se mohou bez upozornění změnit a společnost ABBYY nepřebírá žádnou povinnost tak učinit.

Software popsaný v tomto dokumentu je poskytován na základě licenční smlouvy. Tento software lze používat nebo kopírovat pouze v přísném souladu s podmínkami této smlouvy. Kopírování tohoto softwaru na jakékoli médium, pokud není výslovně povoleno v licenční smlouvě nebo v nedistribuční smlouvě, je porušením zákona Ruská Federace„O právní ochraně počítačových programů a databází“ a normy mezinárodního práva.

Žádná část této příručky nesmí být reprodukována nebo přenášena za žádným účelem v jakékoli formě nebo jakýmikoli prostředky, elektronickými nebo mechanickými, včetně fotokopírování a nahrávání na magnetická média, pokud k tomu není výslovně písemně povoleno.

ABBYY, ABBYY FineReader, ADRT jsou registrované ochranné známky nebo ochranné známky společnosti ABBYY Software Ltd.

Chráněno patenty USA: 5 929 866; 5,943,063; 6,289,364; 6,563,502; 6,185,684; 6,205,549; 6,639,593;

7,213,269; 7,246,748; 7,272,628; 7,278,168; 7,343,551; 7,395,503; 7,389,200; 7,406,599; 6,754,382; Patentové přihlášky se posuzují.

Adobe® PDF Library je licencována společností Adobe Systems Incorporated.

Adobe, Acrobat®, logo Adobe, logo Acrobat, logo Adobe PDF a Adobe PDF Library jsou registrované ochranné známky nebo ochranné známky společnosti Adobe Systems Incorporated ve Spojených státech a/nebo jiných zemích.

Založeno na technologii AT&T Labs.

DjVu® je chráněn americkým patentem č. 6.058.214. Patentové přihlášky v jiných zemích jsou zvažovány.

Microsoft, Outlook, Excel, PowerPoint, Windows Vista, Windows jsou registrované ochranné známky nebo ochranné známky společnosti Microsoft Corporation ve Spojených státech a/nebo jiných zemích.

OpenOffice.org, logo OpenOffice.org jsou ochranné známky nebo registrované ochranné známky společnosti Oracle a/nebo jejích přidružených společností.

Licence JasPer verze 2.0:

© 1999-2000 The University of British Columbia EPUB® je registrovaná ochranná známka IDPF (International Digital Publishing Forum) Tento software obsahuje komponenty, které vlastní © 2009 The FreeType Project (www.freetype.org).Všechna práva vyhrazena.

Produkt obsahuje software vyvinutý projektem OpenSSL pro použití v OpenSSL Toolkit. (http://www.openssl.org/). Produkt obsahuje kryptografický software napsaný Ericem Youngem ( [e-mail chráněný]).

Tento produkt obsahuje software vyvinutý Timem Hudsonem ( [e-mail chráněný]).

Ostatní ochranné známky jsou ochranné známky nebo registrované ochranné známky

Podobné práce:

“02/01/2016 SHEMOT NAMES Exodus 1:1-6:1/Izajáš 27:6-28:13; 29:22,23 / Marek 1,2 Exodus 1:1 Podívejte se (dnes) na jména synů Izraele, kteří vešli do Egypta, každý vešel se svým domem s Jákobem. Exodus 1:1 A toto jsou jména synů Izraele, kteří vešli do Egypta s Jákobem, každý vešel se svým domem. Zde je přímý...

Přestože pokroky v oblasti umělé inteligence (AI) za posledních 50 let nepřiblížily „chytré“ stroje ani o kousek blíže lidským kognitivním schopnostem, bylo by nespravedlivé pokrok v tomto směru zcela popírat. Nejviditelnějším a nejvýraznějším příkladem jsou šachy (nemluvě o jednodušších hrách). Počítač zatím nedokáže napodobit naše myšlení, ale je docela schopný tuto mezeru dohnat velkým množstvím specializované paměti a rychlostí výčtu. Vladimir Kramnik označil hru programu Deep Fritz, která ho vyhrála v roce 2006, za „nelidskou“ v tom smyslu, že byla často v rozporu se zavedenými (lidskými) pravidly strategie a taktiky.

O něco více než před rokem udělal další průlom další nápad IBM, který svého času položil základy triumfálních šachových vítězství počítačů (slavná Deep Blue), nazvaný Watson, když porazil dva šampiony populárního amerického kvízu Ohrožení s velkým náskokem. Je však důležité, že ačkoli Watson vyslovil odpovědi sám, otázky mu byly stále předávány textová forma. To naznačuje, že pokrok v mnoha oblastech aplikace umělé inteligence – rozpoznávání řeči a obrazu, strojový překlad – je poměrně skromný, i když nám to nebrání v jejich uvádění do praxe dnes. Asi největší úspěch vykazují systémy optického rozpoznávání znaků (OCR, Optical Character Recognition), které asi všichni uživatelé PC tak či onak znají. Navíc ruský vývoj v této oblasti zaujímá ve světě důstojné místo – mám na mysli ABBYY FineReader.

Trocha historie

Aktuální verze ABBYY FineReader má číslo 11, což znamená, že aplikace ušla dlouhou cestu ve vývoji a dokonce i historie tohoto procesu je do jisté míry zajímavá. Aniž bych předstíral vyčerpávající kroniku, uvedu pouze hlavní milníky za uplynulou dekádu, během níž jsem FineReader víceméně sledoval:

Rok	Verze	Klíčové vlastnosti
2003	7.0	Až 25% zvýšení přesnosti rozpoznávání. Nejvíce se to projevilo v tabulkách, zvláště složitých, s barevnými buňkami, skrytými oddělovači atp.
2005	8.0	Další optimalizace rozpoznávacích algoritmů primárně zaměřená na práci nikoli se skeny dokumentů, ale s digitálními fotografiemi. K tomu se objevily další funkce pro přípravu předloh (eliminace zkreslení, zarovnání čar atd.).
2007	9.0	Nástup technologie ADRT, která zohledňuje logickou strukturu celého zpracovávaného (vícestránkového) dokumentu a je schopna selektovat opakující se prvky (záhlaví a zápatí), propojovat „tekoucí“ objekty (tabulky) atp.
2009	10.0	Další vylepšení ADRT a rozpoznávacích algoritmů, zvýšení přesnosti zpracování originálů s nízkým rozlišením až o 30 %.
2011	11.0	Hlavní pozornost je věnována rychlosti programu. „Druhý příchod“ černobílého režimu, který u kvalitních originálů poskytuje dodatečné zrychlení až o 30 %.

Přirozeně ve stejné době FineReader rozšířil podporu pro formáty dokumentů, zlepšil vestavěné nástroje a rozhraní, zlepšil reprodukci struktury originálů atd. Nejdůležitější však přímo souvisí s technologiemi OCR a dobře demonstrují skoky a hranice vývoje charakteristické pro komplexní vědecky náročné systémy, kdy po dalším „průlomu“ následuje určitá doba „klidu“, která je nezbytná pro zdokonalení nových algoritmů. Představují hlavní hodnotu jakéhokoli programu OCR, a proto detailní informace o nich se k uživatelům dostane velmi zřídka. Společnost ABBYY však laskavě souhlasila s odstraněním závoje tajemství a dnes máme možnost nahlédnout do vnitřní svatyně FineReaderu.

Základní principy

Jelikož tedy OCR patří do oblasti AI, je celkem logické, že se vývojáři snaží alespoň do určité míry napodobit činnost našeho mozku. Struktura našeho zrakového systému je samozřejmě neuvěřitelně složitá, ale základní „velkoblokové“ principy jeho fungování jsou dostatečně prozkoumány, obvykle jsou tři:

Integrita- objekt je považován za soubor jeho částí a (pro vizuální obrazy) prostorových vztahů mezi nimi. Části jsou zase interpretovány pouze jako část celého objektu. Tento princip pomáhá budovat a upřesňovat hypotézy a rychle odříznout ty nepravděpodobné.
cílevědomosti- protože každá interpretace dat má specifický cíl, rozpoznávání je také procesem předkládání hypotéz o objektu a jejich účelového testování. Systém fungující v souladu s tímto principem nejen ušetří peníze výpočetní výkon ale také je méně pravděpodobné, že se mýlí.
Přizpůsobivost- systém ukládá informace nashromážděné v průběhu práce a znovu je používá, tj. sám se učí. Tento princip vám umožňuje vytvářet a shromažďovat nové znalosti a vyhýbat se jim opětovné rozhodnutí stejné úkoly.

FineReader je jediný OCR systém na světě, který funguje v souladu s výše popsanými principy ve všech fázích zpracování dokumentů. Odpovídající technologie se nazývá IPA- prvními písmeny anglických výrazů. Například podle principu integrity bude fragment obrazu interpretován jako symbol pouze tehdy, pokud obsahuje všechny strukturální části podobných objektů a těch, které jsou v určitých vztazích. To pomáhá nahradit prohledávání velkého množství šablon (při hledání více či méně vhodné) účelovým testováním přiměřeného počtu hypotéz, navíc na základě dříve nashromážděných informací o možných stylech znaků v uznávaném dokumentu.

Principy IPA se však uplatňují při analýze nejen fragmentů odpovídajících (pravděpodobně) jednotlivým znakům, ale i celého původního obrazu stránky. Většina systémů OCR je založena na rozpoznání hierarchické struktury dokumentu, tj. stránka je rozdělena na základní strukturní prvky, jako jsou tabulky, obrázky, textové bloky, které se zase dělí na další charakteristické objekty - buňky, odstavce - a tak dále. až po jednotlivé postavy.

Takovou analýzu lze provést dvěma hlavními způsoby: shora dolů, tj. od základních prvků k jednotlivým postavám, nebo naopak zdola nahoru. Nejčastěji se používá jeden z nich, ale společnost ABBYY vyvinula speciální algoritmus MDA(víceúrovňová analýza dokumentů, víceúrovňová analýza dokumentů), která kombinuje obojí. Stručně řečeno, vypadá to takto: struktura stránky je analyzována metodou shora dolů a elektronický dokument je znovu vytvořen po dokončení rozpoznávání zdola nahoru, ale na všech úrovních existuje další mechanismus zpětná vazba. V důsledku toho se výrazně snižuje pravděpodobnost hrubých chyb spojených s nesprávným rozpoznáním objektů na vysoké úrovni.

ADRT

Historicky se systémy OCR vyvíjely z rozpoznávání jednoho znaku. Tento úkol je stále nejdůležitější a nejobtížnější, jsou s ním spojeny nejsložitější algoritmy. Brzy se však ukázalo, že při řešení mohou pomoci informace vyšší úrovně (například o jazyce dokumentu a správném pravopisu rozpoznaných slov) – tak se objevily kontroly kontextu a slovníku. Pak touha zachovat formátování a znovu vytvořit fyzickou strukturu (tj. relativní polohu různých objektů) dokumentu vedla k potřebě podrobné analýzy celé stránky. Je jasné, že i to má významný vliv na Celková kvalita rozpoznávání, protože pomáhá správně zpracovat vícesloupcový layout, tabulky a další způsoby „nelineárního“ uspořádání textu.

Většina moderních OCR funguje na těchto třech úrovních – znaky, slova, stránky – procvičuje, jak již bylo zmíněno, přístupy shora dolů nebo zdola nahoru. Společnost ABBYY však v souladu s principy IPA zavedla do FineReaderu ještě jednu úroveň – celý vícestránkový dokument. Především to bylo nutné pro správnou reprodukci logické struktury, která je v moderních dokumentech stále složitější. Jsou tu ale další bonusy: zvýšená přesnost a rychlejší zpracování opakujících se objektů, přesnější identifikace (a tím i rozpoznávání) objektů „proudících se“ ze stránky na stránku.

K tomu byl navržen. ADRT(Adaptive Document Recognition Technology) – technologie pro analýzu a syntézu dokumentu na logické úrovni. V konečném důsledku pomáhá, aby byl výsledek práce FineReaderu co nejvíce podobný originálu. Za tímto účelem se analyzuje obraz celého dokumentu a rozpoznaná slova se spojí do skupin (shluků) v závislosti na stylu, prostředí a umístění na stránce. Program tedy jakoby vidí „logiku“ označení dokumentu a v budoucnu může sjednotit návrh výsledku.

Díky ADRT se FineReader od verze 9.0 naučil detekovat, rozpoznávat a reprodukovat následující konstrukční části a prvky formátování dokumentu:

hlavní text;
záhlaví a zápatí;
čísla stránek;
nadpisy stejné úrovně;
obsah;
textové vložky;
popisky pro kresby;
stoly;
poznámky pod čarou;
podpisové/tiskové zóny;
písma a styly.

Proces rozpoznávání

Podle algoritmu MDA začíná skutečné rozpoznávání shora dolů, od úrovně stránky. Je jasné, že čím více chybných rozhodnutí je učiněno v raných fázích tohoto procesu, tím více jich bude v dalších. Proto přesnost rozpoznávání tolik závisí na kvalitě originálů, ale významný význam mohou mít i jejich algoritmy předběžného zpracování. Jak tedy ve FineReaderu rostla popularita barevných dokumentů, objevil se postup adaptivní binarizace (adaptivní binarizace, AB). Pokud okamžitě naskenujete dokument v černobílém režimu, kde jsou vodoznaky nebo je text umístěn na texturovém nebo barevném substrátu, pak se na obrázku vždy objeví „odpad“, který pak bude poměrně obtížné oddělit od „ užitečný“ obrázek (protože původní informace o něm jsou již ztraceny). To je důvod, proč FineReader preferuje práci s barevnými obrázky nebo obrázky ve stupních šedi a sám je převádí na černobílé (tento proces se nazývá binarizace). Ale to není všechno. Vzhledem k tomu, že barvy textu a pozadí se mohou na stránce a dokonce i na jednotlivých řádcích lišit, AB zvýrazňuje slova s víceméně stejnými vlastnostmi a pro každé vybírá optimální parametry binarizace z hlediska kvality rozpoznávání. To je právě adaptabilita algoritmu, který je tak příkladem využití zpětné vazby v MDA. Je zřejmé, že účinnost AB silně závisí na návrhu zdrojových dokumentů – na testovací bázi ABBYY tento algoritmus zajistil zvýšení přesnosti rozpoznávání o 14,5 %.

Ale to nejzajímavější samozřejmě začíná, když proces rozpoznávání klesá na nejnižší úrovně. Postup tzv. lineárního dělení rozděluje řetězce na slova a slova na jednotlivá písmena; pak v souladu s principem IPA tvoří soubor hypotéz (tedy možné varianty, o jaký druh symbolu se jedná, na jaké symboly je slovo rozděleno atd.) a poté, co každý poskytne odhad pravděpodobnosti, předá jej na vstup mechanismu rozpoznávání znaků. Ten se skládá z řady tzv klasifikátory, z nichž každá také generuje řadu hypotéz, seřazených podle odhadovaného stupně pravděpodobnosti. Nejdůležitější charakteristikou každého klasifikátoru je průměrná pozice správné hypotézy. Je jasné, že čím vyšší, tím méně práce pro následné algoritmy - například kontrolu slovníku. Ale u dostatečně dobře nastavených klasifikátorů se nejčastěji hodnotí takové vlastnosti, jako je přesnost rozpoznávání podle prvních tří hypotéz nebo jen podle první - tedy zhruba řečeno schopnost uhodnout správnou odpověď ze tří nebo jednoho pokusu. Společnost ABBYY používá ve svých systémech následující typy klasifikátorů: rastr, prvek, diferenciál prvků, obrys, strukturální a strukturální diferenciál – které jsou seskupeny na dvou logických úrovních.

Princip fungování RK, neboli rastrový klasifikátor, je založen na porovnání pixelu po pixelu obrázku symbolu s odkazy. Ty jsou vytvořeny jako výsledek průměrování obrázků z trénovacího vzorku a jsou redukovány na určitou standardní formu; podle toho jsou pro rozpoznatelný obraz také předem normalizovány velikost, tloušťka prvků a sklon. Tento klasifikátor se vyznačuje jednoduchostí implementace, rychlostí provozu a odolností vůči obrazovým vadám, ale poskytuje relativně nízkou přesnost, a proto se používá v první fázi - k rychlému generování seznamu hypotéz.

Klasifikátor funkcí ( PC), jak již název napovídá, je založen na přítomnosti znaků určitého symbolu na obrázku. Pokud existuje N takových znaků, pak každá hypotéza může být reprezentována bodem v N-rozměrném prostoru; podle toho bude přesnost hypotézy odhadnuta podle vzdálenosti od ní k bodu odpovídajícímu standardu (který je také vyvinut na tréninkové množině). Je jasné, že druhy a počet funkcí do značné míry určují kvalitu rozpoznávání, takže jich bývá poměrně hodně. Tento klasifikátor je také poměrně rychlý a jednoduchý, ale málo odolný vůči různým vadám obrazu. PC navíc neoperuje s původním obrazem, ale s určitým modelem, abstrakcí, tedy nezohledňuje některé informace: např. samotný fakt přítomnosti některých důležitých prvků nic nevypovídá o jejich relativní polohu. Z tohoto důvodu se PC nepoužívá místo, ale společně s RK.

klasifikátor obrysů ( QC) představuje speciální případ Počítač se liší tím, že analyzuje obrysy zamýšlené postavy, extrahované z původního obrázku. Obecně je jeho přesnost nižší než u plnohodnotného PC.

Diferenciální klasifikátor prvků ( MPC) je také podobný PC, ale používá se pouze k rozlišení podobných objektů, jako je „m“ a „rn“. Analyzuje tedy pouze ty oblasti, kde jsou rozdíly skryté, a je živena nejen počátečními obrazy, ale také hypotézami vytvořenými v raných fázích rozpoznávání. Princip jeho fungování je však poněkud odlišný od PC. Ve fázi tréninku se v N-rozměrném prostoru vytvoří dva „oblaky“ (skupiny bodů) možných hodnot pro každou ze dvou možností, poté se postaví nadrovina, která „oblaky“ od sebe oddělí a přibližně ve stejné vzdálenosti od nich. Výsledek rozpoznání závisí na tom, do kterého poloprostoru spadá bod odpovídající původnímu obrázku.

MPC samo o sobě nepředkládá hypotézy, ale pouze zpřesňuje ty stávající (jejichž seznam je obecně řazen bublinovou metodou), takže nedochází k přímému posouzení jeho účinnosti, ale nepřímo se staví na roveň charakteristiky celé první úrovně rozpoznávání OCR. Je však zřejmé, že záleží na správnosti zvolených znaků a reprezentativnosti vzorku norem, což je poměrně pracný úkol.

Strukturní diferenciální klasifikátor ( KFOR) byl původně používán ke zpracování ručně psané texty. Jeho úkolem je rozlišovat mezi takovými podobnými objekty jako "C" a "G". SDK je tedy založeno na vlastnostech charakteristických pro každou dvojici znaků, proces jeho učení je ještě složitější než u MPC a rychlost práce je nižší než u všech předchozích klasifikátorů.

Strukturní klasifikátor ( SC) je chloubou ABBYY, původně byl vyvinut pro rozpoznávání tzv. ručně tištěného textu, tedy když člověk píše „tištěným“ písmenem, ale následně byl použit pro tisk. Používá se v závěrečných fázích rozpoznávání a vstupuje do činnosti poměrně zřídka, totiž pouze tehdy, když k němu dosáhnou alespoň dvě hypotézy s dostatečně vysokou pravděpodobností.

Kvalitativní charakteristiky všech klasifikátorů jsou shrnuty v následující tabulce. Umožňují však pouze vzájemné hodnocení účinnosti algoritmů, protože nejsou absolutní, ale jsou získány na základě zpracování konkrétního testovacího vzorku. Může se zdát, že v posledních fázích rozpoznávání se bojuje doslova o zlomek procenta, ale ve skutečnosti každý klasifikátor významně přispívá ke zlepšení přesnosti rozpoznávání - například SC snižuje počet chyb o výrazných 20 %.

	RK	PC	QC	MPC*	KFOR**	SC**
Přesnost pro první tři možnosti, %	99,29	99,81	99,30	99,87	99,88	-
Přesnost podle první možnosti, %	97,57	99,13	95,10	99,26	99,69	99,73

* vyhodnocení celé první úrovně algoritmu ABBYY OCR
** odhad pro celý algoritmus po přidání odpovídajícího klasifikátoru

Je však zvláštní, že i přes poměrně vysokou přesnost to samotný rozpoznávací algoritmus neakceptuje konečné rozhodnutí. Podle principu MDA jsou hypotézy předkládány na každé logické úrovni a jejich počet může exponenciálně růst. Proto je nepravděpodobné, že by následné testování všech hypotéz bylo účinné, a proto systémy ABBYY OCR používají metodu strukturování hypotéz, tj. jejich přiřazování k určitým modelům. Těch posledních je několik desítek, zde je jen několik typů: slovo ze slovníku, slovo mimo slovník, arabské číslice, římské číslice, URL, regulární výraz- a každý může obsahovat sadu konkrétní modely(například slovo v některém ze známých jazyků, latině, azbuce atd.).

Všechny konečné akce jsou již provedeny s hypotézami sestavenými podle modelů. Kontextová kontrola například určí jazyk dokumentu a okamžitě výrazně sníží pravděpodobnost, že modely používají nesprávné abecedy, a kontrola slovníku vyrovná chyby v nejistém rozpoznání některých znaků: například slovo „turn“ je přítomný ve slovníku v angličtině- na rozdíl od "tum" (v žádném případě nepatří mezi oblíbené). Ačkoli je priorita slovníku vyšší než priorita jakéhokoli klasifikátoru, není to nutně poslední možnost a obecně to nezastavuje další kontroly: za prvé, jak je uvedeno výše, existuje model slov bez slovníku a za druhé, speciální organizace slovníků umožňuje s vysokým podílem pravděpodobnost uhodnutí, zda nějaké neznámé slovo může patřit do určitého jazyka. Přesto má kontrola slovníku (a úplnost slovníků) významný vliv na výsledek rozpoznávání a ve vlastních testech ABBYY snižuje počet chyb téměř na polovinu.

Nejen OCR

Tištěné dokumenty nejsou zdaleka jediné zajímavé z hlediska jejich digitalizace a automatické zpracování. Poměrně často musíte pracovat s formuláři, tedy dokumenty s předdefinovanými a pevnými poli, které se vyplňují ručně, ale poměrně přesně (tzv. ručně tištěné znaky) – příkladem mohou být různé dotazníky. Technologie jejich zpracování má samostatný název - ICR(inteligentní rozpoznávání znaků) - a dost výrazně se liší od OCR. Ano, protože v tento případ Vzhledem k tomu, že úkolem není znovu vytvořit celý dokument, ale extrahovat z něj konkrétní data, spadá to do dvou hlavních dílčích úkolů: nalezení potřebných polí a skutečné rozpoznání jejich obsahu.

Jedná se o poměrně specifickou oblast a ABBYY nabízí zcela samostatnou software ABBYY FlexiCapture. Je určen k vytváření automatizovaných a poloautomatizovaných systémů, zahrnuje nastavení pro konkrétní typy dokumentů, pro které se vytvářejí speciální šablony, umí inteligentně vyhledávat různá pole na stránkách a ověřovat v nich data atd. Je však založen na rozpoznávání znaků algoritmy podobné těm, které se používají ve FineReaderu a obecné schéma je velmi podobné:

Stále však existuje důležitý rozdíl: strukturální klasifikátor je povinným účastníkem procesu - to je způsobeno specifiky ručně psaných znaků. Kromě toho ICR zahrnuje velké množství specifických dodatečné kontroly: například zda znak není přeškrtnutý, nebo zda rozpoznané znaky skutečně tvoří datum.

Rozhovor bude o ABBYY FineReader 12, tedy o jeho nejnovější verzi. Aniž bychom se dívali příliš daleko, vybrali jsme nejslavnější produkt ABBYY, který je podle svých předností dokonale rusifikován. Fine Reader (FR) už na první pohled působí dojmem programu s dobrou ruskou podporou: v tomto ohledu je skutečně vše provedeno na velmi slušné úrovni, včetně podkladů.

Za prvé, ustoupit. Otázka, jak převést celý archiv nebo jeho část do digitálního formátu, je vždy aktuální (a co se vlastně rozumí pod pojmem „digitální“). Je nepravděpodobné, že koupě skeneru vyřeší všechny problémy. Samozřejmě velmi často disk nebo několik s proprietárním software. Již ve fázi dezinfekce se však ukazuje, že kvalita skenovacího programu ponechává mnoho přání nebo formát, ve kterém se provádí ukládání, bohužel není vhodný pro skladování. Proč? Většina grafických formátů neodděluje text od netextového prostoru dokumentu, a proto není možné z takového souboru kopírovat žádnou pasáž.

Právě v takových případech přicházejí na pomoc funkční programy „rozpoznávání textu“, mezi jejichž schopnosti patří zejména extrahování textu z obrázku.

Úvod do ABBYY FineReader

Igelitová taška ABBYY Fine Reader 12- systém optického rozpoznávání textů (Optical Character Recognition - OCR). Je určen jak pro automatické vkládání tištěných dokumentů do počítače, tak pro převod PDF dokumentů a fotografií do editovatelných formátů (z manuálu k programu)

Zkratka "OCR" se vztahuje na všechny aplikace pro rozpoznávání dat (nejen text). Zdroj pro extrakci dat lze vytisknout popř elektronický dokument. Kdysi málokdo věděl o OCR, v té či oné podobě, a procesu překládání textu do elektronické podobě se změnilo ve skutečnou rutinu, až po ruční přetištění původního textu. Dnes mít plochý skener (manuální skenery doma používá jen málokdo) a jemný čtenář 12- buďte si jisti - při skenování a rozpoznávání nebudou žádné potíže.

Počínaje šestou verzí podporuje FineReader import a export do ve formátu PDF, patentovaný společností Adobe. Mnoho čtenářů se pravděpodobně setkalo s potížemi při převodu z tohoto formátu do jakéhokoli jiného (doc atd.), protože v této oblasti není tolik skutečně užitečných programů (pozornost si zaslouží pouze dceřiný produkt společnosti ABBYY, PDF Transformer). Faktem je, že takové programy provádějí rozpoznávání textu pouze jednou, v důsledku čehož „identita“ výsledku není vůbec velká (v závislosti na složitosti dokumentu) a formátování dokumentu je docela ztraceno.

V případě FineReaderu jsou věci jinak. Devátá verze programu představila technologii nazvanou Document OCR. Je založen na principu integrálního rozpoznávání dokumentu: je analyzován a rozpoznáván jako celek, nikoli stránka po stránce. Zároveň všechny druhy sloupců, záhlaví, fontů, stylů, poznámek pod čarou a obrázků zůstávají nedotčené nebo jsou nahrazeny blízko originálu.

Instalace balíčku

Demo verzi Finereader 12 lze stáhnout z webu Abbyy.ru, v sekci Ke stažení, plná verze licencovanou verzi distribuován na CD. O způsobech nákupu se dozvíte na stejném webu v sekci "Koupit".

Na webu ABBYY developers si můžete stáhnout demo verzi ABBYY FineReader verze 12 (nebo jinou verzi, která je aktuální)

ABBYY FineReader je distribuován v několika verzích: Professional Edition, Corporate Edition, Site License Edition atd. Verze Professional se liší od ostatních v tom, že je navržena tak, aby fungovala firemní síť s příležitostí společná práce nad rozpoznáváním dokumentů. Jinak je rozdíl nepatrný a závisí na volbě podmínek licenční smlouvy.

Těžko si představit, že před 12 lety existoval FineReader 2.0, který zabíral asi 10 MB místa na disku. Časem se balíček „rozrostl“ desetinásobně a nyní po instalaci zabírá až 300 MB. Hodně nebo málo - posuďte sami. Nový FR podporuje 179 rozpoznávacích jazyků, mezi nimiž jsou málo známé umělé jazyky (Ido, Interlingua, Occidental a Esperanto), programovací jazyky, vzorce atd. Nezapomínejme ani na podporu různých formátů a skriptů. Pokud tedy z nějakého důvodu chcete omezit prostor zabraný balíčkem, během instalace zkontrolujte pouze ty součásti, které budou během provozu vyžadovány.

Výběr komponentů ovlivňuje dobu instalace, která by však neměla zabrat mnoho času. Během procesu instalace budete seznámeni s hlavními funkcemi FR. Po aktivaci (na internetu, přes E-mail, pomocí přijatého kódu atd.) je program připraven k plnohodnotné práci. V demo režimu jistě narazíte na různá omezení, která bohužel neumožňují balíček plně využít.

Rozhraní FineReader. Funkčnost

Přístup k funkcím programu je dostupný jak pomocí skriptů, které se objeví v hlavní nabídce ihned po procesu instalace, tak i přes hlavní rozhraní.

Úvodní obrazovka při spouštění FineReaderu

Vzhled program od verze k verzi neprochází žádnými zvláštními změnami: vývojáři nevidí důvod jej drasticky měnit. Značná pozornost je věnována ergonomii, která je patrná u všech produktů ABBYY (Lingvo, PDF Transformer, FlexiCapture...). Jinými slovy, rozhraní Fine Reader 12 je dobře promyšlené a je určeno všem uživatelům, včetně začátečníků. Princip „Získejte výsledek jedním kliknutím“ osloví ty, kteří nejsou zvyklí něco nastavovat a měnit. Na druhou stranu víc pokročilé uživatele můžete FineReader doladit pomocí dialogu nastavení (Nástroje -> Možnosti...). Jediné upozornění: pro pohodlnou práci v aplikaci je žádoucí nastavit rozlišení obrazovky na 1280 × 800, aby byly všechny nástroje vždy, jak se říká, po ruce.

Po spuštění programu Fine Reader se zobrazí okno s tlačítky pro rychlý přístup k funkcím programu. Tato nabídka je dostupná také prostřednictvím nabídky Nástroje -> ABBYY FineReader, tlačítka "Základní skripty" v pravém rohu programu nebo pomocí kombinace kláves Ctrl+N (podobně jako ve Wordu, kde tato kombinace otevře nový dokument) .

Skenování do aplikace Microsoft Word: devátá verze FineReaderu zavedla podporu pro Microsoft Word 2007, který se zatím nestal populární. Na panelu nástrojů aplikací Microsoft Office, v sekci doplňků se po instalaci FR objeví „značková“ červená ikona.

Nabídka pro export rozpoznaného dokumentu FineReader

Výběr jazyků pro skenování a rozpoznávání dokumentů

Kromě Microsoft Office podporuje FR integraci s Microsoft Outlook, poskytuje export výsledků rozpoznávání do stejných aplikací Microsoft Word, Excel, Lotus Word Pro, Corel WordPerect a Adobe Acrobat. Tyto funkce do jisté míry usnadňují a urychlují práci s programem, zejména pokud v něm musíte pravidelně pracovat.

PDF nebo obrázky v aplikaci Microsoft Word: rozpoznat data z PDF - nebo jiného typu grafického souboru podporovaného verzí Finereader 12. Je třeba poznamenat, že technologie pro extrakci textu z PDF souboru ve FR není jen „odloupnutím“ textového obsahu (textová vrstva v PDF může chybět) z grafického. Ve skutečnosti je technologie rozpoznávání poměrně komplikovaná: po analýze obsahu dokumentu se program rozhodne, co a jak s textem udělá: stačí extrahovat nebo rozpoznat a tak dále pro každý textový fragment.

Skenování do aplikace Microsoft Excel: skenování do XLS (formát Microsoft Excel) může být oprávněné, pokud naskenovaný obrázek obsahuje tabulky.

Skenování do PDF: Existuje mnoho důvodů pro skenování do PDF. Jedním z nich je zabezpečení: je to jediný formát známý FR, který lze nakonfigurovat tak, aby byl chráněn heslem. Heslo se nastavuje nejen pro otevření dokumentu, ale také pro jeho tisk a další operace. Je možné zvolit jednu ze tří úrovní šifrování: 40bitové, 128bitové na základě standardu RC4, 128bitové úrovně podle standardu AES (Advanced Encryption Standard).

Převést fotografii do aplikace Microsoft Word: převod souboru z grafického formátu (může to být PDF nebo vícestránkový obrázek) do DOC / DOCX.

Otevřít v aplikaci Fine Reader: otevřete grafický soubor (PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG) pro rozpoznání FineReaderem.

Práce ve FineReaderu

Nyní - stručně o funkcích programu. Celý proces je rozdělen na skenování, rozpoznávání a ukládání výsledků. Poté, co zvolíte typ akce programu, specifikujete soubor nebo zařízení, které chcete skenovat, FineReader postupně plní svůj úkol, který je mimochodem pro centrální procesor poměrně náročný na zdroje.

Jestli ty - šťastný majitel dvoujádrový procesor, pak při práci v balíčku Fine Reader 12 můžete ocenit sílu rychlosti počítače. Faktem je, že FR, když detekuje dvoujádrový procesor, rozpozná paralelně ne jednu, ale dvě stránky dokumentu najednou. Maličkost - ale pěkné.

Nejprve přichází na řadu skenování, poté rozpoznání a export dočasného dokumentu do zvoleného formátu.

Proces rozpoznávání dokumentů PDF

Snímání.Žádný předvolby v aplikaci FineReader (kromě výběru čtečky) to před skenováním nemusíte dělat. Proto byly vynalezeny skripty: jsou navrženy tak, aby zjednodušily provádění stejného typu akcí.

Uznání. Zjednodušení se dotklo i dalších maličkostí. Pokud si tedy vzpomeneme na minulé verze programu, museli jsme předtím ručně změnit jazyk (jazyky, pokud jich bylo několik) dokumentu. Nyní se to děje automaticky, i když ne vždy. V druhém případě FR nenápadně nabízí kontrolu jazyka dokumentu.

Vraťme se k technologii rozpoznávání FR: proč program nejprve naskenuje celý dokument a ne stránku po stránce? Jak již bylo zmíněno, text je rozpoznán na základě celého obsahu: jsou vybrána písma podobná velikostí / typem písma, tabulky a okraje, odsazení atd.

Nebuďte překvapeni, když vám FineReader 12 zobrazí zprávu, že stránku nelze rozpoznat, protože nebyla nalezena žádná textová oblast. Pro experiment jsme fotili dál mobilní telefon z obrazovky LCD - oblast textového dokumentu (avšak znalost výsledku je již předem). Fine Reader 12 nerozpoznal text na obrázku, protože byl zjevně v takové kvalitě, že na to zjevně nestačí. Při druhé návštěvě jsme se vyfotili digitální fotoaparát stránka s textem za normálního osvětlení.

FineReader pasáž bez problémů rozpoznal, zachoval formátování a označil fixy některé pochybné body nebo znaky, které mohou mít variantní pravopis.

Jak vidíte na obrázku, jedná se především o tečky, pomlčky, čárky – obecně malé znaky. Navíc je jasně vidět, že program zohlednil hrbolky, zakřivení fotografované stránky a zarovnal řádky textu. Závěr - FR se se svým, i když nepříliš obtížným úkolem, odvedla na výbornou.

Občas si některé drobné body program Fine Reader nevšimne, ale lze je snadno ručně opravit. Naštěstí má balíček svůj vlastní WYSIWYG editor, jehož možnosti jsou zcela dostačující k provedení finální úpravy dokumentu. K dispozici je také kontrola pravopisu.

Jak zlepšit přesnost rozpoznávání, abyste se později museli potýkat s úpravou textu v menší míře? Nejprve můžete připojit vlastní slovník Microsoft Word. Pravda, nárůst přesnosti je těžké posoudit, snad kromě nárůstu slovní zásoby kontroly pravopisu (modul, který kontroluje pravopis a gramatiku). Pro zlepšení rozpoznávání má mimo jiné smysl seznámit se s nastavením programu (Nástroje -> Možnosti) a vybrat si jeden ze dvou režimů:

pečlivé rozpoznání- lze jej vybrat při rozpoznávání dokumentů jakékoli "složitosti": s tabulkami bez mřížky, textem, grafy, tabulkami na barevném pozadí atd. Může pomoci i s nekvalitním zdrojem pro rozpoznávání

rychlé rozpoznání - tento režim doporučeno pro zpracování velkých objemů dokumentů s jednoduchým rozvržením, nebo když čas neumožňuje důkladné rozpoznání. Ve většině případů, když máte černě vytištěný text na bílém pozadí, můžete se zastavit u rychlého rozpoznání.

Obecně je zlepšování kvality FineReaderu samostatným tématem k diskuzi, o jehož podrobnostech se můžete dozvědět z oficiální nápovědy, konkrétně v sekci „Jak zlepšit výsledky“.

Ukládání dokumentu. Poslední fází práce ve Fine Reader 12 je uložení konečného výsledku v určitém grafickém/textovém formátu. Předběžná nastavení ukládání lze zadat v možnostech FR: Nástroje -> Možnosti, záložka Uložit. Každý formát má svá vlastní nastavení. Při ukládání ve formátu DOCX byste měli dbát na kompatibilitu formátu (soubory DOCX nejsou ve Wordu 2003 rozpoznány<). В txt-файлах не забудьте проверить правильность кодировки (особенно в случае с текстом в кириллице).

ABBYY Screenshot Reader

Vývojáři často rádi přidávají malé obslužné programy do mnoha velkých balíčků. Řekněme, že známá aplikace Nero pro vypalování disků obsahuje sadu 3 až 5 utilit, které umožňují dělat věci, které ani samotné Nero neumí. Přehled (zde si můžete stáhnout jako součást Fine Reader 12).

Pokud jde o FineReader, v jeho složení se nachází jedna malá aplikace Screenshot Reader. S ním můžete také rychle převést do požadovaného formátu pomocí FR. Program je dostupný prostřednictvím nabídky Start (Start -> Všechny programy -> ABBYY FineReader 12.0 -> ABBYY Screenshot Reader.).

Možnosti Screenshot Readeru jsou poněkud širší, než by se na první pohled mohlo zdát. (Jinak by to šlo udělat pouhým stisknutím klávesy "PrintScreen" na klávesnici). Kromě toho, že Screenshot Reader pořídí snímek obrazovky (nebo spíše vybranou oblast obrazovky), je program úzce integrován s FR.

Když kliknete na tlačítko "Snímek" na panelu Screenshot Reader, kurzor změní tvar a zapne se nástroj pro výběr obrazovky. Vybraná oblast obrázku je orámována pro další rozpoznání textu (spustí se automaticky).

V rozevíracím seznamu můžete vybrat požadovanou akci: ve skutečnosti Screenshot Reader duplikuje rychlé skripty FR s tím rozdílem, že místo snímku ze skeneru je jako vstup přijat snímek obrazovky.

Nutno podotknout, že program spolu s celým balíčkem vyžaduje aktivaci. Při registraci produktu je ABBYY FineReader 12 Professional Edition Screenshot Reader poskytován zdarma jako „bonus“.

Závěr

jemný čtenář - nepostradatelný program pro skenování a rozpoznávání grafických dat. Rozhraní v ruském jazyce a dostupnost nastavení nezastraší nezkušený uživatel. Podpora nejnovějších formátů inovativní technologie a v důsledku toho vysoce kvalitní uznání tvoří program Nejlepší volba, zejména proto, že ABBYY FineReader stále nemá v této oblasti konkurenci.

Klávesové zkratky FineReader 12

Vytvořit nový dokument ABBYY FineReader-CTRL+N
Otevřete dokument aplikace ABBYY FineReader 12 - CTRL+SHIFT+N
Uložit stránky-CTRL+S
Uložit obrázek do souboru- CTRL+ALT+S
Rozpoznejte všechny stránky dokumentu- CTRL+SHIFT+R
Zavřít aktuální stránku- CTRL+F4
Rozpoznejte vybrané stránky dokumentu ABBYY FineReader-CTRL+R
Otevřete Správce scénářů- CTRL+T
Otevřete dialogové okno Fine Reader Options- CTRL+SHIFT+O
Otevřete Nápovědu- F1
Přejděte do okna Dokument-ALT+1
Přejděte do okna Obrázek- ALT+2
Přejděte do okna Text- ALT+3
Přejděte do okna Close-up- ALT+4