Jak používat ABBYY FineReader

Takže máme na počítači nainstalovaný FineReader. Zapneme skener a zdigitalizujeme nějaký vícestránkový dokument. Říkejme tomu podmíněně „Smlouva“.

Položíme první stránku dokumentu na sklo skeneru, zavřeme víko. Spouštíme Program FineReader. Klikněte na tlačítko "Skenovat" nebo stiskněte kombinaci "Ctrl + K" s klávesami. Otevře se okno ABBYY FineReader Scanning. Při digitalizaci obvyklé textová stránka napsaný fontem 11-12 bodů, ponechte nastavení ve výchozím okně a klikněte na tlačítko "Zobrazit".

Skener funguje a po pár sekundách vidíme naši stránku v prohlížecím okně. Zde můžeme v případě potřeby změnit velikost skenování. A poté klikněte na tlačítko "Skenovat".

FineReader spustí proces OCR a během minuty se v okně programu otevře obraz stránky. Pravá část Okno je nyní rozděleno na tři části. V levé části "Obrázek" můžeme obrázek upravit. Více o úpravách obrázků si můžete přečíst v lekci: Skenování knihy. V pravé sekci "Text" můžete okamžitě provádět změny v textu - upravovat obsah stránky ještě před jejím uložením. To je velmi výhodné, když například potřebujete rychle změnit data, údaje, příjmení v dokumentu.

V levé části okna „Stránky“ se zobrazí ikona rozpoznané stránky:

Pokud nepotřebujete nic upravovat, vyměňte první stránku na skle skeneru za druhou a zopakujte technologii. Po nastavení rozměrů skenování v okně "ABBYY FineReader Scanning" v režimu "Zobrazit" pro první stránku nyní ihned klikněte na tlačítko "Skenovat". Nastavení pro první stránku se uloží a další stránky se naskenují bez náhledu. Naskenujeme tedy všechny stránky našeho dokumentu.

Skončili jsme a nyní střídavým klikáním na ikony otevíráme stránky a kontrolujeme jejich správné pořadí.

Poté v levé části okna "Stránky" vyberte všechny ikony tlačítkem: "Upravit - Vybrat vše" nebo klávesovou zkratkou: "Ctrl + A". Poté v rozevíracím seznamu vedle tlačítka „Uložit“ vyberte příkaz: „Uložit jako PDF dokument":

Nyní zatleskáme na samotné tlačítko a uložíme dokument s názvem „Agreement.pdf“ do složky „Agreement“:

Ve výsledku získáme vícestránkový Textový dokument formát pdf - elektronická verze našeho dokumentu s krycím názvem „Smlouva“.

Takže digitalizujeme textové dokumenty pomocí FineReaderu.

Změnou režimu skenování na „barevný“ v okně „Skenování ABBYY FineReader“ můžeme také snadno digitalizovat barevné obrázky a fotografie.

A ptát se kontextová nabídka, například příkaz: „Uložit jako dokument Microsoft Word 2007“ převedeme náš projekt do jediného vícestránkového upravitelného dokumentu aplikace Word.

Obecně je program snadno stravitelný, intuitivní a vyskakovací rady jsou všude.

Ahoj. Dnes budu mluvit o tom, jak pomocí Abbyy FineReader rozpoznat text z obrázku, který byste mohli získat jako výsledek skenování. Váš naskenovaný text bude kompletně v dokumentu Microsoft Word a tento rozpoznaný text bude možné upravit! Rozpoznat text, když Abbyyina pomoc Finereader může být užitečný pro ty, kteří studují, pracují s texty a překlady. Program je bohužel placený. Jednou jsem zkusil jeden z bezplatné možnosti podobné programy, ale velmi dobře naskenovaný text je rozpoznán prostě strašně... A rozpoznávání textu v Abbyy FineReader se ukazuje jako velmi kvalitní! Nyní vám ukážu, jak pomocí Abbyy FineReader rychle rozpoznat text z obrázku.

ABBYY FineReader má zkušební verze po dobu 30 dnů s možností rozpoznat až 100 stránek a uložit maximálně 3 stránky z dokumentu. Tito. během této doby můžete vidět možnosti programu a učinit informované rozhodnutí - zda jej potřebujete, zda stojí za to koupit nebo ne.

Jak nainstalovat Abbyy FineReader!

Před použitím Abbyy Finereader je třeba jej nainstalovat. Zvažte proces instalace tohoto programu...

Nejprve vyberte jazyk programu. Klikněte na "OK".

Přijímáme podmínky licenční smlouva(pokud chcete, můžete si přečíst licenční smlouvu, pokud vás zajímá, o co jde). Stlačíme "Další".

Dále musíte vybrat režim instalace. Na normální mód program se vás nebude ptát a nainstaluje to, co je v programu nastaveno standardně, tedy všechny komponenty: samotný program Abbyy Finereader pro rozpoznávání textu, komponenta pro programy Microsoft Office a součást pro Průzkumník Windows (umožňující rychle rozpoznávat obrázky bez otevření samostatného programu). Radím vám poznamenat vlastní instalace nastavit tak, jak chcete. Navíc to nezabere ani 15 minut :) Níže je složka, kam se program nainstaluje. Je vhodné ponechat výchozí výběr, aby později při používání programu nebyly žádné problémy. Stlačíme "Další".

Komponenty programu. Toto okno se zobrazí pouze v případě, že zvolíte typ instalace "Vlastní". Komponenty jsou něco jako pomocné aplikace k programu. První složka „Integrace s programy společnosti Microsoft kancelář a Průzkumník Windows". Tato komponenta se zobrazí v nabídce Microsoft Office a pokud kliknete pravým tlačítkem myši na obrázek na vašem počítači, pak tam bude položka s tímto programem. Takto bude vypadat vaše nabídka v Microsoft Office po přidání této komponenty.

A co se stane, když kliknete pravým tlačítkem na obrázek:

Tito. objeví se nabídka, kde můžete provést rychlé OCR a odeslat výsledky do Wordu, Excelu nebo PDF.

Druhá komponenta vám umožní rozpoznat text z obrazovky počítače. To znamená, že můžete pořídit snímek obrazovky a také rozpoznat text. Pokud nechcete instalovat jednu z těchto součástí nebo nechcete instalovat obě vůbec, musíte kliknout na šipku dolů a vybrat „Tato součást nebude k dispozici“. Potom se komponenta nenainstaluje. Nechal jsem obojí.

Další 4 body. 1st znamená, že informace o tom, jak používáte program Abbyy Finereader, budou předány vývojáři. Doporučuji tuto položku neoznačovat, aby se program znovu nepřepnul do režimu online za účelem odeslání informací o práci s ním. Navíc nikdy nevíte, jaké další informace budou odeslány :) 2. položka vytváří zástupce programu na ploše. 3. znamená, že se program spustí po zapnutí počítače, a 4. zkontroluje aktualizace programu. Nechávám jen druhý a nechávám před ním klíště. Všechno zavíráme aplikace společnosti Microsoft Office, protože to instalátor vyžaduje a klikněte na „Instalovat“.

Musíte počkat několik minut, než se program načte, a klikněte na „Další“.

Vše, instalace je dokončena! Klikneme na „Dokončit“.

Jak rozpoznat text z naskenovaného nebo jakéhokoli jiného obrázku pomocí Abbyy Finereader?

Podívejme se, jak program používat. Například jste naskenovali text. Chcete-li nyní rozpoznat text v Abbyy FineReader, otevřete program. Klikněte na "Otevřít".

Vyberte požadovaný obrázek a klikněte na Otevřít.

Kdy otevřeš požadovaný dokument, Abbyy Finereader začne rozpoznávat text. Čím větší dokument, tím déle bude rozpoznání trvat. Rozpoznání jedné stránky může trvat několik sekund.

Po rozpoznání textu budete muset výsledek pouze uložit Dokument společnosti Microsoft Word, abyste v něm pak mohli cokoliv upravovat. Chcete-li to provést, klikněte na tlačítko "Uložit". horní panel nástrojů a poté vyberte, do které složky bude dokument aplikace Word uložen a pod jakým názvem.

Pokud máte k počítači připojený skener, můžete začít skenovat přímo z programu a poté bude naskenovaný dokument okamžitě rozpoznán. Chcete-li to provést, klikněte na tlačítko "Skenovat" na horním panelu nástrojů. Další akce budou záviset na programu ovladače pro vaši tiskárnu. Musíte pouze postupovat podle pokynů průvodce skenováním.

Jak vidíte, vše je velmi jednoduché a rychlé. Nyní víte, jak používat Abbyy FineReader k rozpoznání textu z obrázků! Doufám, že tato informace pomůže mnoha lidem :) Hodně štěstí!

I když zálohy dané umělá inteligence(AI) za posledních 50 let „chytré“ stroje ani o kousek nepřiblížily lidské kognitivní schopnosti, bylo by nefér zcela popírat pokrok v tomto směru. Nejviditelnějším a nejvýraznějším příkladem jsou šachy (nemluvě o dalších jednoduché hry). Počítač zatím nedokáže napodobit naše myšlení, ale je docela schopný tuto mezeru dohnat velkým množstvím specializované paměti a rychlostí výčtu. Vladimír Kramnik označil hru programu Deep Fritz, která ho vyhrála v roce 2006, za „nelidskou“ v tom smyslu, že často odporovala zavedeným (lidským) pravidlům strategie a taktiky.

Před o něco více než rokem se novému průlomu povedl další výplod IBM, který svého času položil základy triumfálních šachových vítězství počítačů (slavná Deep Blue), zvaný Watson, který s velkým náskokem porazil dva šampiony populárního amerického kvízu Jeopardy. Je však důležité, že ačkoli Watson vyslovil odpovědi sám, otázky mu byly stále předávány textová forma. To naznačuje, že pokrok v mnoha oblastech aplikace umělé inteligence – rozpoznávání řeči a obrazu, strojový překlad – je poměrně skromný, i když nám to nebrání v jejich uvádění do praxe dnes. Asi největší úspěch vykazují systémy optického rozpoznávání znaků (OCR, Optical Character Recognition), které asi všichni uživatelé PC tak či onak znají. Navíc ruský vývoj v této oblasti zaujímá ve světě důstojné místo – mám na mysli ABBYY FineReader.

Trocha historie

Aktuální verze ABBYY FineReader má číslo 11, což znamená, že aplikace ušla dlouhou cestu ve vývoji a dokonce i historie tohoto procesu je do jisté míry zajímavá. Aniž bych předstíral vyčerpávající kroniku, uvedu pouze hlavní milníky za uplynulou dekádu, během níž jsem FineReader víceméně sledoval:

Rok	Verze	Klíčové vlastnosti
2003	7.0	Až 25% zvýšení přesnosti rozpoznávání. Nejvíce se to projevilo v tabulkách, zvláště složitých, s barevnými buňkami, skrytými oddělovači atp.
2005	8.0	Další optimalizace rozpoznávacích algoritmů primárně zaměřená na práci nikoli se skeny dokumentů, ale s digitálními fotografiemi. K tomu se objevil doplňkové funkce příprava předloh (eliminace zkreslení, zarovnání čar atd.).
2007	9.0	Nástup technologie ADRT, která zohledňuje logickou strukturu celého zpracovávaného (vícestránkového) dokumentu a je schopna selektovat opakující se prvky (záhlaví a zápatí), propojovat „tekoucí“ objekty (tabulky) atp.
2009	10.0	Další vylepšení ADRT a rozpoznávacích algoritmů, zvýšení přesnosti zpracování originálů s nízkým rozlišením až o 30 %.
2011	11.0	Hlavní pozornost je věnována rychlosti programu. "Druhý příchod" černobílý režim, který je na originálech dobrá kvalita poskytuje dodatečné zrychlení až o 30 %.

FineReader samozřejmě ve stejné době rozšířil podporu formátů dokumentů, vylepšil vestavěné nástroje a rozhraní, zlepšil reprodukci struktury originálů atd. To nejdůležitější však přímo souvisí s technologiemi OCR a docela dobře demonstruje křečovitý vývojový proces charakteristický pro složité vědecky náročné systémy, kdy po dalším „průlomu“ následuje určité období „klidu“, nutného pro zlepšení algoritmů. Představují hlavní hodnotu jakéhokoli programu OCR, a proto detailní informace o nich se k uživatelům dostane velmi zřídka. Společnost ABBYY však laskavě souhlasila s odstraněním závoje tajemství a dnes máme možnost nahlédnout do vnitřní svatyně FineReaderu.

Základní principy

Jelikož tedy OCR patří do oblasti AI, je celkem logické, že se vývojáři snaží alespoň do určité míry napodobit činnost našeho mozku. Struktura našeho zrakového systému je samozřejmě neuvěřitelně složitá, ale základní „velkoblokové“ principy jeho fungování jsou dostatečně prozkoumány, obvykle jsou tři:

Integrita- objekt je považován za soubor jeho částí a (pro vizuální obrazy) prostorových vztahů mezi nimi. Části jsou zase interpretovány pouze jako část celého objektu. Tento princip pomáhá budovat a upřesňovat hypotézy a rychle odříznout ty nepravděpodobné.
cílevědomosti- protože každá interpretace dat má specifický cíl, rozpoznávání je také procesem předkládání hypotéz o objektu a jejich účelového testování. Systém fungující v souladu s tímto principem nejen ušetří peníze výpočetní výkon ale také je méně pravděpodobné, že se mýlí.
Přizpůsobivost- systém ukládá informace nashromážděné v průběhu práce a znovu je používá, tj. sám se učí. Tento princip vám umožňuje vytvářet a shromažďovat nové znalosti a vyhýbat se jim opětovné rozhodnutí stejné úkoly.

FineReader je jediný OCR systém na světě, který funguje v souladu s výše popsanými principy ve všech fázích zpracování dokumentů. Odpovídající technologie se nazývá IPA- prvními písmeny anglických výrazů. Například podle principu integrity bude fragment obrazu interpretován jako symbol pouze tehdy, pokud obsahuje všechny strukturální části podobných objektů a těch, které jsou v určitých vztazích. To pomáhá nahradit prohledávání velkého množství šablon (při hledání více či méně vhodné) účelovým testováním přiměřeného počtu hypotéz, navíc na základě dříve nashromážděných informací o možných stylech znaků v uznávaném dokumentu.

Principy IPA se však uplatňují při analýze nejen fragmentů odpovídajících (pravděpodobně) jednotlivým znakům, ale i celého původního obrazu stránky. Většina systémů OCR je založena na rozpoznání hierarchické struktury dokumentu, to znamená, že stránka je rozdělena na základní strukturní prvky, jako jsou tabulky, obrázky, textové bloky, které jsou zase rozděleny na další charakteristické objekty - buňky, odstavce - a tak dále, až po jednotlivé znaky.

Takovou analýzu lze provést dvěma hlavními způsoby: shora dolů, tj. od základních prvků k jednotlivým postavám, nebo naopak zdola nahoru. Nejčastěji se používá jeden z nich, ale společnost ABBYY vyvinula speciální algoritmus MDA(víceúrovňová analýza dokumentů, víceúrovňová analýza dokumentů), která kombinuje obojí. Ve zkratce to vypadá takto: struktura stránky je analyzována metodou shora dolů a rekonstrukcí elektronický dokument na konci rozpoznávání postupuje zdola nahoru, na všech úrovních však další mechanismus zpětná vazba. V důsledku toho se výrazně snižuje pravděpodobnost hrubých chyb spojených s nesprávným rozpoznáním objektů na vysoké úrovni.

ADRT

Historicky se systémy OCR vyvíjely z rozpoznávání jednoho znaku. Tento úkol je stále nejdůležitější a nejobtížnější, jsou s ním spojeny nejsložitější algoritmy. Brzy se však ukázalo, že při řešení mohou pomoci informace vyšší úrovně (například o jazyce dokumentu a správném pravopisu rozpoznaných slov) – tak se objevily kontroly kontextu a slovníku. Pak touha zachovat formátování a znovu vytvořit fyzickou strukturu (tj. relativní polohu různých objektů) dokumentu vedla k potřebě podrobné analýzy celé stránky. Je jasné, že i to má významný vliv na Celková kvalita rozpoznávání, protože pomáhá správně zpracovat vícesloupcový layout, tabulky a další způsoby „nelineárního“ uspořádání textu.

Většina moderních OCR funguje na těchto třech úrovních – znaky, slova, stránky – procvičuje, jak již bylo zmíněno, přístupy shora dolů nebo zdola nahoru. Společnost ABBYY však v souladu s principy IPA zavedla do FineReaderu ještě jednu úroveň – celkem vícestránkový dokument. Především to bylo nutné pro správnou reprodukci logické struktury, která je v moderních dokumentech stále složitější. Ale také existuje další bonusy: zvýšení přesnosti a zrychlení zpracování opakujících se objektů, správnější identifikace (a potažmo rozpoznání) objektů „přetékajících“ ze stránky na stránku.

K tomu byl navržen. ADRT(Adaptive Document Recognition Technology) – technologie pro analýzu a syntézu dokumentu na logické úrovni. V konečném důsledku pomáhá, aby byl výsledek práce FineReaderu co nejvíce podobný originálu. Za tímto účelem se analyzuje obraz celého dokumentu a rozpoznaná slova se spojí do skupin (shluků) v závislosti na stylu, prostředí a umístění na stránce. Program tedy jakoby vidí „logiku“ označení dokumentu a v budoucnu může sjednotit návrh výsledku.

Díky ADRT se FineReader od verze 9.0 naučil detekovat, rozpoznávat a reprodukovat následující konstrukční části a prvky formátování dokumentu:

hlavní text;
záhlaví a zápatí;
čísla stránek;
nadpisy stejné úrovně;
obsah;
textové vložky;
popisky pro kresby;
stoly;
poznámky pod čarou;
podpisové/tiskové zóny;
písma a styly.

Proces rozpoznávání

Podle algoritmu MDA začíná skutečné rozpoznávání shora dolů, od úrovně stránky. Je jasné, že čím více chybných rozhodnutí je učiněno v raných fázích tohoto procesu, tím více jich bude v dalších. Proto přesnost rozpoznávání tolik závisí na kvalitě originálů, ale významný význam mohou mít i jejich algoritmy předběžného zpracování. Jak tedy ve FineReaderu rostla popularita barevných dokumentů, objevil se postup adaptivní binarizace (adaptivní binarizace, AB). Pokud okamžitě naskenujete dokument v černobílém režimu, kde jsou vodoznaky nebo je text umístěn na texturovém nebo barevném substrátu, pak se na obrázku vždy objeví „odpad“, který pak bude poměrně obtížné oddělit od „užitečného“ obrázku (protože původní informace o něm již byly ztraceny). To je důvod, proč FineReader preferuje práci s barevnými obrázky nebo obrázky ve stupních šedi a sám je převádí na černobílé (tento proces se nazývá binarizace). Ale to není všechno. Vzhledem k tomu, že barvy textu a pozadí se mohou na stránce a dokonce i na jednotlivých řádcích lišit, AB zvýrazňuje slova s víceméně stejnými vlastnostmi a pro každé vybírá optimální parametry binarizace z hlediska kvality rozpoznávání. To je právě adaptabilita algoritmu, který je tak příkladem využití zpětné vazby v MDA. Je zřejmé, že účinnost AB silně závisí na návrhu zdrojových dokumentů – na testovací bázi ABBYY tento algoritmus zajistil zvýšení přesnosti rozpoznávání o 14,5 %.

Ale to nejzajímavější samozřejmě začíná, když proces rozpoznávání klesá na nejnižší úrovně. Postup tzv. lineárního dělení rozděluje řetězce na slova a slova na jednotlivá písmena; dále v souladu s principem IPA tvoří soubor hypotéz (tj. možnosti o jaký druh znaku se jedná, na jaké znaky je slovo rozděleno atd.) a poté, co každému poskytne odhad pravděpodobnosti, jej předá na vstup enginu rozpoznávání znaků. Ten se skládá z řady tzv klasifikátory, z nichž každá také generuje řadu hypotéz, seřazených podle odhadovaného stupně pravděpodobnosti. Nejdůležitější charakteristika libovolného klasifikátoru je průměrná pozice správné hypotézy. Je jasné, že čím je vyšší, tím méně práce pro následné algoritmy - například kontrolu slovníku. Ale u dostatečně dobře nastavených klasifikátorů se nejčastěji hodnotí takové vlastnosti, jako je přesnost rozpoznávání podle prvních tří hypotéz nebo jen podle první - tedy zhruba řečeno schopnost uhodnout správnou odpověď ze tří nebo jednoho pokusu. ABBYY používá ve svých systémech následující typy klasifikátory: rastr, rys, diferenciál příznaků, obrysový, strukturální a strukturální diferenciál – které jsou seskupeny na dvou logických úrovních.

Princip fungování RK, neboli rastrový klasifikátor, je založen na porovnání pixelu po pixelu obrázku symbolu s odkazy. Ty jsou vytvořeny jako výsledek průměrování obrázků z trénovacího vzorku a jsou redukovány na určitou standardní formu; podle toho jsou pro rozpoznatelný obraz také předem normalizovány velikost, tloušťka prvků a sklon. Tento klasifikátor se vyznačuje jednoduchostí implementace, rychlostí provozu a odolností vůči obrazovým vadám, ale poskytuje relativně nízkou přesnost, a proto se používá v první fázi - k rychlému generování seznamu hypotéz.

Klasifikátor funkcí ( PC), jak již název napovídá, je založen na přítomnosti znaků konkrétní postavy na obrázku. Pokud existuje N takových znaků, pak každá hypotéza může být reprezentována bodem v N-rozměrném prostoru; podle toho bude přesnost hypotézy odhadnuta podle vzdálenosti od ní k bodu odpovídajícímu standardu (který je také vyvinut na tréninkové množině). Je jasné, že o kvalitě rozpoznávání do značné míry rozhodují typy a množství funkcí, takže jich bývá poměrně hodně. Tento klasifikátor je také poměrně rychlý a jednoduchý, ale málo odolný vůči různým vadám obrazu. Navíc PC nepracuje s původním obrazem, ale s určitým modelem, abstrakcí, tedy nebere v úvahu některé informace: například samotný fakt přítomnosti některých důležité prvky neříká nic o jejich relativní pozici. Z tohoto důvodu se PC nepoužívá místo, ale společně s RK.

klasifikátor obrysů ( QC) představuje speciální případ Počítač se liší tím, že analyzuje obrysy zamýšlené postavy, extrahované z původního obrázku. Obecně je jeho přesnost nižší než u plnohodnotného PC.

Diferenciální klasifikátor prvků ( MPC) je také podobný PC, ale používá se pouze k rozlišení podobných objektů, jako je „m“ a „rn“. Analyzuje tedy pouze ty oblasti, kde jsou rozdíly skryté, a je živena nejen počátečními obrazy, ale také hypotézami vytvořenými v raných fázích rozpoznávání. Princip jeho fungování je však poněkud odlišný od PC. Ve fázi tréninku se v N-rozměrném prostoru vytvoří dva „oblaky“ (skupiny bodů) možných hodnot pro každou ze dvou možností, poté se postaví nadrovina, která „oblaky“ od sebe oddělí a je od nich přibližně ve stejné vzdálenosti. Výsledek rozpoznání závisí na tom, do kterého poloprostoru spadá bod odpovídající původnímu obrázku.

MPC samo o sobě nepředkládá hypotézy, ale pouze zpřesňuje ty stávající (jejichž seznam je obecně řazen bublinovou metodou), takže nedochází k přímému posouzení jeho účinnosti, ale nepřímo se přirovnává k charakteristikám celé první úrovně rozpoznávání OCR. Je však zřejmé, že záleží na správnosti zvolených znaků a reprezentativnosti vzorku norem, což je poměrně pracný úkol.

Strukturní diferenciální klasifikátor ( KFOR) byl původně používán ke zpracování ručně psané texty. Jeho úkolem je rozlišovat mezi takovými podobnými objekty jako "C" a "G". SDK je tedy založeno na vlastnostech charakteristických pro každou dvojici znaků, proces jeho učení je ještě složitější než u MPC a rychlost práce je nižší než u všech předchozích klasifikátorů.

Strukturní klasifikátor ( SC) je chloubou ABBYY, původně byl vyvinut pro rozpoznávání tzv. ručně tištěného textu, tedy když člověk píše „tištěným“ písmenem, ale následně byl použit pro tisk. Používá se v závěrečných fázích rozpoznávání a vstupuje do činnosti poměrně zřídka, totiž pouze tehdy, když k němu dosáhnou alespoň dvě hypotézy s dostatečně vysokou pravděpodobností.

Kvalitativní charakteristiky všech klasifikátorů jsou shrnuty v následující tabulce. Umožňují však pouze vzájemné hodnocení účinnosti algoritmů, protože nejsou absolutní, ale jsou získány na základě zpracování konkrétního testovacího vzorku. Může se zdát, že v posledních fázích rozpoznávání se bojuje doslova o zlomek procenta, ale ve skutečnosti každý klasifikátor významně přispívá ke zlepšení přesnosti rozpoznávání – například SC snižuje počet chyb o výrazných 20 %.

	RK	PC	QC	MPC*	KFOR**	SC**
Přesnost pro první tři možnosti, %	99,29	99,81	99,30	99,87	99,88	-
Přesnost podle první možnosti, %	97,57	99,13	95,10	99,26	99,69	99,73

* vyhodnocení celé první úrovně algoritmu ABBYY OCR
** odhad pro celý algoritmus po přidání odpovídajícího klasifikátoru

Je však zvláštní, že i přes poměrně vysokou přesnost to samotný rozpoznávací algoritmus neakceptuje konečné rozhodnutí. Podle principu MDA jsou hypotézy předkládány na každé logické úrovni a jejich počet může exponenciálně růst. Proto je nepravděpodobné, že by následné testování všech hypotéz bylo účinné, a proto systémy ABBYY OCR používají metodu strukturování hypotéz, tj. jejich přiřazování k určitým modelům. Těch posledních je několik desítek, zde je jen několik typů: slovo ze slovníku, slovo mimo slovník, arabské číslice, římské číslice, URL, regulární výraz- a každý může obsahovat sadu konkrétní modely(například slovo v některém ze známých jazyků, latině, azbuce atd.).

Všechny konečné akce jsou již provedeny s hypotézami sestavenými podle modelů. Například kontextová kontrola určí jazyk dokumentu a okamžitě výrazně sníží pravděpodobnost, že modely používají nesprávné abecedy, a kontrola slovníku vyrovná chyby v nejistém rozpoznání některých znaků: například slovo „turn“ je ve slovníku přítomno v angličtině- na rozdíl od "tum" (v žádném případě nepatří mezi oblíbené). I když je priorita slovníku vyšší než priorita jakéhokoli klasifikátoru, není to nutně poslední možnost a obecně to nebrání dalším kontrolám: za prvé, jak bylo uvedeno výše, existuje model slov bez slovníku, a za druhé, speciální organizace slovníků umožňuje s vysokou mírou pravděpodobnosti předpokládat, zda nějaké neznámé slovo může patřit do určitého jazyka. Přesto má kontrola slovníku (a úplnost slovníků) významný vliv na výsledek rozpoznávání a ve vlastních testech ABBYY snižuje počet chyb téměř na polovinu.

Nejen OCR

Tištěné dokumenty nejsou zdaleka jediné zajímavé z hlediska jejich digitalizace a automatické zpracování. Poměrně často musíte pracovat s formuláři, tedy dokumenty s předdefinovanými a pevnými poli, které se vyplňují ručně, ale poměrně přesně (tzv. ručně tištěné znaky) – příkladem mohou být různé dotazníky. Technologie jejich zpracování má samostatný název - ICR(inteligentní rozpoznávání znaků) - a dost výrazně se liší od OCR. Ano, protože v tento případ Vzhledem k tomu, že úkolem není znovu vytvořit celý dokument, ale extrahovat z něj konkrétní data, spadá to do dvou hlavních dílčích úkolů: nalezení potřebných polí a skutečné rozpoznání jejich obsahu.

Jedná se o poměrně specifickou oblast a společnost ABBYY pro ni nabízí zcela samostatný softwarový produkt ABBYY FlexiCapture. Je navržen tak, aby vytvářel automatizované a poloautomatizované systémy, zahrnuje vyladění specifických typů dokumentů, pro které jsou vytvářeny speciální šablony, umí inteligentně vyhledávat různá pole na stránkách a ověřovat v nich data atd. Je však založen na algoritmech rozpoznávání znaků podobných těm, které se používají ve FineReaderu, a skutečně obecné schéma velmi podobný:

Nicméně, důležitý rozdíl nicméně existuje: strukturní klasifikátor je povinným účastníkem procesu - je to dáno specifiky ručně psaných znaků. Kromě toho ICR zahrnuje velké množství specifických dodatečné kontroly: například zda znak není přeškrtnutý, nebo zda rozpoznané znaky skutečně tvoří datum.

Překlad textu do digitální formát je poměrně častým úkolem pro ty, kteří pracují s dokumenty. Abbyy Finereader vám ušetří spoustu času automatickým převodem titulků z bitmap nebo „čteček“ do upravitelného textu.

V tomto článku se podíváme na to, jak používat Abbyy Finereader pro OCR.

Jak rozpoznat text z obrázku pomocí Abbyy Finereader

Aby bylo možné rozpoznat text na bitmapa, jednoduše jej nahrajte do programu a Abbyy Finereader text automaticky rozpozná. Stačí jej upravit tak, že zvýrazníte ten, který potřebujete, a uložíte jej v požadovaném formátu nebo zkopírujete do textového editoru.

Text můžete rozpoznat přímo z připojeného skeneru.

Přečtěte si více na našem webu.

Jak vytvořit dokument PDF a FB2 pomocí Abbyy Finereader

Program Abbyy Finereader umožňuje převádět obrázky na univerzální ve formátu PDF a formát FB2 pro čtení dál e-knihy a tablety.

Proces vytváření takových dokumentů je podobný.

1. V hlavním menu programu vyberte sekci E-Book a stiskněte FB2. Vyberte typ zdrojového dokumentu - Skenovat, Dokument nebo Fotografie.

2. Najděte a otevřete požadovaný dokument. Načte se do programu stránku po stránce (to může chvíli trvat).

3. Po dokončení procesu rozpoznávání vás program vyzve k výběru formátu pro uložení. Vyberte FB2. V případě potřeby přejděte na „Možnosti“ a zadejte Dodatečné informace(autor, titul, klíčová slova, popis).

Po uložení můžete zůstat v režimu úpravy textu a přeložit jej do Formát Word nebo PDF.

Funkce úpravy textu v Abbyy Finereader

Existuje několik možností pro text rozpoznávaný Abbyy Finereaderem.

V původním dokumentu uložte obrázky a záhlaví a zápatí, aby byly přeneseny do nového dokumentu.

Analyzujte dokument, abyste věděli, jaké chyby a problémy mohou nastat během procesu převodu.

Upravte obrázek stránky. K dispozici jsou možnosti oříznutí, korekce fotografií a změny rozlišení.

Řekli jsme vám, jak používat Abbyy Finereader. Má poměrně širokou škálu úprav a převodu textů. Nechte tento program, který vám pomůže vytvořit jakékoli dokumenty, které potřebujete.

Jedna z nejoblíbenějších funkcí pro práci se skenováním a zpracováním souborů různé typy- Skvělý čtenář. Funkční softwarový produkt byl vyvinut ruskou společností ABBYY, umožňuje dokumenty nejen rozpoznávat, ale i zpracovávat (překládat, měnit formáty atd.). Mnoho uživatelů může pouze nainstalovat, ale nemohou okamžitě zjistit, jak používat ABBYY FineReader. Odpovědi na mnoho otázek najdete v tomto článku.

Program umožňuje skenovat a rozpoznávat text - a nejen to

Abychom podrobně pochopili, jaký druh programu ABBYY FineReader 12 je, je nutné podrobně zvážit všechny jeho funkce. První a nejjednodušší funkcí je skenování dokumentu. Existují dvě možnosti skenování: s rozpoznáním a bez něj. V případě běžného skenování vytištěného listu obdržíte naskenovaný obrázek do určené složky na vašem počítačovém zařízení.

POZORNOST. List musí být umístěn na snímací části tiskárny přesně podle obrysů vyznačených na tiskárně. Nemanipulujte se zdrojem, může to vést k špatná kvalita finální skenování.

Musíte se sami rozhodnout, co je pro vás FineReader, protože utilita má významnou funkcionalitu, například si můžete vybrat, v jaké barvě chcete získat obrázek, je možné převést všechny fotografie na černobílé. V černobílém rozpoznávání barev je rychlejší, kvalita zpracování se zvyšuje.

Pokud máte zájem o funkci rozpoznávání textu aplikace ABBYY FineReader, musíte před skenováním stisknout speciální tlačítko. V tomto případě existuje několik možností, jak informace získat. Ve výchozím nastavení se na vaší obrazovce zobrazí rozpoznaný kus listu, který můžete zkopírovat nebo upravit ručně.

Pokud zvolíte jiné funkce, můžete soubor okamžitě získat jako dokument Word nebo tabulku Excel. Volba funkcí je velmi jednoduchá, menu je intuitivní, snadno konfigurovatelné díky tomu, že všechna potřebná tlačítka máte na očích.

DŮLEŽITÉ. Před rozpoznáním Text ABBYY FineReader, musíte přesně vybrat jazyk zpracování. Navzdory skutečnosti, že nástroj funguje zcela automaticky, stává se to nízká kvalita zdrojový kód vám neumožňuje pochopit, jaký jazyk byl ve zdrojovém kódu. To značně snižuje kvalitu konečných výsledků aplikace.

Více provozních režimů

Chcete-li plně pochopit, jak používat ABBYY FineReader 12, musíte vyzkoušet dva provozní režimy: „Through“ a „Quick Recognition“. Druhý režim je vhodný pro vysoce kvalitní snímky, zatímco první režim je vhodný pro soubory s nízkou kvalitou. Důkladný režim trvá zpracování souborů 3-5krát déle.

Na obrázku je výsledek programu – rozpoznání textu z obrázku

Jaké další funkce existují?

Rozpoznávání textu v aplikaci ABBYY FineReader není jediné užitečná funkce. Pro větší uživatelské pohodlí existuje