ABBYY FineReader kullanılarak metin nasıl tanınır: adım adım talimatlar. Abbyy FineReader ile taranan metin nasıl tanınır?

Düzenlenemeyen ve grafik formatlardan metin tanıma için tasarlanmış ABBYY FineReader programını kullanmak için. öncelikle indirip bilgisayarınıza kurmanız ve ardından aşağıdaki videoyu izlemeniz gerekiyor, bu program hakkında her şey detaylı bir şekilde anlatılıyor.

Bu program, metni taramak ve tanımak, çalışmak için tasarlanmıştır.

Elbette kullanılabilir ve bu kullanımı gerçekleştirmek için, içinde çalıştığınız Finereader programından çıkmadan dosyanın metnini tanıyabilir ve ayrıca onu belgenin taranmış bir kopyasından bir klasiğe dönüştürebilirsiniz. biçim, Kelime programları. O zaman sizin kullanımınızda olduğu ortaya çıkacaktır.

Finereader, bilgileri popüler ortamlara aktaran bir tarama ve OCR programıdır. ofis paketleri. Özetle onunla çalışma prensibi şu şekilde açıklanabilir: Basılı metin içeren bir kağıt sayfa alırız, bir tarayıcı ile tararız, belirli bir grafik dosyası alırız bit eşlem biçimi. Daha sonra Finereader programından çıkmadan dosyanın metnini tanıyoruz ve sonraki adım taranan kopyadan bir Word belgesi yapmak. Bundan önce, tanınan metin görüntülenebilir ve düzenlenebilir. Ortaya çıkan kelime belgesi daha fazla eklenebilir ve düzenlenebilir.

Abbyyfinereader, bu tür programların şüphesiz lideridir.

Düzenlenemeyen ve grafik biçimlerdeki metinleri tanımak için çok geniş yeteneklere sahiptir.

Program, (düzenlenemeyen pdf, dijital dosya biçimleri jpeg, jpg, Djvu, gif, png, vb.) gibi temel biçimlerdeki metni tanıyabilecektir.

Ayrıca ABBYY FineReader neredeyse tüm tarayıcı modelleriyle iyi çalışır.

Programın ana işlevleri şunlardır:

Belgeleri şu biçimlerde tarama: Microsoft Word, Microsoft Excel, Pdf, görüntüleri tarayın ve kaydedin, PDF veya görüntüyü Microsoft Word'e kaydedin, fotoğrafı Microsoft Word'e dönüştürün.

ABBYY Finereader'ın çalışma alanı:

Yeni bir görev eklemek için, program çalışma alanının sol üst kısmında bulunan **yeni görev** düğmesine tıklamanız gerekir.

Açılacak pencere Yeni görev

Açılan pencerede gerçekleştirmek istediğiniz görevi seçin.

Diyelim ki elimizde Microsoft Word belge formatına dönüştürmek istediğimiz bir belgenin fotoğrafı var. Bunun için pencerede Yeni görev aktif başlığı bul Fotoğrafı Microsoft Word'e dönüştürün ve bu etikete tıklayın. Açılacak önizlemeli program gezgini penceresi :

Açılan pencerede bir fotoğraf seçin Metin dosyası tanınması ve ihtiyacınız olan biçime dönüştürülmesi gereken.

Açılacak Tanıma sürecinin ölçeğini içeren pencere:

Program fotoğrafı işledikten sonra metni tanımaya çalışır.

Aşağıdakileri göreceksiniz:

Burada metin tanıma için fotoğrafınızın alanını seçebilirsiniz.

Alanı seçtikten sonra, düğmesine tıklayın tanımak hangisinde bulunur üst menü programlar. Program seçilen fotoğrafı metne dönüştürmeye başlayacaktır. Görüntüyü işledikten sonra, düğmenin yanındaki oka tıklayın kaydetmek ve bir metin belgesi oluşturmak için istediğiniz formatı seçin:

Güçlü ve fonksiyonel program ABBYY FineReader, basılı metin (kitaplar, dergiler, gazeteler vb.) ve dijital formatlı görüntüler içeren çeşitli kağıt ortamların yüksek kaliteli taranması ve doğru tanınması (tarama sırasında ayarlanan çözünürlüğe bağlı olarak) için tasarlanmıştır.

Programın desteklediği çeşitli diller tanıma, şuraya kaydedebilir: Microsoft Word, PDF, resim formatları ve diğer formatlar. Programın sezgisel bir arayüzü olduğundan, onunla çalışmak uygundur.

Bu nedenle, ilk adım, önce ayarları yapmak ve taramak belge, metni programı takip eden bir görüntü elde ederiz. tanımak. Tanıdıktan sonra metni düzeltebilir (yanlışlıklar varsa) ve istediğiniz biçimde kaydedebilirsiniz.

Tarama ve dosya işleme ile çalışmak için en popüler işlevlerden biri çeşitli tipler- İyi okuyucu. Yazılım ürününün işlevselliği, Rus şirketi ABBYY tarafından geliştirilmiştir, belgeleri yalnızca tanımaya değil, aynı zamanda işlemeye de (tercüme, biçimleri değiştirme vb.) İzin verir. Birçok kullanıcı ABBYY FineReader'ı yalnızca yükleyebilir, ancak ABBYY FineReader'ın nasıl kullanılacağını hemen anlayamaz. Birçok sorunun cevabını bu yazıda bulabilirsiniz.

Program, metni taramanıza ve tanımanıza izin verir - ve yalnızca

ABBYY FineReader 12'nin nasıl bir program olduğunu detaylı olarak anlamak için tüm özelliklerini detaylıca incelemek gerekiyor. İlk ve en kolay işlev, bir belgeyi taramaktır. İki tarama seçeneği vardır: tanımalı ve tanımasız. Basılı bir sayfanın düzenli olarak taranması durumunda, taradığınız görüntüyü bilgisayar aygıtınızdaki belirtilen klasörde alacaksınız.

DİKKAT. Sayfa, yazıcının tarama kısmına tam olarak yazıcıda belirtilen konturlar boyunca yerleştirilmelidir. Kaynağı kurcalamayın, bu, kötü kalite son tarama.

FineReader'ın sizin için ne olduğuna kendiniz karar vermelisiniz, çünkü yardımcı programın önemli işlevleri vardır, örneğin, hangi renkte bir görüntü elde etmek istediğinizi seçebilirsiniz, tüm fotoğrafları siyah beyaza dönüştürmek mümkündür. Siyah beyazda renk tanıma daha hızlıdır, işleme kalitesi artar.

ABBYY FineReader'ın metin tanıma işleviyle ilgileniyorsanız, taramadan önce özel bir düğmeye basmanız gerekir. Bu durumda, bilgi almak için birkaç seçenek vardır. Varsayılan olarak, elle kopyalayabileceğiniz veya düzenleyebileceğiniz, tanınan bir sayfa parçası ekranınızda görüntülenecektir.

Diğer işlevleri seçerseniz, dosyayı hemen bir Word belgesi veya Excel elektronik tablosu olarak alabilirsiniz. İşlevleri seçmek çok basittir, menü sezgiseldir, ihtiyacınız olan tüm düğmeler gözünüzün önünde olduğundan yapılandırması kolaydır.

ÖNEMLİ. tanımadan önce ABBYY metni FineReader, işleme dilini doğru bir şekilde seçmeniz gerekir. Yardımcı programın tamamen otomatik olarak çalışmasına rağmen, Düşük kalite kaynak kodu, kaynak kodunda ne tür bir dil olduğunu anlamanıza izin vermez. Bu, uygulamanın nihai sonuçlarının kalitesini büyük ölçüde azaltır.

Çoklu çalışma modları

ABBYY FineReader 12'nin nasıl kullanılacağını tam olarak anlamak için iki çalışma modunu denemeniz gerekir: "Tam" ve "Hızlı Tanıma". İkinci mod, yüksek kaliteli görüntüler için uygunken, birinci mod, düşük kaliteli dosyalar için uygundur. Kapsamlı modun dosyaları işlemesi 3-5 kat daha uzun sürer.

Resimde programın sonucu gösterilmektedir - bir görüntüden metin tanıma

Başka hangi özellikler var?

metin tanıma ABBYY programı FineReader tek değil kullanışlı özellik. Daha fazla kullanıcı rahatlığı için,

ABBYY® FineReader 12 Hızlı rehber kullanıcı Bu belge, ABBYY FineReader'ın çalışması hakkında temel bilgiler içerir. Tam dolu..."

ABBYY® FineReader 12

Hızlı Kullanım Kılavuzu

Bu belge, ABBYY FineReader hakkında temel bilgiler içerir. Eksiksiz Kılavuzİle

ABBYY FineReader, Screenshot Reader ve Hot Folder uygulamalarıyla çalışma, şirketin web sitesinde mevcuttur.

ABBYY. Kalıcı bir internet bağlantınız yoksa kılavuzu indirebilirsiniz.

PDF formatında kullanıcı

ABBYY FineReader nedir?

ABBYY FineReader'ı yükleme ve başlatma

Sistem gereksinimleri

program kurulumu

ABBYY FineReader'ı Başlatma

ABBYY FineReader ile çalışma

Yerleşik görevler

Adım adım belge dönüştürme

Belge Yapısı Analizi ve Bölge Düzenleme

Programın etkinleştirilmesi ve kaydı

ABBYY FineReader'ı etkinleştirme

ABBYY FineReader'ı Kaydetme

Veri güvenliği

ABBYY FineReader nedir ABBYY FineReader bir Optik Karakter Tanıma (OCR) sistemidir. Dijital fotoğraflar da dahil olmak üzere taranan belgeleri, PDF belgelerini ve görüntü dosyalarını düzenlenebilir biçimlere dönüştürmek için tasarlanmıştır.

ABBYY FineReader 12'nin Avantajları Hız ve yüksek tanıma doğruluğu Çoğu dünya dili için destek Tanıma sonuçlarının kontrol edilmesi Basit ve anlaşılır arayüz Fotoğraflı belgelerin tanınması Belgelerin çeşitli formatlarda kaydedilmesi ve çevrimiçi depolara gönderilmesi Kayıtlı kullanıcılar için ücretsiz teknik destek Kurulum ve ABBYY FineReader'ı başlatma Sistem gereksinimleri 1. 32 bit (x86) veya 64 bit (x64) işlemci ile saat frekansı 1 gigahertz (GHz) veya daha yüksek.

2. Ameliyathane Microsoft sistemi® Windows® 8, Microsoft® Windows® 7, Microsoft Windows Vista, Microsoft Windows XP, Microsoft Windows Sunucusu 2012/2012 R2, Microsoft Windows Sunucusu 2008/2008 R2, Microsoft Windows Sunucusu 2003.

Yerelleştirilmiş bir arabirimle çalışmak için işletim sisteminin gerekli dil desteğini sağlaması gerekir.

3. RAM - 1024 MB.

Çok çekirdekli sistemlerde çalışırken, her ek çekirdek için ek 512 MB RAM gerekir.

4. Boş disk alanı: Tüm program bileşenlerini kurmak için 850 MB, programı çalıştırmak için 700 MB.

5. En az 1024768 piksel çözünürlüğe sahip ekran kartı ve monitör.

6. Klavye, fare veya diğer işaretleme aygıtı.

program kurulumu

ABBYY FineReader 12'yi yüklemek için:

1. Kurulum CD'sinden veya program dağıtım klasöründen Setup.exe dosyasını çalıştırın.

ABBYY FineReader 12 Corporate'i şurada yükleyebilirsiniz: yerel ağ. Kılavuzu sistem yöneticisi PDF formatında ABBYY web sitesinden indirilebilir.

ABBYY FineReader'ı Başlatma

ABBYY FineReader 12'yi başlatmak için:

ABBYY FineReader 12 Hızlı Başlangıç Kılavuzu Programları Başlat menüsünden ABBYY FineReader 12'yi (ABBYY FineReader 12 Corporate) seçin veya Microsoft uygulamaları Office'te, FineReader 12 panelinde bulunan ABBYY FineReader başlatma düğmesine tıklayın veya windows gezgini bir görüntü dosyası seçin ve ABBYY FineReader ile Aç'ı veya içerik menüsünde gerekli biçime dönüştürme seçeneğini seçin.

ABBYY FineReader ile çalışma

ABBYY FineReader kullanarak belgeleri işlemek dört aşamadan oluşur:

Görüntü almak;

Belge tanıma;

Alınan metni kontrol etme ve düzenleme;

Tanıma sonuçları kaydediliyor.

Genellikle bu süreç, tanınan metni belirli bir biçimde tarama, tanıma ve kaydetme gibi aynı eylem dizisinden oluşur. En yaygın görevleri gerçekleştirmek için program, bir düğmeyi tıklatarak tanınan metin almanıza olanak tanıyan yerleşik görevler sağlar. Karmaşık bir yapıya sahip belgeleri tanımak için, işlemenin her aşamasını kendiniz ayarlayabilir ve çalıştırabilirsiniz.

Yerleşik görevler Yerleşik görevler, uygulama başladığında varsayılan olarak açılan Görevler penceresinden başlatılır. Pencere kapalıysa, programın ana araç çubuğundaki Görev düğmesine tıklayın.

ABBYY FineReader 12 Hızlı Başlangıç Kılavuzu

Yerleşik görevleri kullanarak bir belgeyi dönüştürmek için:

1. Görev penceresinde, görevleri içeren gerekli sekmeyi seçin:

Temel - ABBYY FineReader'da en sık kullanılan yerleşik görevleri içerir;

Microsoft Word - bir Microsoft Word belgesine dönüştürme görevleri;

Microsoft Excel - Microsoft Excel elektronik tabloları oluşturmak için görevler;

– – –

Görevlerim - sizin için gerekli adımlardan oluşan kendi özel görevlerinizi oluşturabilirsiniz (yalnızca ABBYY FineReader Corporate sürümü için).

2. Belge dili listesinde tanıma dillerini belirtin.

3. Listelendi Renk modu renk modunu seçin:

Renk - belgenin renk düzeni değişmez;

Siyah Beyaz - Belgenin sayfaları siyah beyaz olacak ve bu da FineReader belgesinin boyutunu küçültecektir. Renkli modla karşılaştırıldığında, bu modun bir belgeyi işlemesi daha az zaman alır.

ABBYY FineReader 12 Hızlı Başlangıç Kılavuzu Dikkat! Siyah beyaz modunu seçtikten sonra, belgenin renkli görünümünü geri yüklemek mümkün olmayacaktır. Renkli bir belge almak için, sayfaların renkli görüntülerini içeren bir dosyayı açın veya renkli modda bir kağıt belgeyi tarayın.

4. Gerekirse, bir Microsoft Word belgesine, bir Microsoft Excel belgesine ve bir belgeye dönüştürme görevleri için ek seçenekler ayarlayın. Adobe PDF'si pencerenin sağ tarafında.

5. İstediğiniz görevin düğmesine tıklayın.

ABBYY FineReader görevleri, Ayarlar iletişim kutusunda (Araç Ayarları... menüsü) belirtilen ayarlara göre gerçekleştirilir.

Başlattıktan sonra, ekranda bir görev ilerleme göstergesi, bir adım listesi, ipuçları ve uyarılar içeren bir görev ilerleme çubuğu görünür.

Görev yürütme sonucunda bir belge oluşturulacak istenen biçim ve görüntüler FineReader belgesine eklenecektir. Gerekirse, resimlerdeki seçili alanları düzenleyebilir, tanınan metni kontrol edebilir ve tanıma sonuçlarını farklı bir formatta kaydedebilirsiniz.

Adım adım belge dönüştürme kendi kendine ayar ve belge işlemenin her aşamasını başlatmak için ABBYY FineReader'ın ana penceresini kullanın.

ABBYY FineReader 12 Hızlı Başlangıç Kılavuzu

1. Ana araç çubuğundaki Belge dili açılır listesinde tanıma dillerini belirtin.

2. Resimlerinizi tarayın veya açın.

Varsayılan olarak, belge analizi ve tanıma otomatik olarak başlayacaktır. Bu ayarları Seçenekler iletişim kutusunun (Araçlar Seçenekleri... menüsü) Tara/Aç sekmesinde değiştirebilirsiniz.

3. Görüntü penceresinde seçili alanları kontrol edin ve gerekirse düzenleyin.

4. Alanları değiştirdiyseniz ana araç çubuğunda Tanı düğmesine tıklayın.

5. Metin penceresinde tanıma sonuçlarını kontrol edin ve gerekirse düzenleyin.

Bir belgenin yapısını ve düzenleme alanlarını inceleme Bir belgenin dönüştürülmesi sonucunda elde edilen kalite birçok faktöre bağlıdır: orijinal görüntü, tanıma ayarları, kaydetme parametreleri. Biri kritik adımlar belgenin mantıksal yapısının analizidir, yani metin, resim, tablo ve barkodlu alanların seçimi. Sisteme görüntünün belirli bölümlerini nasıl ve hangi sırayla tanıyacağını söylemek için alanlar tahsis edilir. Bu, belgenin özgün tasarımını yeniden oluşturur.

ABBYY FineReader 12 Hızlı Kullanım Kılavuzu Varsayılan olarak, ABBYY FineReader'da belge analizi otomatik olarak gerçekleştirilir.

Ancak, karmaşık belgelerde bazı alanlar doğru şekilde vurgulanmayabilir. Çoğu zaman, tüm alanları yeniden seçmek yerine yalnızca bunları düzeltmek daha uygundur Alanları manuel olarak işaretlemeye ve düzenlemeye yönelik araçlar, Görüntü penceresinin panelinde ve ayrıca Metin, Görüntü, Arka Plan Görüntüsü için açılır araç çubuklarında bulunur. ve Masa alanları. Etkin alanın yanında bir açılır araç çubuğu görünür. Bir alanı seçmek için farenin sol tuşu ile üzerine tıklayın.

Manuel yerleşim araçlarıyla şunları yapabilirsiniz:

Alan ekleme veya kaldırma

– – –

Alan kenarlıklarını veya alanın kendisini taşıyın Alanın dikdörtgen bir parçasını ekleyin/kaldırın Alanları yeniden numaralandırın Alanları düzenlemeyle ilgili tüm işlemler tamamlandıktan sonra tanımaya yeniden başlayın.

Manuel mizanpaj araçlarıyla nasıl çalışılacağı ve nasıl yapılacağı hakkında daha fazla bilgi edinin. standart dışı durumlar, çözümü gerektirebilecek gelişmiş Ayarlar Yardımın tamamını ABBYY web sitesinde okuyabilirsiniz.

Programı etkinleştirme ve kaydetme ABBYY FineReader'ı etkinleştirme ABBYY FineReader 12'yi tam özellikli modda kullanmak için ürünü etkinleştirmeniz gerekebilir. Aktivasyon tamamen güvenli ve anonimdir.

En basit ve hızlı yol- programı internet üzerinden etkinleştirin. Programı şu şekilde de etkinleştirebilirsiniz: e-posta veya telefon/faks. Etkinleştirmeyle ilgili ayrıntılı bilgiler ABBYY web sitesinde bulunabilir.

ABBYY FineReader'a Kaydolma ABBYY sizi kayıtlı bir ABBYY kullanıcısı olmaya davet ediyor

FineReader 12. Kaydolarak bir dizi avantaj elde edersiniz:

Ücretsiz teknik destek;

Ekran alanlarının ekran görüntülerinden (ekran görüntüleri) metin tanımak için tasarlanmış ABBYY Screenshot Reader uygulamasını kullanma yeteneği;

Kaybolması durumunda seri numarasının yenilenmesi;

Otomatik ürün güncellemesi;

hakkında bilgi alma yeteneği özel teklifler ABBYY ürünleri için.

Program kopyanızı aşağıdaki yollardan biriyle kaydedebilirsiniz:

Program aktivasyon işlemi sırasında kayıt kartını doldurun. Etkinleştirme işlemi sırasında programı kaydetmediyseniz, bunu daha sonra, sizin için uygun olan herhangi bir zamanda yapabilirsiniz.

ABBYY FineReader 12 Hızlı Başlangıç Kılavuzu Yardım menüsünden Kaydol... öğesini seçin ve kayıt formunu doldurun.

ABBYY web sitesine kaydolun.

Veri güvenliği Kayıt işlemi sırasında, kişisel verilerinizin gönüllü olarak ABBYY'ye aktarılmasına izin vermiş olursunuz. Ayrıca, kişisel verilerinizin ABBYY tarafından gizlilik koşulları kapsamında ve Lisans Sözleşmesine uygun olarak yürürlükteki yasalara uygun olarak toplanmasına, işlenmesine ve kullanılmasına onay vermektesiniz. Tarafınızdan sağlanan kişisel veriler yalnızca ABBYY şirketler grubu içinde kullanılacak ve Lisans Sözleşmesi veya Lisans Sözleşmesinin kendisi kapsamında geçerli yasa tarafından sağlanan durumlar dışında üçüncü taraflara sağlanmayacaktır.

ABBYY, yalnızca kayıt sırasında uygun kutuyu işaretleyerek ABBYY'den bilgi almayı kabul ettiğinizi onayladığınız takdirde, size ürünler, fiyat değişiklikleri, özel teklifler ve ürünler veya şirket hakkında diğer bilgileri içeren e-postalar gönderme hakkına sahiptir. ABBYY ile iletişime geçerek adresinizi istediğiniz zaman abone listesinden çıkarabilirsiniz.

ABBYY FineReader 12 Hızlı Başlangıç Kılavuzu

Bu belgede yer alan bilgiler önceden bildirilmeksizin değiştirilebilir ve ABBYY bunu yapmakla yükümlü değildir.

Bu belgede açıklanan yazılım, bir Lisans Sözleşmesi kapsamında sağlanır. Bu yazılım yalnızca bu sözleşmenin şartlarına tam olarak uygun olarak kullanılabilir veya kopyalanabilir. Bu yazılımın herhangi bir ortama kopyalanması, Lisans Sözleşmesinde veya dağıtım dışı bir sözleşmede özellikle izin verilmedikçe, Kanun ihlalidir. Rusya Federasyonu"Bilgisayar programlarının ve veritabanlarının yasal olarak korunması hakkında" ve uluslararası hukuk normları.

Bu kılavuzun hiçbir bölümü, yazılı olarak açıkça izin verilmedikçe, fotokopi ve manyetik ortama kayıt dahil olmak üzere elektronik veya mekanik hiçbir şekilde veya hiçbir amaçla çoğaltılamaz veya aktarılamaz.

ABBYY, ABBYY FineReader, ADRT, ABBYY Software Ltd.'nin tescilli ticari markaları veya ticari markalarıdır.

ABD Patentleri ile korunmaktadır: 5,929,866; 5,943,063; 6,289,364; 6,563,502; 6,185,684; 6,205,549; 6,639,593;

7,213,269; 7,246,748; 7,272,628; 7,278,168; 7,343,551; 7,395,503; 7,389,200; 7,406,599; 6,754,382; Patent başvuruları değerlendirilmektedir.

Adobe® PDF Library, Adobe Systems Incorporated tarafından lisanslanmıştır.

Adobe, Acrobat®, Adobe logosu, Acrobat logosu, Adobe PDF logosu ve Adobe PDF Library, Amerika Birleşik Devletleri ve/veya diğer ülkelerde Adobe Systems Incorporated'ın tescilli ticari markaları veya ticari markalarıdır.

AT&T Labs Teknolojisine dayanmaktadır.

DjVu® ABD Patent No. 6.058.214. Diğer ülkelerdeki patent başvuruları değerlendirilmektedir.

Microsoft, Outlook, Excel, PowerPoint, Windows Vista, Windows, Amerika Birleşik Devletleri ve/veya diğer ülkelerde Microsoft Corporation'ın tescilli ticari markaları veya ticari markalarıdır.

OpenOffice.org, OpenOffice.org logosu, Oracle ve/veya bağlı kuruluşlarının ticari markaları veya tescilli ticari markalarıdır.

JasPer Lisans Sürümü 2.0:

© 1999-2000 British Columbia Üniversitesi EPUB®, IDPF'nin (Uluslararası Dijital Yayıncılık Forumu) tescilli bir ticari markasıdır. Bu yazılım, © 2009 The FreeType Project'e (www.freetype.org) ait bileşenler içermektedir.Tüm hakları saklıdır.

Ürün, OpenSSL Toolkit'te kullanılmak üzere OpenSSL projesi tarafından geliştirilen yazılımı içerir. (http://www.openssl.org/). Ürün, Eric Young ( [e-posta korumalı]).

Bu ürün, Tim Hudson ( [e-posta korumalı]).

Diğer ticari markalar, ticari markalar veya tescilli ticari markalardır.

Benzer işler:

“02/01/2016 SHEMOT İSİMLERİ Çıkış 1:1-6:1/Yeşaya 27:6-28:13; 29:22,23 / Markos 1,2 Çıkış 1:1 İşte (bugün) Mısır'a giren İsrail oğullarının adları, her biri Yakup'la birlikte eviyle girdi. Çıkış 1:1 Yakup'la birlikte Mısır'a giren ve her biri kendi eviyle birlikte giren İsrail oğullarının adları şunlardır. İşte direkt...

Son 50 yılda yapay zekada (AI) kaydedilen ilerlemeler, "akıllı" makineleri insanın bilişsel yeteneklerine bir nebze olsun yaklaştırmamış olsa da, bu yöndeki ilerlemeleri tamamen reddetmek haksızlık olur. En bariz ve çarpıcı örnek satrançtır (daha basit oyunlardan bahsetmiyorum bile). Bilgisayar henüz düşüncemizi taklit edemiyor, ancak büyük miktarda özel bellek ve numaralandırma hızıyla bu boşluğu doldurma konusunda oldukça yetenekli. Vladimir Kramnik, 2006'da kazandığı Deep Fritz programının oyununu, yerleşik (insani) strateji ve taktik kurallarına sık sık aykırı olması anlamında "insanlık dışı" olarak nitelendirdi.

Bir yıldan biraz daha uzun bir süre önce, bir zamanlar bilgisayarların muzaffer satranç zaferlerinin (ünlü Deep Blue) temelini atan IBM'in Watson adlı başka bir buluşu, popüler Amerikan sınavının iki şampiyonunu yenerek yeni bir atılım yaptı. Geniş bir farkla tehlike. Bununla birlikte, Watson'ın yanıtları kendisi dile getirmesine rağmen, soruların yine de kendisine iletilmiş olması önemlidir. metin formu. Bu, AI uygulamasının birçok alanındaki - konuşma ve görüntü tanıma, makine çevirisi - ilerlemenin oldukça mütevazı olduğunu gösteriyor, ancak bu, bugün onları uygulamaya koymamızı engellemez. Belki de en büyük başarı, neredeyse tüm PC kullanıcılarının muhtemelen bir şekilde aşina olduğu optik karakter tanıma sistemlerinde (OCR, Optik Karakter Tanıma) gösteriliyor. Ayrıca, bu alandaki Rus gelişmeleri dünyada değerli bir yer tutuyor - ABBYY FineReader'ı kastediyorum.

biraz tarih

ABBYY FineReader'ın şu anki sürümü 11 numara, bu da uygulamanın geliştirmede uzun bir yol kat ettiği ve hatta bu sürecin geçmişinin biraz ilgi çekici olduğu anlamına geliyor. Kapsamlı bir kronikmiş gibi davranmadan, FineReader'ı aşağı yukarı takip ettiğim son on yılın yalnızca ana kilometre taşlarını vereceğim:

Yıl	Sürüm	Ana Özellikler
2003	7.0	Tanıma doğruluğunda %25'e varan artış. Bu durum en çok tablolara, özellikle karmaşık tablolara, renkli hücrelere, gizli ayırıcılara vb. yansıdı.
2005	8.0	Öncelikle belge taramalarıyla değil, dijital fotoğraflarla çalışmayı amaçlayan tanıma algoritmalarının daha fazla optimizasyonu. Bunun için, orijinalleri hazırlamak için ek işlevler ortaya çıktı (bozulmaların giderilmesi, çizgilerin hizalanması vb.).
2007	9.0	İşlenen (çok sayfalı) belgenin tamamının mantıksal yapısını hesaba katan ve yinelenen öğeleri (üstbilgiler ve altbilgiler) seçebilen, "akan" nesneleri (tablolar) vb. bağlayabilen ADRT teknolojisinin ortaya çıkışı.
2009	10.0	ADRT ve tanıma algoritmalarının daha da geliştirilmesi, düşük çözünürlüklü orijinallerin işlenmesindeki doğruluğun %30'a kadar artırılması.
2011	11.0	Ana dikkat, programın hızına verilir. Kaliteli orijinallerde %30'a varan ek hızlanma sağlayan siyah beyaz modunun "ikinci gelişi".

Doğal olarak, aynı zamanda, FineReader belge biçimleri için desteği genişletti, yerleşik araçları ve arabirimi iyileştirdi, orijinallerin yapısının çoğaltılmasını iyileştirdi vb. karmaşık bilim yoğun sistemlerin özelliği olan geliştirme süreci, bir sonraki "atılımdan" sonra, yeni algoritmaların geliştirilmesi için gerekli olan belirli bir "sakinlik" döneminin ardından gelir. Herhangi bir OCR programının ana değerini temsil ederler ve bu nedenle detaylı bilgi onlar hakkında son derece nadiren kullanıcılara ulaşır. Ancak ABBYY, gizlilik perdesini kaldırmayı nazikçe kabul etti ve bugün FineReader'ın iç sığınağına bakma fırsatımız var.

Temel prensipler

OCR, yapay zeka alanına ait olduğu için, geliştiricilerin beynimizin aktivitesini en azından bir dereceye kadar taklit etmeye çalışması oldukça mantıklı. Tabii ki, görsel sistemimizin yapısı inanılmaz derecede karmaşıktır, ancak işleyişinin temel "büyük blok" ilkeleri yeterince incelenmiştir, genellikle bunlardan üçü vardır:

Bütünlük- nesne, parçalarının bir kümesi ve (görsel görüntüler için) bunlar arasındaki uzamsal ilişkiler olarak kabul edilir. Buna karşılık, parçalar yalnızca tüm nesnenin bir parçası olarak yorumlanır. Bu ilke, olası olmayanları hızla ortadan kaldırarak hipotezler oluşturmaya ve iyileştirmeye yardımcı olur.
amaçlılık- herhangi bir veri yorumunun belirli bir amacı olduğundan, tanıma aynı zamanda bir nesne hakkında hipotezler ileri sürme ve bunları amaçlı olarak test etme sürecidir. Bu prensibe göre çalışan bir sistem sadece tasarruf sağlamakla kalmayacaktır. işlem gücü ama aynı zamanda yanlış olma olasılığı daha düşüktür.
Uyarlanabilirlik- sistem, çalışma sırasında biriken bilgileri kaydeder ve yeniden kullanır, yani kendi kendine öğrenir. Bu ilke, yeni bilgiler yaratmanıza ve biriktirmenize ve yeniden karar aynı görevler

FineReader, belge işlemenin tüm aşamalarında yukarıda açıklanan ilkelere uygun olarak çalışan dünyadaki tek OCR sistemidir. İlgili teknoloji denir IPA- İngilizce terimlerin ilk harflerine göre. Örneğin, bütünlük ilkesine göre, bir görüntünün bir parçası, ancak benzer nesnelerin tüm yapısal parçalarını ve belirli ilişkiler içinde olanları içeriyorsa, bir sembol olarak yorumlanacaktır. Bu, çok sayıda şablon aramanın (az ya da çok uygun bir şablon arayışında) makul sayıda hipotezin amaçlı bir testiyle ve ayrıca tanınmış bir belgedeki olası karakter stilleri hakkında önceden birikmiş bilgilere dayanarak değiştirilmesine yardımcı olur.

Bununla birlikte, yalnızca (muhtemelen) bireysel karakterlere karşılık gelen parçalar değil, aynı zamanda orijinal sayfa görüntüsünün tamamı analiz edilirken IPA ilkeleri uygulanır. Çoğu OCR sistemi, bir belgenin hiyerarşik yapısının tanınmasına dayanır, yani sayfa tablolar, resimler, metin blokları gibi temel yapısal öğelere bölünür ve bunlar da diğer karakteristik nesnelere (hücreler, paragraflar) bölünür. vb. , bireysel karakterlere kadar.

Böyle bir analiz iki ana yolla gerçekleştirilebilir: yukarıdan aşağıya, yani kurucu unsurlardan bireysel karakterlere veya tersine aşağıdan yukarıya. Çoğu zaman bunlardan biri kullanılır, ancak ABBYY özel bir algoritma geliştirmiştir. MDA(çok düzeyli belge analizi, çok düzeyli belge analizi), her ikisini de birleştirir. Kısaca şöyle görünür: sayfa yapısı yukarıdan aşağıya yöntemiyle analiz edilir ve aşağıdan yukarıya tanıma tamamlandıktan sonra elektronik belge yeniden oluşturulur, ancak her düzeyde ek bir mekanizma geri bildirim. Sonuç olarak, üst düzey nesnelerin yanlış tanınmasıyla ilişkili büyük hata olasılığı keskin bir şekilde azalır.

ADRT

Tarihsel olarak, OCR sistemleri tek karakter tanımadan gelişmiştir. Bu görev hala en önemli ve en zor olanıdır, en karmaşık algoritmalar onunla ilişkilidir. Bununla birlikte, kısa süre sonra, üst düzey bilgilerin (örneğin, belgenin dili ve tanınan kelimelerin doğru yazılışı hakkında) sorunu çözmeye yardımcı olabileceği anlaşıldı - bağlam ve sözlük kontrolleri bu şekilde ortaya çıktı. Ardından, belgenin biçimlendirmesini koruma ve fiziksel yapısını (yani çeşitli nesnelerin göreli konumunu) yeniden oluşturma arzusu, tüm sayfanın ayrıntılı bir analizine ihtiyaç duyulmasına neden oldu. Bunun da önemli bir etkisi olduğu açıktır. Genel Kalite tanıma, çünkü çok sütunlu düzeni, tabloları ve diğer "doğrusal olmayan" metin düzenleme yöntemlerini doğru şekilde işlemeye yardımcı olur.

Çoğu modern OCR, daha önce bahsedildiği gibi yukarıdan aşağıya veya aşağıdan yukarıya yaklaşımlar uygulayarak bu üç düzeyde - karakterler, kelimeler, sayfalar - çalışır. Ancak ABBYY, IPA ilkelerine uygun olarak FineReader'a bir düzey daha ekledi - çok sayfalı belgenin tamamı. Her şeyden önce bu, modern belgelerde giderek daha karmaşık hale gelen mantıksal yapının doğru şekilde yeniden üretilmesi için gerekliydi. Ancak ek bonuslar da var: tekrarlanan nesnelerin artan doğruluğu ve daha hızlı işlenmesi, sayfadan sayfaya "akan" nesnelerin daha doğru tanımlanması (ve dolayısıyla tanınması).

Bunun için tasarlandı. ADRT(Uyarlanabilir Belge Tanıma Teknolojisi) - bir belgeyi mantıksal düzeyde analiz etmek ve sentezlemek için bir teknoloji. Sonuç olarak, FineReader'ın çalışmasının sonucunun orijinaline olabildiğince benzer olmasına yardımcı olur. Bunu yapmak için, tüm belgenin görüntüsü analiz edilir ve tanınan sözcükler sayfadaki stile, ortama ve konuma bağlı olarak gruplar (kümeler) halinde birleştirilir. Böylece program, olduğu gibi, belgenin biçimlendirilmesinin "mantığını" görür ve gelecekte sonucun tasarımını birleştirebilir.

ADRT sayesinde FineReader, sürüm 9.0'dan itibaren aşağıdaki yapısal parçaları ve belge biçimlendirme öğelerini algılamayı, tanımayı ve çoğaltmayı öğrendi:

ana yazı;
üstbilgiler ve altbilgiler;
sayfa numaraları;
aynı seviyedeki başlıklar;
içindekiler;
metin ekler;
çizimler için başlıklar;
tablolar;
dipnotlar;
imza/baskı bölgeleri;
yazı tipleri ve stiller.

Tanıma süreci

MDA algoritmasına göre, gerçek tanıma sayfa düzeyinde yukarıdan aşağıya doğru başlar. Açıktır ki, bu sürecin ilk aşamalarında ne kadar yanlış kararlar alınırsa, bundan sonraki süreçte o kadar fazla olacağı açıktır. Bu nedenle tanıma doğruluğu orijinallerin kalitesine çok bağlıdır, ancak ön işleme algoritmaları da önemli olabilir. Böylece, FineReader'da renkli belgelerin popülaritesi arttıkça, uyarlamalı bir ikilileştirme prosedürü ortaya çıktı (uyarlamalı ikilileştirme, AB). Bir belgeyi filigranların olduğu veya metnin bir doku veya renkli alt tabaka üzerinde bulunduğu siyah beyaz modda hemen tararsanız, görüntüde her zaman "çöp" belirir ve bu durumda "çöp" den ayrılması oldukça zor olacaktır. yararlı” görüntü (çünkü onun hakkındaki orijinal bilgiler zaten kayıp). FineReader'ın renkli veya gri tonlamalı görüntülerle çalışmayı ve bunları kendi başına siyah beyaza dönüştürmeyi tercih etmesinin nedeni budur (bu işleme ikilileştirme denir). Ama hepsi bu kadar değil. Metnin ve arka planın renkleri bir sayfada ve hatta tek tek satırlarda değişebileceğinden, AB aşağı yukarı aynı özelliklere sahip kelimeleri vurgular ve tanıma kalitesi açısından her biri için en uygun ikilileştirme parametrelerini seçer. Bu tam olarak algoritmanın uyarlanabilirliğidir ve dolayısıyla MDA'da geri bildirim kullanımına bir örnektir. AB'nin etkinliğinin büyük ölçüde kaynak belgelerin tasarımına bağlı olduğu açıktır - ABBYY test temelinde, bu algoritma tanıma doğruluğunda %14,5'lik bir artış sağlamıştır.

Ama en ilginci tabii ki tanınma süreci en alt seviyelere indiğinde başlıyor. Sözde doğrusal bölme prosedürü, dizeleri sözcüklere ve sözcükleri tek tek harflere ayırır; daha sonra, IPA ilkesine uygun olarak, bir dizi hipotez oluşturur (yani, ne tür bir sembol olduğu, kelimenin hangi sembollere bölündüğü vb. İçin olası seçenekler) ve her birine bir olasılık tahmini sağlayarak, karakter tanıma mekanizmasının girişine iletir. İkincisi, bir dizi sözde oluşur sınıflandırıcılar, her biri ayrıca tahmin edilen olasılık derecesine göre sıralanan bir dizi hipotez üretir. Herhangi bir sınıflandırıcının en önemli özelliği, doğru hipotezin ortalama konumudur. Açıktır ki, ne kadar yüksek olursa, sonraki algoritmalar için o kadar az iş yapılır - örneğin sözlük kontrolü. Ancak yeterince iyi ayarlanmış sınıflandırıcılar için, ilk üç hipoteze göre veya yalnızca birincisine göre tanıma doğruluğu gibi özellikler en sık değerlendirilir - yani kabaca konuşursak, üç veya bir denemeden doğru cevabı tahmin etme yeteneği. ABBYY, sistemlerinde şu sınıflandırıcı türlerini kullanır: raster, özellik, özellik diferansiyeli, kontur, yapısal ve yapısal diferansiyel - bunlar iki mantıksal seviyede gruplanmıştır.

çalışma prensibi RK veya raster sınıflandırıcı, bir sembol görüntüsünün referanslarla piksel piksel karşılaştırılmasına dayanır. İkincisi, eğitim örneğinden alınan ortalama görüntülerin bir sonucu olarak oluşturulur ve belirli bir standart forma indirgenir; buna göre, tanınabilir görüntü için öğelerin boyutu, kalınlığı ve eğimi de önceden normalleştirilir. Bu sınıflandırıcı, uygulama kolaylığı, çalışma hızı ve görüntü kusurlarına karşı direnci ile ayırt edilir, ancak nispeten düşük doğruluk sağlar ve bu nedenle ilk aşamada - hızlı bir şekilde bir hipotez listesi oluşturmak için kullanılır.

Özellik sınıflandırıcı ( bilgisayar), adından da anlaşılacağı gibi, görüntüde belirli bir sembolün işaretlerinin varlığına dayanmaktadır. Bu tür N işaret varsa, o zaman her hipotez N boyutlu uzayda bir nokta ile temsil edilebilir; buna göre, hipotezin doğruluğu, standarda karşılık gelen noktaya (eğitim setinde de geliştirilen) olan mesafeye göre tahmin edilecektir. Özelliklerin türlerinin ve sayısının tanıma kalitesini büyük ölçüde belirlediği açıktır, bu nedenle genellikle oldukça fazladır. Bu sınıflandırıcı ayrıca nispeten hızlı ve basittir, ancak çeşitli görüntü kusurlarına karşı çok dirençli değildir. Ek olarak, PC orijinal görüntüyle değil, belirli bir soyutlama modeliyle çalışır, yani bazı bilgileri dikkate almaz: örneğin, bazı önemli unsurların varlığı gerçeği hakkında hiçbir şey söylemez. göreceli konumları. Bu nedenle PC yerine değil, RK ile birlikte kullanılır.

kontur sınıflandırıcı ( KK) temsil etmek özel durum PC, orijinal görüntüden çıkarılan amaçlanan karakterin dış hatlarını analiz etmesi bakımından farklılık gösterir. Genel olarak, doğruluğu tam teşekküllü bir PC'den daha düşüktür.

Özellik diferansiyel sınıflandırıcı ( MPC) ayrıca PC'ye benzer, ancak yalnızca "m" ve "rn" gibi benzer nesneleri ayırt etmek için kullanılır. Buna göre, yalnızca farklılıkların gizlendiği alanları analiz eder ve yalnızca ilk görüntülerle değil, aynı zamanda tanımanın erken aşamalarında oluşturulan hipotezlerle de beslenir. Bununla birlikte, çalışma prensibi PC'den biraz farklıdır. Eğitim aşamasında, N boyutlu uzayda iki seçeneğin her biri için olası değerlerden iki "bulut" (nokta grubu) oluşturulur, ardından "bulutları" birbirinden ayıran ve yaklaşık olarak bir hiper düzlem oluşturulur. onlardan eşit uzaklıkta. Tanıma sonucu, orijinal görüntüye karşılık gelen noktanın hangi yarı uzaya düştüğüne bağlıdır.

MPC kendi başına hipotezler öne sürmez, ancak yalnızca mevcut olanları (listesi genellikle kabarcık yöntemine göre sıralanır) rafine eder, böylece etkinliğinin doğrudan bir değerlendirmesi yapılmaz, ancak dolaylı olarak eşittir. OCR tanımanın tüm birinci seviyesinin özellikleri. Bununla birlikte, seçilen özelliklerin doğruluğuna ve oldukça zahmetli bir iş olan standartlar örneğinin temsil edilebilirliğine bağlı olduğu açıktır.

Yapısal diferansiyel sınıflandırıcı ( KFOR) başlangıçta işlemek için kullanıldı el yazısı metinler. Görevi, "C" ve "G" gibi benzer nesneleri ayırt etmektir. Bu nedenle, SDK, her karakter çiftinin özelliklerine dayanmaktadır, öğrenme süreci MPC'ninkinden bile daha karmaşıktır ve çalışma hızı, önceki tüm sınıflandırıcılardan daha düşüktür.

Yapısal sınıflandırıcı ( SC) ABBYY'nin gurur kaynağıdır, başlangıçta sözde elle basılmış metni, yani bir kişi "basılı" harflerle yazdığında, ancak daha sonra yazdırmaya uygulandığında, tanımak için geliştirilmiştir. Tanımanın son aşamalarında kullanılır ve oldukça nadiren, yani yalnızca yeterince yüksek olasılıkla en az iki hipotez ona ulaştığında eyleme geçer.

Tüm sınıflandırıcıların niteliksel özellikleri aşağıdaki tabloda toplanmıştır. Bununla birlikte, mutlak olmadıkları ve belirli bir test örneğinin işlenmesi temelinde elde edildikleri için yalnızca algoritmaların birbirine göre etkinliğini değerlendirmeye izin verirler. Tanıma işleminin son aşamalarında, mücadele tam anlamıyla yüzde bir kesir içinmiş gibi görünebilir, ancak aslında, her sınıflandırıcı tanıma doğruluğunun iyileştirilmesine önemli bir katkı sağlar - örneğin, SC, hata sayısını önemli ölçüde azaltır 20 %.

	RK	bilgisayar	KK	MPC*	KFOR**	SC**
İlk üç seçenek için doğruluk, %	99,29	99,81	99,30	99,87	99,88	-
Birinci seçeneğe göre doğruluk, %	97,57	99,13	95,10	99,26	99,69	99,73

* ABBYY OCR algoritmasının ilk seviyesinin tamamının değerlendirilmesi
** karşılık gelen sınıflandırıcıyı ekledikten sonra tüm algoritma için tahmin

Bununla birlikte, oldukça yüksek doğruluğa rağmen, tanıma algoritmasının kendisinin kabul etmemesi ilginçtir. son karar. MDA ilkesine göre, hipotezler her mantıksal düzeyde ileri sürülür ve sayıları katlanarak artabilir. Buna göre, tüm hipotezlerin art arda test edilmesinin etkili olma olasılığı düşüktür, bu nedenle ABBYY OCR sistemlerinin hipotezleri yapılandırma, yani onları belirli modellere atama yöntemini kullanmasının nedeni budur. İkincisinden birkaç düzine var, burada sadece birkaç tür var: sözlük kelimesi, sözlük dışı kelime, Arap rakamları, Roma rakamları, URL, Düzenli ifade- ve her biri bir set içerebilir belirli modeller(örneğin, bilinen dillerden biri olan Latince, Kiril vb. bir kelime).

Tüm nihai eylemler, modellere göre oluşturulan hipotezlerle zaten gerçekleştirilir. Örneğin, bağlamsal kontrol, belgenin dilini belirleyecek ve modellerin yanlış alfabe kullanma olasılığını hemen önemli ölçüde azaltacaktır ve sözlük kontrolü, bazı karakterlerin belirsiz tanınmasındaki hataları telafi edecektir: örneğin, "dönüş" kelimesi sözlükte mevcut İngilizce- "tum" un aksine (her halükarda popüler olanlar arasında değildir). Sözlük önceliği herhangi bir sınıflandırıcınınkinden daha yüksek olmasına rağmen, mutlaka son çare değildir ve genel durumda daha fazla kontrolü durdurmaz: birincisi, yukarıda bahsedildiği gibi, sözlük dışı bir kelime modeli vardır ve ikincisi, sözlüklerin özel organizasyonu, yüksek oranda bilinmeyen bir kelimenin belirli bir dile ait olup olamayacağını tahmin etme olasılığını sağlar. Bununla birlikte, sözlük kontrolünün (ve sözlüklerin tamlığının) tanıma sonucu üzerinde önemli bir etkisi vardır ve ABBYY'nin kendi testlerinde hata sayısını neredeyse yarı yarıya azaltır.

Yalnızca OCR değil

Basılı belgeler, sayısallaştırılmaları açısından ilgi çekici olanlardan çok uzaktır ve otomatik işleme. Çoğu zaman formlarla, yani manuel olarak doldurulan, ancak nispeten doğru bir şekilde (elle yazdırılan karakterler olarak adlandırılır) önceden tanımlanmış ve sabit alanlara sahip belgelerle çalışmanız gerekir - çeşitli anketler örnek teşkil edebilir. İşleme teknolojisinin ayrı bir adı vardır - ICR(akıllı karakter tanıma) - ve OCR'den oldukça farklıdır. Evet, çünkü içinde bu durum Görev, tüm belgeyi yeniden oluşturmak değil, belgeden belirli verileri çıkarmak olduğundan, iki ana alt göreve ayrılır: gerekli alanları bulmak ve içeriklerini fiilen tanımak.

Bu oldukça spesifik bir alandır ve ABBYY tamamen ayrı bir alan sunar. yazılım ABBYY FlexiCapture. Otomatik ve yarı otomatik sistemler oluşturmak için tasarlanmıştır, özel şablonların oluşturulduğu belirli belge türlerinin ayarlanmasını içerir, sayfalardaki çeşitli alanları akıllı bir şekilde bulabilir ve bunlardaki verileri doğrulayabilir, vb. FineReader'da kullanılanlara benzer algoritmalar ve genel şema çok benzer:

Bununla birlikte, yine de önemli bir fark vardır: yapısal sınıflandırıcı, süreçte zorunlu bir katılımcıdır - bunun nedeni, el yazısı karakterlerin özelliklerinden kaynaklanmaktadır. Ek olarak, ICR çok sayıda spesifik içerir. ek kontroller: örneğin, karakterin üstü çizili olup olmadığı veya tanınan karakterlerin gerçekten bir tarih oluşturup oluşturmadığı.

Sohbet ABBYY FineReader 12, yani en son sürümü hakkında olacak. Çok uzağa bakmadan, esasına göre mükemmel bir şekilde Ruslaştırılan en ünlü ABBYY ürününü seçtik. Zaten ilk bakışta Fine Reader (FR), iyi Rusça desteği olan bir program izlenimi veriyor: bu bağlamda, aslında, arka plan bilgileri de dahil olmak üzere her şey çok iyi bir düzeyde yapılıyor.

İlk önce geri çekil. Arşivin tamamının veya bir kısmının dijital formata nasıl dönüştürüleceği sorusu her zaman önemlidir (ve aslında “dijital” kelimesi ile ne kastedilmektedir). Bir tarayıcı satın almanın tüm sorunları çözmesi pek olası değildir. Tabii ki, çoğu zaman tescilli bir disk veya birkaç yazılım. Bununla birlikte, zaten temizleme aşamasında, tarama programının kalitesinin arzulanan çok şey bıraktığı veya kaydetmenin yapıldığı formatın maalesef depolama için uygun olmadığı ortaya çıktı. Neden? Çoğu grafik biçimi, metni belgenin metin olmayan alanından ayırmaz ve bu nedenle böyle bir dosyadan herhangi bir pasajı kopyalamak mümkün değildir.

Bu gibi durumlarda, yetenekleri özellikle bir görüntüden metin çıkarmayı içeren işlevsel "metin tanıyıcı" programları kurtarmaya gelir.

ABBYY FineReader'a Giriş

Naylon poşet ABBYY İnce Okuyucu 12- metinlerin optik olarak tanınması sistemi (Optik Karakter Tanıma - OCR). Hem basılı belgelerin bir bilgisayara otomatik olarak girilmesi hem de PDF belgelerinin ve fotoğrafların düzenlenebilir biçimlere dönüştürülmesi için tasarlanmıştır. (program kılavuzundan)

"OCR" kısaltması tüm veri tanıma uygulamaları için geçerlidir (yalnızca metin için değil). Veri ayıklamak için kaynak yazdırılabilir veya elektronik belge. Bir zamanlar, OCR'yi şu ya da bu şekilde çok az kişi ve metni çevirme sürecini biliyordu. elektronik form orijinal metnin manuel olarak yeniden basılmasına kadar gerçek bir rutine dönüştü. Bugün düz yataklı bir tarayıcıya sahip olmak (evde yalnızca birkaç kişi manuel tarayıcı kullanıyor) ve ince okuyucu 12- emin olun - tarama ve tanımada herhangi bir zorluk yaşanmayacaktır.

Altıncı sürümden başlayarak, FineReader şuralara içe ve dışa aktarmayı destekler: PDF biçimi, Adobe tarafından patentlenmiştir. Pek çok okuyucu muhtemelen bu formattan başka bir formata (belge vb.) dönüştürmede zorluklarla karşılaşmıştır, çünkü bu alanda pek çok gerçekten yararlı program yoktur (yalnızca ABBYY'nin yan ürünü PDF Transformer dikkati hak eder). Gerçek şu ki, bu tür programlar metin tanımayı yalnızca bir kez gerçekleştirir, bunun sonucunda sonucun "kimliği" hiç de büyük değildir (belgenin karmaşıklığına bağlı olarak), ayrıca belgenin biçimlendirmesi oldukça kaybolur.

FineReader söz konusu olduğunda işler farklıdır. Programın dokuzuncu sürümü, Document OCR adlı bir teknolojiyi tanıttı. Bir belgenin bütünleşik tanınması ilkesine dayanır: sayfa sayfa değil, bir bütün olarak analiz edilir ve tanınır. Aynı zamanda, her türlü sütun, başlık, yazı tipi, stil, dipnot ve görseller olduğu gibi kalır veya orijinaline yakın değiştirilir.

Paket kurulumu

Finereader 12'nin demo sürümü, Abbyy.ru web sitesindeki İndirme bölümünde tam olarak indirilebilir. lisanslı sürüm CD'de dağıtıldı. Aynı web sitesinde "Satın Al" bölümünde satın alma yöntemleri hakkında bilgi edinebilirsiniz.

ABBYY geliştiricileri web sitesinde, ABBYY FineReader sürüm 12'nin (veya güncel olan başka bir sürümün) demo sürümünü indirebilirsiniz.

ABBYY FineReader çeşitli sürümlerde dağıtılır: Professional Edition, Corporate Edition, Site License Edition, vb. Şirket ağı bir fırsatla ortak çalışma Belge tanıma üzerinde. Aksi takdirde, fark önemsizdir ve lisans sözleşmesinin koşullarının seçimine bağlıdır.

12 yıl önce, yaklaşık 10 MB disk alanı kaplayan FineReader 2.0'ın olduğunu hayal etmek zor. Zamanla, paket on kat "büyüdü" ve şimdi kurulduğunda 300 MB'a kadar çıkıyor. Çok ya da biraz - kendiniz karar verin. Yeni FR, aralarında az bilinen yapay diller (Ido, Interlingua, Occidental ve Esperanto), programlama dilleri, formüller vb. Bu nedenle, herhangi bir nedenle kurulum sırasında paketin kapladığı alanı sınırlamak istiyorsanız, yalnızca işlem sırasında gerekli olacak bileşenleri kontrol edin.

Bileşenlerin seçimi, fazla zaman almaması gereken kurulum süresini etkiler. Yükleme işlemi sırasında, FR'nin ana özellikleri size tanıtılacaktır. Aktivasyondan sonra (İnternette, E-posta yoluyla, alınan kodu kullanarak vb.), program tam özellikli çalışmaya hazırdır. Demo modunda, maalesef paketi tam olarak kullanmanıza izin vermeyen çeşitli kısıtlamalarla kesinlikle karşılaşacaksınız.

FineReader arayüzü. işlevsellik

Programın özelliklerine erişim, hem kurulum işleminden hemen sonra ana menüde görünecek olan komut dosyaları yardımıyla hem de aslında ana arayüz üzerinden sağlanmaktadır.

FineReader'ı başlatırken açılış ekranı

Dış görünüş sürümden sürüme program herhangi bir özel değişikliğe uğramaz: geliştiriciler onu büyük ölçüde değiştirmek için herhangi bir neden görmezler. Tüm ABBYY ürünlerinde (Lingvo, PDF Transformer, FlexiCapture...) göze çarpan ergonomiye büyük önem verilmektedir. Başka bir deyişle, Fine Reader 12'nin arayüzü iyi düşünülmüş ve yeni başlayanlar da dahil olmak üzere tüm kullanıcılar için tasarlanmıştır. "Sonucu tek tıklamayla alın" ilkesi, bir şeyler kurmaya ve değiştirmeye alışkın olmayanlara hitap edecek. Öte yandan, daha Ileri düzey kullanıcılar ayarlar iletişim kutusu (Araçlar -> Seçenekler...) aracılığıyla FineReader'a ince ayar yapabilir. Tek uyarı: Uygulamada rahat çalışma için, ekran çözünürlüğünün 1280 × 800 olarak ayarlanması arzu edilir, böylece tüm araçlar dedikleri gibi her zaman elinizin altındadır.

Fine Reader programını başlattıktan sonra, program işlevlerine hızlı erişim düğmelerinin bulunduğu bir pencere açılacaktır. Bu menüye ayrıca Araçlar -> ABBYY FineReader menüsü, programın en sağ köşesindeki "Temel Komut Dosyaları" düğmesi veya Ctrl+N tuş bileşimi aracılığıyla da erişilebilir (Word'e benzer, bu kombinasyon yeni bir belge açar) .

Microsoft Word'e tarama: FineReader'ın dokuzuncu sürümü, henüz popüler hale gelmeyen Microsoft Word 2007 için destek sağladı. Sırayla, uygulamalardaki araç çubuğunda Microsoft Office, FR'yi yükledikten sonra eklentiler bölümünde "markalı" kırmızı bir simge belirir.

Tanınan bir FineReader belgesini dışa aktarma menüsü

Belgeleri taramak ve tanımak için dilleri seçme

Microsoft Office'e ek olarak FR, Microsoft Office ile entegrasyonu destekler Microsoft Outlook, tanıma sonuçlarının aynı Microsoft Word, Excel, Lotus Word Pro, Corel WordPerect ve Adobe Acrobat. Bu özellikler, özellikle programda düzenli olarak çalışmanız gerekiyorsa, programla çalışmayı bir dereceye kadar kolaylaştırır ve hızlandırır.

Microsoft Word'de PDF veya resimler: PDF'den veya Finereader 12 sürümü tarafından desteklenen başka bir grafik dosyası türünden verileri tanır. FR'de bir PDF dosyasından metin çıkarma teknolojisinin, metin içeriğinin (PDF'deki metin katmanı olmayabilir) grafik içerikten yalnızca "soyulması" olmadığına dikkat edilmelidir. Aslında, tanıma teknolojisi oldukça karmaşıktır: belgenin içeriğini analiz ettikten sonra, program metinle ne ve nasıl yapılacağına karar verir: her metin parçası için sadece ayıklayın veya tanıyın vb.

Microsoft Excel'e tarama: taranan görüntü tablolar içeriyorsa, XLS'ye (Microsoft Excel formatı) tarama haklı olabilir.

PDF'ye tara: PDF'ye taramak için birçok neden vardır. Bunlardan biri güvenliktir: FR'ye aşina olan ve parola korumalı olarak yapılandırılabilen tek biçimdir. Parola yalnızca bir belgeyi açmak için değil, aynı zamanda yazdırmak ve diğer işlemler için de belirlenir. Üç şifreleme seviyesinden birini seçmek mümkündür: 40-bit, RC4 standardına göre 128-bit, AES (Gelişmiş Şifreleme Standardı) standardına göre 128-bit seviyesi.

Fotoğrafı Microsoft Word'e dönüştürün: bir dosyayı grafik biçiminden (ve bir PDF veya çok sayfalı bir görüntü olabilir) DOC / DOCX'e dönüştürmek.

Fine Reader'da açın: FineReader tarafından tanınması için bir grafik dosyası (PDF , BMP , PCX , DCX , JPEG , JPEG 2000, TIFF , PNG ) açın.

FineReader'da çalışmak

Şimdi - kısaca programın özellikleri hakkında. Tüm süreç, tarama, tanıma ve sonuçları kaydetme olarak ayrılmıştır. Program eyleminin türünü seçtikten, taranacak dosya veya aygıtı belirledikten sonra FineReader, bu arada, merkezi işlemci için oldukça kaynak yoğun olan görevini yavaş yavaş yerine getirir.

Eğer sen - mutlu sahibiçift çekirdekli işlemci, ardından Fine Reader 12 paketinde çalışan bilgisayarın hızının gücünü takdir edebilirsiniz. Gerçek şu ki, çift çekirdekli bir işlemci tespit eden FR, bir belgenin bir değil iki sayfasını aynı anda paralel olarak tanıyor. Bir önemsememek - ama güzel.

Önce tarama, ardından geçici bir belgenin tanınması ve seçilen formatta dışa aktarılması gelir.

PDF belgesi tanıma işlemi

Tarama. Hiçbiri ön ayarlar FineReader uygulamasında (okuyucu seçimi dışında) taramadan önce bunu yapmanıza gerek yoktur. Komut dosyaları bu nedenle icat edildi: aynı tür eylemlerin yürütülmesini basitleştirmek için tasarlandılar.

Tanıma. Sadeleştirme diğer küçük şeyleri de etkiledi. Bu nedenle, programın geçmiş sürümlerini hatırlarsak, belgenin dilini (birkaç tane varsa dilleri) manuel olarak değiştirmek zorunda kalmadan önce. Şimdi bu, her zaman olmasa da otomatik olarak gerçekleşir. İkinci durumda, FR göze batmadan belgenin dilini kontrol etmeyi teklif eder.

FR tanıma teknolojisine dönersek: program neden sayfa sayfa değil de önce belgenin tamamını tarıyor? Daha önce de belirtildiği gibi, metin tüm içeriğe göre tanınır: boyut / yazı tipi, tablolar ve kenarlıklar, girintiler vb.

FineReader 12, metin alanı bulunamadığından sayfanın tanınamayacağını belirten bir mesaj verirse şaşırmayın. Deney uğruna, üzerinde fotoğraf çektik cep telefonu LCD ekrandan - metin belgesinin alanı (ancak sonucu önceden bilmek). Fine Reader 12 görseldeki yazıyı tanımadı çünkü o kadar kaliteli olduğu belli ki bunun için yeterli olmadığı aşikar. İkinci ziyaretimizde fotoğraf çektik. dijital kamera normal ışık altında metin içeren sayfa.

FineReader, biçimlendirmeyi koruyarak ve farklı yazımlara sahip olabilecek bazı şüpheli noktaları veya karakterleri işaretleyicilerle işaretleyerek pasajı sorunsuz bir şekilde tanıdı.

Resimde görebileceğiniz gibi, bunlar çoğunlukla noktalar, kısa çizgiler, virgüller - genel olarak küçük karakterlerdir. Ayrıca programın fotoğraflanan sayfadaki tümsekleri, eğrilikleri hesaba kattığı ve metin satırlarını hizaladığı açıkça görülmektedir. Sonuç - FR, çok zor olmasa da göreviyle mükemmel bir iş çıkardı.

Bazen bazı küçük noktalar Fine Reader programı tarafından gözden kaçabilir, ancak bunlar manuel olarak kolayca düzeltilebilir. Neyse ki paketin kendi WYSIWYG düzenleyicisi var ve yetenekleri belgenin son düzenlemesini yapmak için oldukça yeterli. Yazım denetimi de mevcuttur.

Tanıma doğruluğu nasıl geliştirilir, böylece daha sonra metni daha az düzenlemekle uğraşmak zorunda kalırsınız? İlk olarak, özel bir Microsoft Word sözlüğü bağlayabilirsiniz. Doğru, belki de yazım denetleyicinin (yazım ve dilbilgisini kontrol eden bir modül) kelime dağarcığındaki artış dışında, doğruluktaki artışı yargılamak zordur. Diğer şeylerin yanı sıra, tanımayı iyileştirmek için program ayarlarına (Araçlar -> Seçenekler) aşina olmak ve iki moddan birini seçmek mantıklıdır:

dikkatli tanıma- herhangi bir "karmaşıklıktaki" belgeleri tanırken seçilebilir: ızgara çizgileri olmayan tablolar, metin, grafikler, renkli bir arka plan üzerindeki tablolar vb. Ayrıca tanıma için düşük kaliteli bir kaynakla yardımcı olabilir

hızlı tanıma - bu mod basit düzende büyük hacimli belgeleri işlemek için veya tam tanıma için zamanın izin vermediği durumlarda önerilir. Çoğu durumda, beyaz bir arka plan üzerine siyah basılı bir metniniz olduğunda, hızlı bir tanımada durabilirsiniz.

Genel olarak, FineReader'ın kalitesini artırmak, ayrıntılarını resmi yardımdan, yani "Sonuçlar nasıl geliştirilir" bölümünden öğrenebileceğiniz ayrı bir tartışma konusudur.

Bir belgeyi kaydetme. Fine Reader 12'deki çalışmanın son aşaması, nihai sonucu belirli bir grafik/metin biçiminde kaydetmektir. Ön kaydetme ayarları, FR seçeneklerinde belirtilebilir: Araçlar -> Seçenekler, Kaydet sekmesi. Her biçimin kendi ayarları vardır. DOCX biçiminde kaydederken, biçim uyumluluğuna dikkat etmelisiniz (DOCX dosyaları Word 2003'te tanınmaz)<). В txt-файлах не забудьте проверить правильность кодировки (особенно в случае с текстом в кириллице).

ABBYY Ekran Görüntüsü Okuyucu

Geliştiriciler genellikle birçok büyük pakete küçük hizmet yardımcı programları eklemeyi severler. Diyelim ki iyi bilinen Nero disk yazma uygulaması, Nero'nun bile yapamayacağı şeyleri yapmanıza izin veren 3 ila 5 yardımcı program içerir. Genel Bakış (buradan Fine Reader 12'nin bir parçası olarak indirebilirsiniz).

FineReader'a gelince, bileşiminde küçük bir Screenshot Reader uygulaması bulunur. Bununla birlikte, FR'yi kullanarak onu hızlı bir şekilde istediğiniz formata dönüştürebilirsiniz. Programa Başlat menüsünden erişilebilir (Başlat -> Tüm Programlar -> ABBYY FineReader 12.0 -> ABBYY Screenshot Reader.).

Screenshot Reader'ın olanakları ilk bakışta göründüğünden biraz daha geniştir. (Aksi takdirde, sadece klavyedeki "PrintScreen" tuşuna basarak yapmak mümkün olacaktır). Screenshot Reader'ın ekran görüntüsünü (veya daha doğrusu ekranın seçilen bir alanını) almasına ek olarak, program FR ile sıkı bir şekilde entegre edilmiştir.

Screenshot Reader panelinde "Snapshot" butonuna tıkladığınızda imlecin şekli değişir ve ekran seçim aracı açılır. Görüntünün seçilen alanı, daha fazla metin tanıma için çerçevelenir (otomatik olarak başlar).

Açılır listede, istediğiniz eylemi seçebilirsiniz: aslında, Screenshot Reader, hızlı FR komut dosyalarını çoğaltır, tek fark, giriş olarak tarayıcıdan bir anlık görüntü yerine bir ekran görüntüsü alınmasıdır.

Programın tüm paketle birlikte aktivasyon gerektirdiği unutulmamalıdır. Bir ürünü kaydettirirken, ABBYY FineReader 12 Professional Edition Screenshot Reader, "bonus" olarak ücretsiz olarak sağlanır.

Çözüm

iyi okuyucu- vazgeçilmez program grafik verilerinin taranması ve tanınması için. Rusça arayüz ve ayarların kullanılabilirliği korkutmayacak deneyimsiz kullanıcı. En son formatlar için destek yenilikçi teknolojiler ve sonuç olarak, yüksek kaliteli tanıma programı yapar en iyi seçim, özellikle de ABBYY FineReader'ın bu alanda hâlâ rakibi olmadığı için.

Kısayol Tuşları FineReader 12

Yaratmak yeni belge ABBYY FineReader-CTRL+N
Bir ABBYY FineReader belgesi açın 12 - CTRL+ÜST KARAKTER+N
Sayfaları Kaydet-CTRL+S
Resmi dosyaya kaydet- CTRL+ALT+S
Bir belgenin tüm sayfalarını tanıma- CTRL+SHIFT+R
Geçerli sayfayı kapat- CTRL+F4
Bir ABBYY FineReader belgesinin seçili sayfalarını tanıma-CTRL+R
Senaryo Yöneticisini Aç- CTRL+T
Fine Reader Seçenekleri iletişim kutusunu açın- CTRL+SHIFT+O
Yardımı Aç- F1
Belge penceresine git-ALT+1
Görüntü penceresine git- ALT+2
Metin penceresine git- ALT+3
Yakın çekim penceresine git- ALT+4