• ABBYY FineReader'ı kullanarak metin nasıl tanınır: adım adım talimatlar. ABBYY FineReader nasıl kullanılır?

    Program hakkında konuşalım ABBYY FineReader 12, yani en son sürümü hakkında. Fazla uzağa bakmadan, en ünlü ABBYY ürününü seçtik; bu ürün, esas itibarıyla mükemmel bir şekilde Ruslaştırılmıştır. Zaten ilk bakışta, Fine Reader (FR), iyi bir Rusça dil desteğine sahip bir program izlenimi veriyor: bu bağlamda, aslında, arka plan bilgileri de dahil olmak üzere her şey çok iyi bir düzeyde yapılıyor.

    İlk önce geri çekilin. Arşivin tamamının veya bir kısmının dijital formata nasıl dönüştürüleceği sorusu her zaman önemlidir (ve aslında “dijital” kelimesiyle ne kastedilmektedir). Bir tarayıcı satın almanın tüm sorunları çözmesi pek mümkün değildir. Tabii ki, çoğu zaman özel bir diske sahip bir veya birkaç disk yazılım. Bununla birlikte, zaten temizleme aşamasında, tarama programının kalitesinin arzulanan çok şey bıraktığı veya kaydetmenin yapıldığı formatın maalesef depolama için uygun olmadığı ortaya çıktı. Neden? Çoğunluk grafik formatları metni belgenin metin olmayan alanından ayırmayın ve bu nedenle böyle bir dosyadan herhangi bir pasajın kopyalanması mümkün değildir.

    Bu gibi durumlarda, özellikle bir görüntüden metin çıkarmayı içeren işlevsel "metin tanıyıcı" programlar kurtarmaya gelir.

    ABBYY FineReader'a Giriş

    Naylon poşet ABBYY Fine Reader 12- metinlerin optik olarak tanınması sistemi (Optik Karakter Tanıma - OCR). Hem basılı belgelerin bilgisayara otomatik olarak girilmesi hem de PDF belgelerinin ve fotoğrafların düzenlenebilir formatlara dönüştürülmesi için tasarlanmıştır. (program kılavuzundan)

    "OCR" kısaltması tüm veri tanıma uygulamaları için geçerlidir (yalnızca metin için değil). Verilerin çıkarılmasına yönelik kaynak basılı veya elektronik bir belge olabilir. Bir zamanlar, çok uzun zaman önce, şu ya da bu şekilde OCR'yi çok az kişi biliyordu ve metni elektronik forma çevirme süreci, orijinal metnin manuel olarak yeniden basılmasına kadar gerçek bir rutine dönüştü. Günümüzde düz yataklı bir tarayıcıya sahip olmak (evde yalnızca birkaç kişi manuel tarayıcı kullanıyor) ve ince okuyucu 12- emin olun - tarama ve tanıma konusunda herhangi bir zorluk yaşanmayacak.

    Altıncı sürümden itibaren FineReader, Adobe patentli PDF formatına içe ve dışa aktarmayı destekler. Pek çok okuyucu muhtemelen bu formattan başka bir formata (belge vb.) çeviri yaparken zorluklarla karşılaşmıştır, çünkü aslında faydalı programlar bu alanda çok fazla şey yok (yalnızca ABBYY'nin alt ürünü - PDF Transformer ilgiyi hak ediyor). Gerçek şu ki, bu tür programlar metin tanımayı yalnızca bir kez gerçekleştirir, bunun sonucunda sonucun "kimliği" hiç de büyük değildir (belgenin karmaşıklığına bağlı olarak) ve ayrıca belgenin biçimlendirmesi oldukça kaybolur.

    FineReader'da ise işler farklıdır. Programın dokuzuncu versiyonu Belge OCR adı verilen bir teknolojiyi tanıttı. Bir belgenin bütünsel olarak tanınması ilkesine dayanır: sayfa sayfa değil, bir bütün olarak analiz edilir ve tanınır. Aynı zamanda her türlü sütun, başlık, yazı tipi, stil, dipnot ve görseller olduğu gibi kalır veya orijinaline yakın olarak değiştirilir.

    Paket kurulumu

    Finereader 12'nin demo sürümü Abbyy.ru web sitesinden İndirme bölümünden indirilebilir. lisanslı sürüm CD'de dağıtılıyor. Aynı web sitesindeki "Satın Al" bölümünde satın alma yöntemleri hakkında bilgi edinebilirsiniz.

    ABBYY geliştiricileri web sitesinden ABBYY FineReader sürüm 12'nin demo sürümünü (veya güncel başka bir sürümü) indirebilirsiniz.

    ABBYY FineReader çeşitli versiyonlarda dağıtılmaktadır: Professional Edition, Corporate Edition, Site License Edition, vb. Professional sürümü, diğerlerinden farklı olarak çalışmak üzere tasarlanmıştır. Şirket ağı bir fırsatla ortak çalışma belge tanıma üzerinden. Aksi takdirde fark önemsizdir ve lisans sözleşmesi şartlarının seçimine bağlıdır.

    12 yıl önce yaklaşık 10 MB disk alanı kaplayan FineReader 2.0'ın var olduğunu hayal etmek zor. Zamanla paket on kat "büyüdü" ve şimdi kurulduğunda 300 MB'a kadar yer kaplıyor. Çok ya da az - kendiniz karar verin. Yeni FR, aralarında az bilinen yapay dillerin (Ido, Interlingua, Occidental ve Esperanto), programlama dillerinin, formüllerin vb. Bulunduğu 179 tanıma dilini desteklemektedir. Çeşitli format ve komut dosyalarına yönelik desteği unutmayalım. Bu nedenle, herhangi bir nedenle kurulum sırasında paketin kapladığı alanı sınırlamak istiyorsanız, yalnızca çalışma sırasında gerekli olacak bileşenleri kontrol edin.

    Bileşenlerin seçimi kurulumun süresini etkiler, ancak bu çok fazla zaman almamalıdır. Kurulum işlemi sırasında FR'nin temel özellikleriyle tanışacaksınız. Etkinleştirmeden sonra (İnternette, E-posta yoluyla, alınan kodu kullanarak vb.), program tam özellikli çalışmaya hazırdır. Demo modunda kesinlikle çeşitli kısıtlamalarla karşılaşacaksınız ve bunlar maalesef paketi tam olarak kullanmanıza izin vermiyor.

    FineReader arayüzü. İşlevsellik

    Programın özelliklerine erişim, hem kurulum işleminden hemen sonra ana menüde görünecek komut dosyaları yardımıyla, hem de aslında ana arayüz aracılığıyla mümkündür.


    FineReader'ı başlatırken açılış ekranı

    Dış görünüş sürümden sürüme program herhangi bir özel değişikliğe uğramaz: geliştiriciler onu büyük ölçüde değiştirmek için herhangi bir neden görmüyorlar. Tüm ABBYY ürünlerinde (Lingvo, PDF Transformer, FlexiCapture...) göze çarpan ergonomiye büyük önem verilmektedir. Başka bir deyişle Fine Reader 12'nin arayüzü iyi düşünülmüş ve yeni başlayanlar dahil tüm kullanıcılara yöneliktir. "Tek tıklamayla sonuç alın" ilkesi, bir şeyi kurup değiştirmeye alışkın olmayanlara hitap edecek. Öte yandan, daha deneyimli kullanıcılar ayarlar iletişim kutusunu (Araçlar -> Seçenekler...) kullanarak FineReader'da ince ayar yapabilirler. Tek uyarı: Uygulamada rahat çalışma için ekran çözünürlüğünün 1280 × 800'e ayarlanması arzu edilir, böylece tüm araçlar dedikleri gibi her zaman elinizin altında olur.

    Fine Reader programını başlattıktan sonra düğmelerin bulunduğu bir pencere görünecektir hızlı erişim fonksiyonları programlamak için. Bu menüye aynı zamanda Araçlar -> ABBYY FineReader menüsü, programın en sağ köşesindeki "Temel Komut Dosyaları" düğmesi veya Ctrl+N tuş birleşimi (bu kombinasyonun yeni bir belge açtığı Word'e benzer) aracılığıyla da ulaşılabilir. .

    Taramak Microsoft Word: FineReader'ın dokuzuncu sürümü, henüz popüler olmayan Microsoft Word 2007 desteğini sundu. Microsoft uygulamaları Office, FR'yi yükledikten sonra eklentiler bölümünde "markalı" kırmızı bir simge belirir.


    Tanınan bir FineReader belgesini dışa aktarma menüsü
    Belgeleri taramak ve tanımak için dil seçme

    Dışında Microsoft Office FR ile entegrasyonu destekler Microsoft Outlook, tanıma sonuçlarının aynı Microsoft Word, Excel, Lotus Word Pro, Corel WordPerect ve Adobe Acrobat. Bu özellikler, özellikle düzenli olarak çalışmanız gerekiyorsa, programla çalışmayı bir dereceye kadar kolaylaştırır ve hızlandırır.

    Microsoft Word'deki PDF veya resimler: PDF'den veya Finereader 12 sürümü tarafından desteklenen başka bir grafik dosyası türünden verileri tanır. FR'de bir PDF dosyasından metin çıkarma teknolojisinin, yalnızca metin içeriğinin (PDF'deki metin katmanı olmayabilir) grafikten "soyulması" olmadığı unutulmamalıdır. Aslında, tanıma teknolojisi oldukça karmaşıktır: belgenin içeriğini analiz ettikten sonra program metinle ne ve nasıl yapılacağına karar verir: yalnızca ayıklamak veya tanımak vb. her metin parçası için.

    Taramak Microsoft Excel: Taranan görüntünün tablolar içermesi durumunda XLS'ye (Microsoft Excel formatı) tarama yapılabilir.

    PDF'ye Tara: PDF'ye taramanın birçok nedeni vardır. Bunlardan biri güvenliktir: FR'ye aşina olan ve parola korumalı olarak yapılandırılabilen tek formattır. Yalnızca bir belgeyi açmak için değil, aynı zamanda yazdırmak ve diğer işlemler için de parola belirlenir. Üç şifreleme seviyesinden birini seçmek mümkündür: RC4 standardına göre 40 bit, 128 bit, AES (Gelişmiş Şifreleme Standardı) standardına göre 128 bit seviyesi.

    Fotoğrafı Microsoft Word'e dönüştürün: bir dosyayı grafik biçiminden (ve bir PDF veya çok sayfalı bir görüntü olabilir) DOC / DOCX'e dönüştürme.

    Fine Reader'da açın: açık grafik dosyası FineReader tanıma için (PDF, BMP, PCX, DCX, JPEG, JPEG 2000, TIFF, PNG).

    FineReader'da çalışma

    Şimdi - kısaca programın özellikleri hakkında. Tüm süreç, sonuçların taranması, tanınması ve kaydedilmesi şeklinde ayrılmıştır. Program eyleminin türünü seçtikten, taranacak dosyayı veya cihazı belirledikten sonra FineReader, merkezi işlemci için oldukça kaynak yoğun olan görevini yavaş yavaş gerçekleştirir.

    Eğer sen - mutlu sahibiÇift çekirdekli işlemciyi kullanarak Fine Reader 12 paketinde çalışarak bilgisayarın hızının gücünü takdir edebilirsiniz. Gerçek şu ki, çift çekirdekli bir işlemci tespit eden FR, paralel olarak bir belgenin bir değil iki sayfasını aynı anda tanıyor. Önemsiz - ama güzel.

    Önce tarama, ardından geçici bir belgenin tanınması ve seçilen formata aktarılması gelir.


    PDF belge tanıma işlemi

    Tarama. Hiçbiri ön ayarlar FineReader uygulamasında (okuyucu seçmek dışında) taramadan önce bunu yapmanıza gerek yoktur. Komut dosyalarının icat edilmesinin nedeni budur: Aynı tür eylemlerin yürütülmesini basitleştirmek için tasarlanmıştır.

    Tanıma. Sadeleştirme diğer küçük şeyleri de etkiledi. Dolayısıyla, programın geçmiş sürümlerini hatırlarsak, daha önce belgenin dilini (birkaç tane varsa dilleri) manuel olarak değiştirmek zorunda kalıyorduk. Artık bu her zaman olmasa da otomatik olarak gerçekleşiyor. İkinci durumda, FR göze çarpmadan belgenin dilini kontrol etmeyi teklif eder.

    FR tanıma teknolojisine geri dönelim: Program neden önce sayfa sayfa değil de tüm belgeyi tarıyor? Daha önce de belirtildiği gibi, metin tüm içeriğe göre tanınır: boyut / yazı tipi, tablolar ve kenarlıklar, girintiler vb. bakımından benzer yazı tipleri seçilir.

    FineReader 12 size herhangi bir metin alanı bulunamadığından sayfanın tanınamayacağını belirten bir mesaj verirse şaşırmayın. Deney amacıyla fotoğraf çektik cep telefonu LCD ekrandan - metin belgesinin alanı (ancak sonucun önceden bilinmesi). Fine Reader 12 görüntüdeki metni tanıyamadı çünkü görüntü o kadar kaliteliydi ki bunun için açıkça yeterli değildi. İkinci ziyaretimizde fotoğraf çektirdik. dijital kamera normal ışık altında metin içeren sayfa.

    FineReader, formatı koruyarak ve bazı şüpheli noktaları veya farklı yazımlara sahip olabilecek karakterleri işaretleyicilerle işaretleyerek pasajı sorunsuz bir şekilde tanıdı.

    Resimde görebileceğiniz gibi bunlar çoğunlukla noktalar, kısa çizgiler, virgüller - genel olarak küçük karakterlerdir. Ayrıca programın fotoğraflanan sayfadaki tümsekleri, eğrilikleri dikkate aldığı ve metin satırlarını hizaladığı açıkça görülmektedir. Sonuç - FR, çok zor olmasa da, mükemmel bir iş çıkardı.

    Bazen bazı küçük noktalar Fine Reader programı tarafından gözden kaçabilir, ancak bunlar manuel olarak kolayca düzeltilebilir. Neyse ki, paketin kendi WYSIWYG editörü var ve yetenekleri belgenin son düzenlemesini yapmak için yeterli. Yazım denetimi de mevcuttur.

    Daha sonra metni düzenlemekle daha az uğraşmak zorunda kalmanız için tanımanın doğruluğu nasıl geliştirilir? Öncelikle özel bir Microsoft Word sözlüğü bağlayabilirsiniz. Doğru, belki de yazım denetleyicinin (yazım ve dilbilgisini kontrol eden bir modül) kelime dağarcığının artması dışında doğruluktaki artışı yargılamak zordur. Diğer şeylerin yanı sıra, tanımayı geliştirmek için program ayarlarına (Araçlar -> Seçenekler) aşina olmanız ve iki moddan birini seçmeniz mantıklı olacaktır:

    dikkatli tanıma- herhangi bir "karmaşıklıktaki" belgeleri tanırken seçilebilir: ızgara çizgileri olmayan tablolar, metinler, grafikler, renkli arka plandaki tablolar vb. ile. Ayrıca tanıma için düşük kaliteli bir kaynakta da yardımcı olabilir

    hızlı tanıma- Bu mod, basit bir tasarıma sahip büyük hacimli belgelerin işlenmesi için veya zamanın tam olarak tanınmasına izin vermemesi durumunda önerilir. Çoğu durumda, beyaz bir arka plan üzerinde siyah yazdırılmış metniniz olduğunda, hızlı bir şekilde tanıyabilirsiniz.

    Genel olarak FineReader'ın kalitesini artırmak ayrı bir tartışma konusudur ve ayrıntılarını resmi yardımdan, yani "Sonuçlar nasıl geliştirilir?" bölümünden öğrenebilirsiniz.

    Bir belgeyi kaydetme. Fine Reader 12'deki çalışmanın son aşaması, nihai sonucun belirli bir grafik/metin formatında kaydedilmesidir. Ön kaydetme ayarları FR seçeneklerinde belirtilebilir: Araçlar -> Seçenekler, Kaydet sekmesi. Her formatın kendi ayarları vardır. DOCX formatında kaydederken format uyumluluğuna dikkat etmelisiniz (DOCX dosyaları Word 2003'te tanınmamaktadır)<). В txt-файлах не забудьте проверить правильность кодировки (особенно в случае с текстом в кириллице).

    ABBYY Ekran Görüntüsü Okuyucu

    Geliştiriciler genellikle birçok büyük pakete küçük hizmet yardımcı programları eklemeyi severler. Diyelim ki iyi bilinen Nero disk yazma uygulaması, Nero'nun bile yapamayacağı şeyleri yapmanıza olanak tanıyan 3 ila 5 yardımcı programdan oluşan bir set içeriyor. Genel Bakış (burada Fine Reader 12'nin bir parçası olarak indirebilirsiniz).

    FineReader'a gelince, bileşiminde küçük bir Screenshot Reader uygulaması bulunur. Bununla birlikte, FR'yi kullanarak hızlı bir şekilde istediğiniz formata dönüştürebilirsiniz. Programa Başlat menüsünden ulaşılabilir (Başlat -> Tüm Programlar -> ABBYY FineReader 12.0 -> ABBYY Screenshot Reader.).

    Screenshot Reader'ın olanakları ilk bakışta göründüğünden biraz daha geniştir. (Aksi takdirde bunu sadece klavyedeki "PrintScreen" tuşuna basarak yapmak mümkün olacaktır). Screenshot Reader'ın ekran görüntüsünü (veya daha doğrusu ekranın seçilen bir alanını) almasına ek olarak, program FR ile sıkı bir şekilde entegre edilmiştir.

    Ekran Görüntüsü Okuyucu panelinde "Anlık Görüntü" butonuna tıkladığınızda imlecin şekli değişir ve ekran seçim aracı açılır. Görüntünün seçilen alanı daha fazla metin tanıma için çerçevelenir (otomatik olarak başlar).

    Açılır listede istediğiniz eylemi seçebilirsiniz: Aslında, Screenshot Reader hızlı FR komut dosyalarını çoğaltır; aradaki fark, tarayıcıdan anlık görüntü yerine giriş olarak bir ekran görüntüsünün alınmasıdır.

    Programın tüm paketle birlikte aktivasyon gerektirdiğine dikkat edilmelidir. Bir ürünü kaydederken ABBYY FineReader 12 Professional Edition Screenshot Reader "bonus" olarak ücretsiz olarak sağlanır.

    Çözüm

    iyi okuyucu- vazgeçilmez program Grafik verilerinin taranması ve tanınması için. Rusça arayüz ve ayarların kullanılabilirliği korkutmayacak deneyimsiz kullanıcı. En yeni formatlar için destek yenilikçi teknolojiler ve sonuç olarak yüksek kaliteli tanınma, programın en iyi seçimözellikle ABBYY FineReader'ın bu alanda hâlâ rakibi olmadığı için.

    Kısayol Tuşları FineReader 12

    • Yaratmak yeni belge ABBYY FineReader-CTRL+N
    • ABBYY FineReader belgesini açın 12 - CTRL+SHIFT+N
    • Sayfaları Kaydet-CTRL+S
    • Resmi dosyaya kaydet-CTRL+ALT+S
    • Bir belgenin tüm sayfalarını tanıma- CTRL+SHIFT+R
    • Geçerli sayfayı kapat-CTRL+F4
    • ABBYY FineReader belgesinin seçili sayfalarını tanıma-CTRL+R
    • Senaryo Yöneticisini Aç-CTRL+T
    • Fine Reader Seçenekleri iletişim kutusunu aç- CTRL+SHIFT+O
    • Yardımı Aç- F1
    • Belge penceresine git-ALT+1
    • Görüntü penceresine git-ALT+2
    • Metin penceresine git- ALT+3
    • Yakın çekim penceresine git-ALT+4

    Tarama ve dosya işlemeyle çalışmak için en popüler işlevlerden biri çeşitli türler- İyi okuyucu. Fonksiyonel yazılım ürünü Rus şirketi ABBYY tarafından geliştirildi, belgeleri yalnızca tanımaya değil, aynı zamanda işlemeye de (çevirme, format değiştirme vb.) olanak tanıyor. Birçok kullanıcı ABBYY FineReader'ı yalnızca yükleyebilir ancak nasıl kullanılacağını hemen çözemez. Bu yazıda birçok sorunun cevabını bulabilirsiniz.

    Program, metni taramanıza ve tanımanıza olanak tanır - yalnızca

    ABBYY FineReader 12'nin nasıl bir program olduğunu ayrıntılı olarak anlamak için tüm özelliklerini ayrıntılı olarak ele almak gerekir. İlk ve en kolay işlev bir belgeyi taramaktır. İki tarama seçeneği vardır: tanımalı ve tanımasız. Basılı bir sayfanın düzenli olarak taranması durumunda, taradığınız görüntüyü bilgisayar cihazınızda belirtilen klasöre alacaksınız.

    DİKKAT. Sayfa, yazıcının tarama kısmına tam olarak yazıcıda belirtilen konturlar boyunca yerleştirilmelidir. Kaynağı kurcalamayın, bu durum aşağıdaki durumlara neden olabilir: kötü kalite son tarama.

    Yardımcı programın önemli bir işlevi olduğundan, FineReader'ın sizin için ne olduğuna kendiniz karar vermelisiniz; örneğin, bir görüntüyü hangi renkte almak istediğinizi seçebilirsiniz, tüm fotoğrafları siyah beyaza dönüştürmek mümkündür. Siyah beyaz renkte tanıma daha hızlı olur, işleme kalitesi artar.

    ABBYY FineReader'ın metin tanıma işleviyle ilgileniyorsanız, taramadan önce özel bir düğmeye basmanız gerekir. Bu durumda bilgi edinmek için çeşitli seçenekler vardır. Varsayılan olarak, sayfanın tanınan bir parçası ekranınızda görüntülenecektir ve bunu manuel olarak kopyalayabilir veya düzenleyebilirsiniz.

    Diğer işlevleri seçerseniz dosyayı hemen bir Word belgesi veya Excel elektronik tablosu olarak alabilirsiniz. İşlevleri seçmek çok basittir, menü sezgiseldir, ihtiyacınız olan tüm düğmelerin gözünüzün önünde olması nedeniyle yapılandırması kolaydır.

    ÖNEMLİ. Tanımadan önce ABBYY metni FineReader'da işleme dilini doğru bir şekilde seçmeniz gerekir. Yardımcı programın tamamen otomatik olarak çalışmasına rağmen, kaynak kodun düşük kalitesi, kaynak kodunda hangi dilin bulunduğunun anlaşılmasını mümkün kılmamaktadır. Bu, uygulamanın nihai sonuçlarının kalitesini büyük ölçüde azaltır.

    Çoklu çalışma modları

    ABBYY FineReader 12'nin nasıl kullanılacağını tam olarak anlamak için iki çalışma modunu denemeniz gerekir: "Tamamen" ve "Hızlı Tanıma". İkinci mod yüksek kaliteli görüntüler için uygundur, birinci mod ise düşük kaliteli dosyalar için uygundur. Kapsamlı modun dosyaları işlemesi 3-5 kat daha uzun sürer.

    Resimde programın sonucu gösterilmektedir - bir görüntüden metin tanıma

    Başka hangi özellikler var?

    ABBYY FineReader'daki metin tanıma tek özellik değil kullanışlı özellik. Daha fazla kullanıcı rahatlığı için,

    Yani bilgisayarımızda FineReader kurulu. Tarayıcıyı açıyoruz ve çok sayfalı bir belgeyi dijitalleştiriyoruz. Buna şartlı olarak "Sözleşme" diyelim.

    Belgenin ilk sayfasını tarayıcı camına yerleştirip kapağı kapatıyoruz. FineReader programını başlatıyoruz. "Tara" düğmesine tıklayın veya tuşlarla "Ctrl + K" kombinasyonuna basın. ABBYY FineReader Tarama penceresi açılır. Her zamanki gibi dijitalleştirirken metin sayfası 11-12 puntoluk bir yazı tipi yazdınız, ayarları varsayılan pencerede bırakın ve "Görüntüle" düğmesini tıklayın.

    Tarayıcı çalışıyor ve birkaç saniye sonra sayfamızı görüntüleme penceresinde görüyoruz. Burada gerekirse taramayı yeniden boyutlandırabiliriz. Ve sonra "Tara" düğmesine tıklayın.

    FineReader OCR işlemini başlatır ve bir dakika içinde sayfa görüntüsü program penceresinde açılır. Sağ kısım Pencere artık üç bölüme ayrılmıştır. Soldaki "Resim" bölümünde resmi düzenleyebiliriz. Görüntü düzenleme hakkında daha fazla bilgiyi şu derste okuyabilirsiniz: Kitap tarama. Sağdaki "Metin" bölümünde metinde hemen değişiklik yapabilirsiniz - sayfanın içeriğini kaydetmeden önce bile düzenleyebilirsiniz. Bu, örneğin bir belgedeki tarihleri, ayrıntıları ve soyadlarını hızlı bir şekilde değiştirmeniz gerektiğinde çok kullanışlıdır.

    Tanınan sayfanın simgesi "Sayfalar" penceresinin sol tarafında görünür:

    Herhangi bir şeyi düzenlemeniz gerekmiyorsa tarayıcı camındaki ilk sayfayı ikinci sayfayla değiştirin ve teknolojiyi tekrarlayın. Tarama boyutlarını "ABBYY FineReader Tarama" penceresinde ilk sayfa için "Görüntüle" modunda ayarladıktan sonra, şimdi hemen "Tara" düğmesine tıklayın. İlk sayfa için belirlenen ayarlar kaydedilir ve sonraki sayfalar önizleme yapılmadan taranır. Böylece belgemizin tüm sayfalarını tarıyoruz.

    Bitirdik ve şimdi simgelere dönüşümlü olarak tıklayarak sayfaları açıp doğru sıralarını kontrol ediyoruz.

    Bundan sonra, "Sayfalar" penceresinin sol tarafında, "Düzenle - Tümünü Seç" düğmesini veya "Ctrl + A" klavye kısayolunu kullanarak tüm simgeleri seçin. Ardından, "Kaydet" düğmesinin yanındaki açılır listeden şu komutu seçin: "Farklı kaydet PDF belgesi":


    Şimdi düğmenin kendisine basıyoruz ve "Sözleşme.pdf" adlı belgeyi "Sözleşme" klasörüne kaydediyoruz:


    Sonuç olarak, pdf formatında çok sayfalı bir metin belgesi elde ediyoruz - belgemizin "Sözleşme" koşullu adıyla elektronik bir versiyonu.

    Yani metin belgelerini FineReader ile dijitalleştiriyoruz.

    "ABBYY FineReader Taranıyor" penceresinde tarama modunu "renkli" olarak değiştirerek, renkli resim ve fotoğrafları da kolayca dijital hale getirebiliriz.

    Ve içeri soruyorum içerik menüsüörneğin, "Microsoft Word 2007 belgesi olarak kaydet" komutu, projemizi tek bir çok sayfalı düzenlenebilir Word belgesine dönüştürecektir.

    Genel olarak program kolayca sindirilebilir, sezgiseldir ve açılır ipuçları her yerdedir.

    Abbyy FineReader'ın 20 yılı aşkın bir geçmişi vardır. Şirket, 2013 yıl dönümünü Mac için tam teşekküllü (2009 Ekspres Sürümü ile karşılaştırıldığında) Abbyy FineReader Pro'nun piyasaya sürülmesiyle kutladı ve birkaç ay sonra, Şubat 2014'te, Windows kullanıcıları- Abbyy FineReader 12 Profesyonel ve Kurumsal. Önceki versiyonun 2011'de ortaya çıktığını ve iki buçuk yılın önemli bir süre olduğunu hatırlatmama izin verin - değişikliklerin ne kadar önemli olduğunu bulalım.

    Genel bilgi

    Şunun için sistem gereksinimleri: Yeni sürüm hiç değişmedi. Platform Windows veya Windows Server Sırasıyla XP ve 2003'ten başlayarak. Şu anda donanım talepleri daha da mütevazı: 1 GHz frekansına sahip herhangi bir kapasiteye sahip bir işlemci, rasgele erişim belleği her bilgi işlem çekirdeği için en az 1 GB artı 512 MB vb. disk alanı- artık kurulum 700 yerine 850 MB gerektiriyor (artı daha önce olduğu gibi çalışma dosyaları için başka bir 700 MB).

    Doğal olarak bahsediyoruz minimum Gereksinimler; Abbyy FineReader 12 Professional'ın tam potansiyeli yalnızca göreceli olarak ortaya çıkacak modern sistemler. Özellikle programın işlemeyi etkili bir şekilde paralelleştirebildiğini hatırlatmama izin verin. bireysel sayfalar, tüm işlemci çekirdeklerini kullanırken ve herhangi bir işlemciyi neredeyse% 100 oranında yüklerken. Ancak RAM konusunda gerçekten açgözlü değil ve hatta 32 bit kalıyor.

    Kurulum prosedürü değişmedi: minimum soru ve seçenek. Abbyy FineReader 12 Professional, yalnızca kullanıcı kaydından sonra işlevsel hale gelen Abbyy Screenshot Reader ile birlikte gelir.

    Bundan sonra teknik desteğe erişim de açılacaktır.

    Bu mütevazı bilgiye dayanarak bile evrimin sonucunun karşımızda olduğu varsayılabilir. Buna göre aşağıda, karşılaştırmalı olarak değişiklikleri açıklamaya odaklanacağım. önceki versiyonşartlı olarak iki ana gruba ayrılabilir: programla çalışma (arayüz, yardımcı araçlar, kullanım kolaylığı) ve OCR (gerçek tanımanın kalitesi ve performansı).

    Programla çalışma

    Abbyy FineReader 12 Professional, şu açılardan bazı iyileştirmeler gösteriyor: Kullanıcı arayüzü. Bu, programı başlattığınızda varsayılan olarak açılan Görevler penceresinde hemen fark edilir. Açıkçası Windows 8.x döşemeleri konseptini taklit ediyor ve özellikle program aynı zamanda kaydırma ve yakınlaştırma gibi temel hareketleri de desteklediğinden parmak kontrolü için uyarlandı. Aslında, değişiklikler yalnızca "cepheyi" etkiledi ve o zaman bile kısmen sıradan kontroller döşemelere bitişiktir ve herhangi bir senaryo oluşturma sürecinde standart iletişim kutularıyla uğraşmanız gerekecektir. Özellikle Windows tabletlerde popüler hale gelen 8-10″ ekranlarda parmaklarınızla onlarla çalışmak oldukça sorunludur.

    Kamerayla donatılmış böyle bir tabletin kullanıcısının, "hareket halindeyken" bir tür basılı belgeye hızlı bir şekilde girmek isteyebileceğini hayal etmek gerçekten kolaydır. Bu arada hepsi Windows geçmişi Tablet PC'nin ilk baskısından bu yana, standart bir masaüstü arayüzünü dokunmatik kontrole uyarlamanın anlamsızlığını doğruluyor. Görünüşe göre, bu amaçlar için Metro'nun tüm kanonlarına karşılık gelen ancak aynı "motoru" kullanan özel bir kabuk oluşturmak çok daha doğrudur. Bir örnek böyle bir karar hizmet eder İnternet Explorer Windows 8.x'ten. Buna ek olarak, Abbyy'nin Windows 8 için Abbyy FineReader Touch biçiminde bir birikimi bile var. Bulut hizmetişirketler.

    Dokunmatik girişi görmezden gelirsek hala değişiklikler var bu sınıf- diğer şeylerin yanı sıra, belgelere kolay erişim sağlayan belgelerin açma / kaydetme pencerelerinin beklenen güncellemesinden Bulut depolama(eğer sistemde uygun bir aracı ve onun klasörü varsa), daha önemli ve yararlı olanlara.

    Abbyy FineReader 12 Professional'da sayfa işleme artık arka planda yapılıyor. Bu, öncekinin yokluğu anlamına gelir kalıcı pencere operasyonların durumu (artık bu rol ekranın altındaki durum çubuğu tarafından oynanıyor) ve buna göre arayüze erişimin kullanılabilirliği ile. Böylece, kullanıcı programla tanıma sürecine paralel olarak çalışma fırsatına sahip olur (tabii ki yeterince uzunsa), örneğin alınan metnin parçalarını kopyalama veya hatta sayfa düzenini düzeltme - ikincisi sıraya alındı ​​ve tekrar işlendi.

    Farklı eski versiyon, tanındığı veya ne zaman olduğu gibi sayfa çevirme de yoktur. önyükleme Otomatik tanıma devre dışıysa belge. Abbyy FineReader 12 Professional'da belge neredeyse anında yüklenir ve sayfalara ayrılır ve küçük resimleri yalnızca sol panelde manuel olarak kaydırma yaptığınızda oluşturulur. Diğer şeylerin yanı sıra, bu, bilgi işlem kaynaklarından tasarruf sağlar ve çok sayfalı büyük belgelerde oldukça belirgindir.

    Bu dersteki değişikliklerin geri kalanı o kadar ilgi çekici değildir, ancak bazı senaryolarda kullanışlı olabilir, bu nedenle kısaca tartışılacaktır.

    Belgenin tamamını işlemeniz gerekmiyorsa, yalnızca tek tek pasajlardan alıntı yapmak istiyorsanız, tüm otomatik işlemleri kapatabilir ve herhangi bir türdeki gerekli parçaları seçerek bunları hemen panoya kopyalayabilirsiniz - analiz ve tanıma anında gerçekleştirilecektir. .

    Orijinalden daha basit bir yapıya sahip bir sonuç elde etmek için üstbilgi ve altbilgilerin, dipnotların ve diğer düzen öğelerinin yeniden oluşturulmasını kapatabilirsiniz. Bu, örneğin e-kitap hazırlarken faydalı olabilir.

    E-kitaplara devam edersek Abbyy FineReader 12 Professional, EPUB 2.0.1 ve 3.0 formatlarını desteklemektedir.

    XLSX'e dönüştürme seçenekleri genişletildi; örneğin, biçimlendirmeyi temizlemek veya resimleri kaydetmek mümkün hale geldi.

    Ortaya çıkan belgeleri bir metin katmanıyla PDF olarak kaydederken artık şunları kullanabilirsiniz: yeni teknoloji Orijinal sayfa görüntüleri üzerindeki karakterlerin yumuşatılmasından oluşan Abbyy Precise Scan. Bu arada, yalnızca renkli modda mevcuttur.

    Her zaman "akademik" desek de, çalışmalarının etkisi oldukça dikkat çekicidir. Ancak kenar yumuşatılmış karakterlerin okunabilirliği her durumda daha yüksek olmalıdır ve bu örnekte orijinal gerçekten çok Düşük kalite.


    OCR

    Şimdi tanıma mekanizmalarının kendisinde hangi iyileştirmelerin gerçekleştiğini görelim.

    Geliştiriciler, size hatırlatmama izin verin, belgenin mantıksal yapısını analiz eden ve yeniden oluşturan ADRT teknolojisini geliştirmenin bir sonraki aşamasını rapor ediyor. Özellikle tablolar, listeler, grafiklerle çok daha doğru çalışmaya başladığı belirtiliyor. Bunu yeterli örneklerle göstermek kolay olmasa da imkansız da değil. Örneğin burada, Abbyy FineReader 11 Professional (üstte) ve Abbyy FineReader 12 Professional'da (altta) aynı sayfanın tanıma sonuçları (varsayılan ayarlarla) bulunmaktadır.


    Eski sürüm, belki de orijinalin düşük kalitesinden dolayı, geri kalan öğelerin "çöp" olduğunu düşünerek yalnızca ana metin bloğunu seçip işliyordu. Yenisi ise tam tersine listeyi doğru bir şekilde tanımladı ve yeniden oluşturmaya çalıştı. Ancak sonuç ideal değil: Tüm işaretçilerin tanınmaması yine görüntü kalitesine atfedilebilir, ancak görünüşe göre program hala önünde içerik olduğunu anlamadı, aksi takdirde sayıları harf olarak yorumlayın. Bununla birlikte, ilerleme açıktır ve daha iyi orijinallerde bu tür iddialar olmayabilir.

    Ve burada, ayırıcı çizgileri olmayan "örtük" bir tablonun nasıl işlendiği anlatılmaktadır - Abbyy FineReader 11 Professional (üstte) ve Abbyy FineReader 12 Professional (altta).


    Eski versiyonun, yeni versiyondan farklı olarak burada hiç tablosal bir yapı görmediği ve kendisini birbiriyle alakasız bir dizi metin bloğuyla sınırladığı açıkça görülüyor. Resimlere tıklayıp tanıma sonuçlarını karşılaştırmaktan çekinmeyin - Abbyy FineReader 12 Professional ideale yakın bir sonuç sunuyor.

    Ne yazık ki durum her zaman böyle olmuyor ve zaten komşu sayfalarda Abbyy FineReader 12 Professional, Abbyy FineReader 11 Professional'ın sonuçlarına benzer sonuçlar gösteriyor. Her ne kadar aynı "büyük harfleri" takip etmesi ve önünde bir tür akan tablo olduğunu anlaması gereken ADRT olmasına rağmen.

    Ancak güncellenen algoritmaların dikkat ettiği hala açıkça görülüyor. büyük miktar Daha önce olduğundan daha fazla ayrıntı. Örneğin, Abbyy FineReader 12 Professional'ı test etme sürecinde, üzerinde sıralı yerleşim bulunan bir resmi tablo olarak yorumlama girişimi bile vardı. metin bilgisi. Yeni sürüm, çok daha sık olarak, ayrı grafik ve metin bloklarından değil, arka plan görüntüsüne dayalı olarak çeşitli diyagramları ve diyagramları yeniden oluşturmaya çalışır.

    Abbyy FineReader 12 Professional'da tanıma kalitesini artırmak için tasarlanmış başka birçok yenilik daha var. Bildiğiniz gibi bunun ön koşullarından biri orijinalin kalitesidir, özellikle de tarayıcı yerine kamera kullanılarak elde edilmişse. Bu nedenle FineReader'da bir zamanlar orijinalleri ön işlemeye yönelik araçlar vardı. Yeni versiyonda liste genişletildi, sayfaların kenarları boyunca kırpma, arka plan parlaklığını aydınlatma ve düzleştirme, renk öğelerini kaldırma eklendi. İkincisi, örneğin mühürlü ve damgalı belgelerin işlenmesi için yararlı olabilir. Ayrıca kullanıcı artık bağlanabilir çeşitli metodlar bireysel olarak.

    Dil desteği de geliştirildi. Birincisi, aksanlı Rus alfabesi ortaya çıktı ve ikincisi, Çince, Japonca ve Korece (% 20'ye kadar), Arapça (% 60'a kadar), İbranice (% 10'a kadar) dillerinin tanınma kalitesinde bir artış ilan edildi - Görünüşe göre bu, sınıflandırıcıların iyileştirilmesi ve ek eğitimi sayesinde başarılmıştır.

    Ve son olarak, birçok okuyucu için en yakıcı sorulardan biri: Programın hızı arttı mı? Bu soruya mantıklı bir cevap vermek o kadar kolay değil, özellikle sayılarla - her biri kendi nüanslarına sahip çok fazla dil var; orijinallerin çeşitliliği çok fazla; Algoritmaların çalışmasını etkileyen çok fazla bilinmeyen faktör vardır. Bu nedenle, geliştiricilerin kendisi bile Abbyy FineReader 12 Professional'ın performansının %10-15 artması konusunda oldukça çekingen davranıyor.

    Bu tür rakamlar genellikle yeterince geniş belge dizilerinin işlenmesi sonucunda elde edilir ve buna göre " ortalama sıcaklık Hastanede." Bu nedenle, örneğin aşağıdaki ikisi gibi bazı açıklayıcı özel durumları daha ayrıntılı olarak incelemek yararlı olacaktır:

    • Tam renkli A4 kitapçığın 10 sayfasının 300 dpi çözünürlükte renkli olarak taranması. Kalite iyi, diller Rusça ve İngilizce, düzen karmaşık;
    • PDF'den: grafik görseller Az sayıda renkli ve siyah-beyaz resim, birkaç tablo içeren 138 sayfalık bir kitap. Kalite düşük (görünüşe göre kağıt kitapta "kör" baskıyla başlıyor), diller Ukraynaca ve Rusça, düzen basit.

    Her iki belge de renkli modda tanındı ve ikincisi de hazırlık sürecini simüle etmek amacıyla siyah beyaz olarak tanındı e-kitap. Bir dizi dil ve buna bağlı olarak çalışma modları dışında tüm varsayılan ayarlar değişmeden bırakıldı. Test sitesi olarak i5-3450 işlemcili ve 8 GB belleğe sahip bir PC kullanıldı. Sonuçlar aşağıdaki tabloda sunulmaktadır:

    Gördüğünüz gibi, PDF için hızlanma vaat edilen %15'i bile aşıyor; belki de bu, tanıma algoritmalarındaki en son optimizasyonlar için çok uygun olan özel durumlardan sadece bir tanesidir. Aynı zamanda, genel olarak konuşursak, programların farklı miktarda iş yaptığı da unutulmamalıdır. Tablo işleme için yukarıdaki resimlere bir göz atın; hangi versiyonun daha zor olduğunu söylemek zor.

    Hata sayısına gelince, her iki versiyon için de pratik olarak aynıydı, ancak bazen şüphelerin farklı parçalardan ve sembollerden kaynaklandığı fark ediliyordu - görünüşe göre bu, algoritma eğitiminin kanıtı. Her durumda, belirsiz bir şekilde tanınan karakterlerin çoğunluğu, sözlükler kullanılarak kesinlikle doğru bir şekilde tanımlandı ve "büyük" hatalar (özel ve dekoratif karakterlerin yanlış yorumlanması, grafikteki metin vb.) çakıştı. Yani farkın tamamen ortadan kalktığı düşünülebilir.

    Bir diğer soru ise, böyle bir performans artışının ne kadar önemi var? Görünüşe göre hala kontrol edilmesi ve muhtemelen düzeltilmesi gereken 138 sayfada yarım dakika kazanmanın pek bir değeri yok. Test görevleri gibi çalışmaların ara sıra yapılması gerekiyorsa, performans konusunda kesinlikle endişelenmenize gerek yok. Başka bir konu da, Abbyy FineReader 12 Corporate'de bulunan büyük miktarda belgenin çevrimdışı işlenmesidir. Bu durumda zamandan %15 tasarruf etmek zaten oldukça dikkat çekicidir.

    Özet

    Yeni Abbyy FineReader 12 Professional devrim niteliğinde bir şey vaat etmese de, en azından birkaç değişiklik tüm övgüyü hak ediyor. Her şeyden önce bunlar, ADRT teknolojisindeki tabloları, diyagramları ve genel olarak sayfaların mantıksal yapısını tanıma açısından yapılan iyileştirmelerdir; bu, bazı durumlarda dramatik bir şekilde ilerlemenizi sağlar. En iyi skorlar, Ve arka plan modu Büyük belgelerle etkileşimli çalışma için yeni olanaklar sunan işleme.

    Daha az önemli olsa da başka birçok değişiklik daha var. Desteğe doğru hareket dokunmatik kontrol bugün kesinlikle haklı, ancak seçilen yol kısırdır - tek bir arayüzde fare ve parmaklarla eşit derecede rahat çalışma sağlamak pek mümkün değildir. Bununla birlikte, Windows tabletleri sadece pazara girmeye çalışırken, Abbyy'deki geliştiricilerin hala zamanı var.

    Abbyy FineReader 12 Professional fiyatları:

    • kutulu versiyon: 4990 ruble;
    • indirme sürümü: 4490 ruble;
    • güncelleme: 2690 ovmak.

    Her zamanki gibi “değiştirmeye değer mi?” sorusunun cevabı eski versiyon yenisine mi? duruma göre. Her durumda, şunu dikkate almak gerekir: yaşam döngüsü FineReader'ın oldukça uzun bir ömrü vardır ve açıklanan iyileştirmelerden herhangi biri sizin için önemli bir rol oynarsa, o zaman 2-3 yıl içinde güncelleme maliyeti kesinlikle karşılığını alacaktır - mali olarak olmasa da ahlaki olarak. Bu soruyu kendiniz çözmek nihayet yardımcı olacaktır.

      Düzenlenemeyen ve grafik formatlarından metin tanıma için tasarlanmış ABBYY FineReader programını kullanmak için. öncelikle onu indirip bilgisayarınıza kurmanız ve ardından aşağıdaki videoyu izlemeniz gerekiyor, bu program hakkında her şey detaylı olarak anlatılıyor.

      Bu program metni taramak ve çalışmak, tanınması için tasarlanmıştır.

      Elbette kullanılabilir ve bu kullanımı gerçekleştirmek için, içinde çalıştığınız Finereader programından ayrılmadan, dosyanın metnini tanıyabilir ve onu belgenin taranmış bir kopyasından klasik bir kopyaya dönüştürebilirsiniz. biçim, Kelime programları. O zaman kullanımınıza girecektir.

      Finereader, bilgileri popüler ortamlara aktarmayı sağlayan bir tarama ve OCR programıdır. ofis paketleri. Onunla çalışma prensibi kısaca şu şekilde açıklanabilir: Basılı metin içeren bir kağıt sayfa alıyoruz, tarayıcıyla tarıyoruz, belirli bir grafik dosyası alıyoruz bit eşlem biçimi. Daha sonra Finereader programından çıkmadan dosyanın metnini tanıyoruz ve bir sonraki adım, taranan kopyadan bir belge oluşturmak. Kelime formatı. Bundan önce tanınan metin görüntülenebilir ve düzenlenebilir. Ortaya çıkan word belgesine daha fazla ekleme yapılabilir ve düzenlenebilir.

      Abbyyfinereader bu tür programlar arasında şüphesiz liderdir.

      Düzenlenemeyen ve grafik formatlarındaki metinleri tanımak için çok geniş yeteneklere sahiptir.

      Program, (düzenlenemeyen pdf, dijital formatlar) gibi temel formatlardaki metinleri tanıyabilecektir. jpeg dosyaları, jpg, Djvu, gif, png vb.).

      Ayrıca ABBYY FineReader neredeyse tüm tarayıcı modelleriyle iyi çalışır.

      Programın ana işlevleri şunlardır:

      Belgeleri formatlara tarayın: Microsoft Word, Microsoft Excel, Pdf, görüntüleri, PDF'yi veya görüntüyü Microsoft Word'e tarayın ve kaydedin, fotoğrafları Microsoft Word'e dönüştürün.

      ABBYY Finereader'ın çalışma alanı:

      Yeni bir görev eklemek için program çalışma alanının sol üst kısmında bulunan **yeni görev** butonuna tıklamanız gerekir.

      Açılacak pencere Yeni görev

      Açılan pencerede gerçekleştirmek istediğiniz görevi seçin.

      Diyelim ki formata dönüştürmek istediğimiz bir belgenin fotoğrafı var Microsoft belgesi kelime. Bunu yapmak için pencerede Yeni görev aktif başlığı bul Fotoğrafı Microsoft Word'e dönüştürün ve bu etikete tıklayın. Açılacak önizlemeli program gezgini penceresi :

      Açılan pencerede bir fotoğraf seçin Metin dosyası bunun tanınması ve ihtiyacınız olan formata dönüştürülmesi gerekiyor.

      Açılacak Tanıma sürecinin ölçeğini gösteren pencere:

      Program fotoğrafı işledikten sonra metni tanımaya çalışır.

      Aşağıdakileri göreceksiniz:

      Burada fotoğrafınızın metin tanıma için alanını seçebilirsiniz.

      Alanı seçtikten sonra butonuna tıklayın. tanımak bulunan üst menü programlar. Program seçilen fotoğrafı metne dönüştürmeye başlayacaktır. Resmi işledikten sonra butonun yanındaki oka tıklayın kaydetmek ve seç istenilen format bir metin belgesi oluşturmak için:

      Güçlü ve fonksiyonel program ABBYY FineReader, basılı metin içeren çeşitli kağıt ortamların (kitaplar, dergiler, gazeteler vb.) ve dijital formattaki görüntülerin yüksek kalitede taranması ve doğru şekilde tanınması (tarama sırasında ayarlanan çözünürlüğe bağlı olarak) için tasarlanmıştır.

      Program destekliyor çeşitli diller tanıma, aşağıdakilere kaydedebilir: Microsoft Word, PDF, resim formatları ve diğer formatlar. Program sezgisel bir arayüze sahip olduğundan onunla çalışmak uygundur.

      Bu nedenle ilk adım, ilk olarak ayarları yapmak ve tarama belgesinde, metni programı takip eden bir resim elde ederiz tanımak. Tanıdıktan sonra metni düzeltebilir (yanlışlıklar varsa) ve istediğiniz formatta kaydedebilirsiniz.