نحوه استفاده از ABBYY FineReader

بنابراین، ما FineReader را روی رایانه خود نصب کرده ایم. ما اسکنر را روشن می کنیم و یک سند چند صفحه ای را دیجیتالی می کنیم. بیایید آن را مشروط، "قرارداد" بنامیم.

صفحه اول سند را روی شیشه اسکنر می گذاریم، درب آن را می بندیم. راه اندازی می کنیم برنامه FineReader. روی دکمه "اسکن" کلیک کنید یا ترکیب "Ctrl + K" را با کلیدها فشار دهید. پنجره ABBYY FineReader Scanning باز می شود. هنگام دیجیتالی کردن موارد معمول صفحه متنبا فونت 11-12 نقطه تایپ کنید، تنظیمات را در پنجره پیش فرض رها کنید و روی دکمه "مشاهده" کلیک کنید.

اسکنر کار می کند و پس از چند ثانیه صفحه خود را در پنجره مشاهده می بینیم. در اینجا می توانیم در صورت نیاز اندازه اسکن را تغییر دهیم. و سپس روی دکمه "اسکن" کلیک کنید.

FineReader فرآیند OCR را شروع می کند و در عرض یک دقیقه تصویر صفحه در پنجره برنامه باز می شود. قسمت سمت راستاکنون پنجره به سه بخش تقسیم شده است. در قسمت سمت چپ "تصویر" می توانیم تصویر را ویرایش کنیم. در درس: اسکن کتاب می توانید درباره ویرایش تصویر بیشتر بخوانید. در بخش سمت راست "متن" می توانید بلافاصله تغییراتی در متن ایجاد کنید - محتوای صفحه را حتی قبل از ذخیره آن ویرایش کنید. این بسیار راحت است، به عنوان مثال، شما باید به سرعت تاریخ، جزئیات، نام خانوادگی را در یک سند تغییر دهید.

نماد صفحه شناسایی شده در قسمت سمت چپ پنجره "صفحات" ظاهر می شود:

اگر نیازی به ویرایش چیزی ندارید، صفحه اول روی شیشه اسکنر را با صفحه دوم جایگزین کنید و تکنولوژی را تکرار کنید. پس از تنظیم ابعاد اسکن در پنجره "ABBYY FineReader Scanning" در حالت "View" برای صفحه اول، اکنون بلافاصله روی دکمه "Scan" کلیک کنید. تنظیمات تنظیم شده برای صفحه اول ذخیره می شوند و صفحات بعدی بدون پیش نمایش اسکن می شوند. بنابراین ما تمام صفحات سند خود را اسکن می کنیم.

ما کار را تمام کردیم و اکنون با کلیک متناوب روی نمادها، صفحات را باز می کنیم و ترتیب صحیح آنها را بررسی می کنیم.

پس از آن، در قسمت سمت چپ پنجره "صفحات"، تمام نمادها را با دکمه "ویرایش - انتخاب همه" یا با میانبر صفحه کلید: "Ctrl + A" انتخاب کنید. سپس در لیست کشویی در کنار دکمه "ذخیره"، دستور را انتخاب کنید: "Save as سند PDF":

اکنون روی خود دکمه دست می زنیم و سند را با نام "Agreement.pdf" در پوشه "Agreement" ذخیره می کنیم:

در نتیجه، ما یک صفحه چند صفحه ای دریافت می کنیم سند متنیفرمت pdf - نسخه الکترونیکیسند ما با نام رمز "قرارداد".

بنابراین، ما اسناد متنی را با FineReader دیجیتالی می کنیم.

با تغییر حالت اسکن به "رنگی" در پنجره "Scanning ABBYY FineReader"، می توانیم به راحتی تصاویر و عکس های رنگی را دیجیتالی کنیم.

و پرسیدن در منوی زمینهبه عنوان مثال، دستور: "ذخیره به عنوان سند مایکروسافت ورد 2007" ما پروژه خود را به یک سند Word تک صفحه ای قابل ویرایش تبدیل خواهیم کرد.

به طور کلی، برنامه به راحتی قابل هضم است، نکات بصری و پاپ آپ در همه جا وجود دارد.

سلام. امروز در مورد نحوه استفاده از Abbyy FineReader برای تشخیص متن از تصویری که می توانید در نتیجه اسکن دریافت کنید صحبت خواهم کرد. متن اسکن شده شما به طور کامل در یک سند مایکروسافت ورد خواهد بود و این متن شناخته شده قابل ویرایش خواهد بود! تشخیص متن وقتی کمک ابی Finereader می تواند برای کسانی که مطالعه می کنند، با متون و ترجمه کار می کنند مفید باشد. برنامه، متاسفانه، پولی است. من یک بار یکی از آنها را امتحان کردم گزینه های رایگانبرنامه های مشابه، اما یک متن بسیار خوب اسکن شده به طرز وحشتناکی تشخیص داده می شود ... و تشخیص متن در Abbyy FineReader با کیفیت بسیار بالایی ظاهر می شود! اکنون به شما نشان خواهم داد که چگونه از Abbyy FineReader برای تشخیص سریع متن از یک تصویر استفاده کنید.

ABBYY FineReader دارد نسخه آزمایشیبه مدت 30 روز با قابلیت تشخیص حداکثر 100 صفحه و ذخیره حداکثر 3 صفحه از سند. آن ها در طول این مدت، می توانید قابلیت های برنامه را ببینید و آگاهانه تصمیم بگیرید - آیا به آن نیاز دارید، آیا ارزش خرید دارد یا خیر.

نحوه نصب Abbyy FineReader!

قبل از استفاده از Abbyy Finereader، باید آن را نصب کنید. مراحل نصب این برنامه را در نظر بگیرید ...

ابتدا زبان برنامه را انتخاب کنید. روی "OK" کلیک کنید.

ما شرایط را می پذیریم توافقنامه مجوز(در صورت تمایل، می توانید توافق نامه مجوز را بخوانید اگر به آنچه در مورد آن علاقه مند هستید) ما "بعدی" را فشار می دهیم.

در مرحله بعد باید حالت نصب را انتخاب کنید. در حالت عادیبرنامه از شما سوال نخواهد کرد و آنچه را که به طور پیش فرض در برنامه تنظیم شده است نصب می کند، یعنی همه اجزا: خود برنامه Abbyy Finereader برای تشخیص متن، یک جزء برای برنامه ها مایکروسافت آفیسو یک مؤلفه برای Windows Explorer (به شما امکان می دهد بدون باز کردن یک برنامه جداگانه تصاویر را به سرعت تشخیص دهید). توصیه می کنم توجه داشته باشید نصب سفارشیتا آن طور که می خواهید تنظیم کنید. علاوه بر این، حتی 15 دقیقه طول نمی کشد :) در زیر پوشه ای است که برنامه در آن نصب خواهد شد. توصیه می شود انتخاب پیش فرض را ترک کنید تا بعداً هنگام استفاده از برنامه مشکلی پیش نیاید. ما "بعدی" را فشار می دهیم.

اجزای برنامه اگر نوع نصب "Custom" را انتخاب کنید، این پنجره ظاهر می شود. کامپوننت ها چیزی شبیه به برنامه های کمکی برای برنامه هستند. جزء اول "ادغام با برنامه های مایکروسافتدفتر و Windows Explorer". این کامپوننت در منوی مایکروسافت آفیس نمایش داده می شود و اگر روی تصویر در رایانه خود راست کلیک کنید، آیتمی با این برنامه وجود خواهد داشت. پس از افزودن این کامپوننت، منوی شما در مایکروسافت آفیس به این شکل خواهد بود.

و اگر روی تصویر راست کلیک کنید، این اتفاق می افتد:

آن ها یک منو ظاهر می شود که در آن می توانید OCR سریع انجام دهید و نتایج را به Word، Excel یا PDF ارسال کنید.

مؤلفه دوم به شما امکان می دهد متن را از روی صفحه رایانه تشخیص دهید. این بدان معناست که می توانید اسکرین شات بگیرید و همچنین متن را تشخیص دهید. اگر نمی‌خواهید یکی از این کامپوننت‌ها را نصب کنید، یا اصلاً نمی‌خواهید هر دو را نصب کنید، باید روی فلش رو به پایین کلیک کنید و "این کامپوننت در دسترس نخواهد بود" را انتخاب کنید. سپس کامپوننت نصب نخواهد شد. هر دو رو گذاشتم

4 امتیاز بعدی 1st به این معنی است که اطلاعات مربوط به نحوه استفاده شما از برنامه Abbyy Finereader به توسعه دهنده منتقل می شود. من به شما توصیه می کنم این مورد را علامت گذاری نکنید تا برنامه دوباره آنلاین نشود تا اطلاعات کار با آن ارسال شود. علاوه بر این، شما هرگز نمی دانید چه اطلاعات دیگری ارسال خواهد شد :) مورد دوم یک میانبر برنامه را روی دسکتاپ ایجاد می کند. مورد سوم به این معنی است که با روشن شدن رایانه برنامه شروع به کار می کند و مورد چهارم به روز رسانی برنامه را بررسی می کند. فقط دومی را می گذارم و جلوی آن تیک می گذارم. همه چیز را می بندیم برنامه های کاربردی مایکروسافت Office، زیرا نصب کننده به آن نیاز دارد و روی "نصب" کلیک کنید.

باید چند دقیقه صبر کنید تا برنامه بارگذاری شود و روی "بعدی" کلیک کنید.

همه چیز، نصب کامل است! ما روی "پایان" کلیک می کنیم.

چگونه با استفاده از Abbyy Finereader متن را از یک تصویر اسکن شده یا هر تصویر دیگری تشخیص دهیم؟

بیایید نحوه استفاده از برنامه را ببینیم. به عنوان مثال، شما متن را اسکن کرده اید. اکنون برای تشخیص متن در Abbyy FineReader، برنامه را باز کنید. روی "باز کردن" کلیک کنید.

تصویر مورد نظر خود را انتخاب کرده و روی open کلیک کنید.

کی باز میکنی سند مورد نظر، Abbyy Finereader شروع به تشخیص متن می کند. هرچه سند بزرگتر باشد، شناسایی طولانی تری طول می کشد. تشخیص یک صفحه ممکن است چند ثانیه طول بکشد.

پس از شناسایی متن، فقط باید نتیجه را در آن ذخیره کنید سند مایکروسافت Word، به طوری که می توانید هر چیزی را در آن ویرایش کنید. برای انجام این کار، روی دکمه "ذخیره" کلیک کنید پنل بالاییابزارها و سپس انتخاب کنید که سند Word در کدام پوشه و با چه نامی ذخیره شود.

اگر یک اسکنر متصل به رایانه خود دارید، می توانید مستقیماً از برنامه اسکن را شروع کنید و پس از آن سند اسکن شده بلافاصله شناسایی می شود. برای انجام این کار، روی دکمه "اسکن" در نوار ابزار بالا کلیک کنید. اقدامات بعدی به برنامه درایور چاپگر شما بستگی دارد. فقط باید دستورالعمل های جادوگر اسکن را دنبال کنید.

همانطور که می بینید، همه چیز بسیار ساده و سریع است. اکنون می دانید که چگونه از Abbyy FineReader برای تشخیص متن از تصاویر استفاده کنید! امیدوارم این اطلاعات به افراد زیادی کمک کند :) موفق باشید!

اگرچه پیشرفت های داده شده است هوش مصنوعی(AI) طی 50 سال گذشته، ماشین های "هوشمند" حتی یک ذره به توانایی های شناختی انسان نزدیکتر نشده اند، ناعادلانه است که به طور کامل پیشرفت در این جهت را انکار کنیم. بارزترین و بارزترین مثال شطرنج است (ناگفته نماند بازی های ساده). کامپیوتر هنوز نمی تواند تفکر ما را تقلید کند، اما کاملاً قادر است این شکاف را با مقدار زیادی حافظه تخصصی و سرعت شمارش جبران کند. ولادیمیر کرامنیک بازی برنامه دیپ فریتز را که در سال 2006 برنده شد، به عنوان "غیرانسانی" توصیف کرد، به این معنا که اغلب با قوانین تثبیت شده (انسانی) استراتژی و تاکتیک ها در تضاد بود.

کمی بیش از یک سال پیش، یکی دیگر از ایده های IBM، که زمانی پایه و اساس پیروزی های پیروزمندانه شطرنج رایانه ها (معروف Deep Blue)، به نام واتسون را بنا نهاد، به موفقیت جدیدی دست یافت و دو قهرمان مسابقه محبوب آمریکایی را شکست داد. خطر با اختلاف زیاد با این حال، قابل توجه است که اگرچه واتسون خود پاسخ‌ها را بیان کرد، اما سؤالات همچنان به او منتقل می‌شد. فرم متن. این نشان می‌دهد که پیشرفت در بسیاری از زمینه‌های کاربرد هوش مصنوعی - تشخیص گفتار و تصویر، ترجمه ماشینی - بسیار کم است، اگرچه این مانع از اجرای آنها در امروز ما نمی‌شود. بزرگترین موفقیت، شاید، توسط سیستم های تشخیص کاراکتر نوری (OCR، Optical Character Recognition) نشان داده شده است، که تقریباً همه کاربران رایانه شخصی احتمالاً به روشی با آن آشنا هستند. علاوه بر این، تحولات روسیه در این زمینه جایگاه ارزشمندی را در جهان اشغال می کند - منظور من ABBYY FineReader است.

کمی تاریخ

نسخه فعلی ABBYY FineReader شماره 11 است، به این معنی که برنامه پیشرفت زیادی را طی کرده است و حتی تاریخچه این فرآیند نیز مورد توجه است. بدون تظاهر به اینکه یک وقایع نگاری جامع هستم، تنها نقاط عطف اصلی در دهه گذشته را بیان می کنم، که طی آن کم و بیش FineReader را دنبال می کردم:

سال	نسخه	ویژگی های کلیدی
2003	7.0	تا 25 درصد افزایش در دقت تشخیص. بیشتر از همه، این در جداول، به ویژه در جداول پیچیده، با سلول های رنگی، جداکننده های پنهان و غیره منعکس شد.
2005	8.0	بهینه‌سازی بیشتر الگوریتم‌های تشخیص، عمدتاً با هدف کار نه با اسکن اسناد، بلکه با عکس‌های دیجیتال. برای این، ظاهر شد توابع اضافیتهیه نسخه اصلی (حذف اعوجاج، تراز خطوط و غیره).
2007	9.0	ظهور فناوری ADRT، که ساختار منطقی کل سند پردازش شده (چند صفحه) را در نظر می گیرد و قادر به انتخاب عناصر تکرار شونده (هدر و پاورقی)، اتصال اشیاء "جریان" (جدول) و غیره است.
2009	10.0	بهبود بیشتر الگوریتم های ADRT و تشخیص، افزایش دقت پردازش نسخه های اصلی با وضوح پایین تا 30٪.
2011	11.0	توجه اصلی به سرعت برنامه است. "دومین آمدن" حالت سیاه و سفیدکه بر روی نسخه اصلی موجود است کیفیت خوبشتاب اضافی تا 30٪ می دهد.

طبیعتاً در همان زمان، FineReader پشتیبانی از فرمت‌های اسناد را گسترش داد، ابزارها و رابط داخلی را بهبود بخشید، بازتولید ساختار نسخه‌های اصلی را بهبود بخشید، و غیره. فرآیند توسعه مشخصه سیستم های پیچیده علم فشرده، زمانی که پس از "دستیابی به موفقیت" بعدی، دوره خاصی از "آرامش" دنبال می شود که برای بهبود الگوریتم های جدید ضروری است. آنها ارزش اصلی هر برنامه OCR را نشان می دهند و بنابراین اطلاعات دقیقدر مورد آنها بسیار به ندرت به دست کاربران می رسد. با این حال، ABBYY با مهربانی موافقت کرد که حجاب رازداری را بردارد و امروز ما این فرصت را داریم که به پناهگاه داخلی FineReader نگاه کنیم.

اصول اساسی

بنابراین، از آنجایی که OCR به حوزه هوش مصنوعی تعلق دارد، کاملاً منطقی است که توسعه دهندگان تلاش کنند تا حداقل تا حدودی از فعالیت مغز ما تقلید کنند. البته، ساختار سیستم بینایی ما فوق العاده پیچیده است، اما اصول اساسی "بلوک بزرگ" عملکرد آن به اندازه کافی مورد مطالعه قرار گرفته است، معمولاً سه مورد از آنها وجود دارد:

تمامیت- شی به عنوان مجموعه ای از اجزای آن و (برای تصاویر بصری) روابط فضایی بین آنها در نظر گرفته می شود. به نوبه خود، قطعات فقط به عنوان بخشی از کل شی تفسیر می شوند. این اصل به ساختن و اصلاح فرضیه ها کمک می کند و به سرعت فرضیه های بعید را قطع می کند.
هدفمندی- از آنجایی که هر تفسیری از داده ها دارای یک هدف خاص است، شناخت نیز فرآیندی است برای ارائه فرضیه هایی در مورد یک شی و آزمایش هدفمند آنها. سیستمی که مطابق با این اصل عمل می کند نه تنها در هزینه ها صرفه جویی می کند قدرت پردازشبلکه کمتر احتمال دارد که اشتباه کند.
تطبیق پذیری- سیستم اطلاعات انباشته شده در طول کار را ذخیره می کند و مجدداً از آن استفاده می کند، یعنی خودش یاد می گیرد. این اصل به شما امکان می دهد دانش جدید ایجاد و انباشته کنید و اجتناب کنید تصمیم گیری مجددهمان وظایف

FineReader تنها سیستم OCR در جهان است که مطابق با اصول توصیف شده در بالا در تمام مراحل پردازش اسناد عمل می کند. فناوری مربوطه نامیده می شود IPA- با حروف اول اصطلاحات انگلیسی. به عنوان مثال، بر اساس اصل یکپارچگی، یک قطعه از یک تصویر تنها در صورتی به عنوان نماد تفسیر می شود که شامل تمام بخش های ساختاری اشیاء مشابه و آنهایی باشد که در روابط خاصی هستند. این کمک می کند تا جستجوی تعداد زیادی از الگوها (در جستجوی یک الگوی کم و بیش مناسب) با آزمایش هدفمند تعداد معقولی از فرضیه ها جایگزین شود، علاوه بر این، بر اساس اطلاعات قبلی انباشته شده در مورد سبک های کاراکتر ممکن در یک سند شناخته شده.

با این حال، اصول IPA هنگام تجزیه و تحلیل نه تنها قطعات مربوط به (احتمالاً) کاراکترهای فردی، بلکه کل تصویر صفحه اصلی نیز اعمال می شود. اکثر سیستم های OCR بر اساس شناخت ساختار سلسله مراتبی یک سند هستند، یعنی صفحه به عناصر ساختاری اساسی مانند جداول، تصاویر، بلوک های متنی تقسیم می شود که به نوبه خود به سایر اشیاء مشخصه - سلول ها، پاراگراف ها - تقسیم می شوند. و غیره، تا شخصیت های فردی.

چنین تحلیلی را می توان به دو روش اصلی انجام داد: از بالا به پایین، یعنی از عناصر تشکیل دهنده به شخصیت های فردی، یا، برعکس، از پایین به بالا. اغلب، یکی از آنها استفاده می شود، اما ABBYY یک الگوریتم ویژه ایجاد کرده است MDA(تحلیل اسناد چند سطحی، تجزیه و تحلیل اسناد چند سطحی) که هر دو را ترکیب می کند. به طور خلاصه، به نظر می رسد: ساختار صفحه با روش بالا به پایین تجزیه می شود و بازسازی سند الکترونیکیدر پایان تشخیص، از پایین به بالا پیش می رود، با این حال، در تمام سطوح، یک مکانیسم اضافی بازخورد. در نتیجه، احتمال خطاهای فاحش مرتبط با تشخیص نادرست اشیاء سطح بالا به شدت کاهش می یابد.

ADRT

از لحاظ تاریخی، سیستم‌های OCR از تشخیص تک شخصیت تکامل یافته‌اند. این کار هنوز مهم ترین و دشوارترین است، پیچیده ترین الگوریتم ها با آن همراه است. با این حال، به زودی مشخص شد که اطلاعات سطح بالاتر (به عنوان مثال، در مورد زبان سند و املای صحیح کلمات شناخته شده) می تواند در حل آن کمک کند - اینگونه بررسی های متن و فرهنگ لغت ظاهر شد. سپس تمایل به حفظ قالب بندی و بازسازی ساختار فیزیکی (یعنی موقعیت نسبی اشیاء مختلف) سند منجر به نیاز به تجزیه و تحلیل دقیق کل صفحه شد. واضح است که این نیز تأثیر بسزایی در کیفیت کلیتشخیص، زیرا به پردازش صحیح طرح بندی چند ستونی، جداول و سایر روش های ترتیب متن "غیر خطی" کمک می کند.

اکثر OCR های مدرن در این سه سطح عمل می کنند - کاراکترها، کلمات، صفحات - تمرین، همانطور که قبلا ذکر شد، از بالا به پایین یا پایین به بالا. با این حال، ABBYY، مطابق با اصول IPA، یک سطح دیگر را به FineReader معرفی کرد - در مجموع سند چند صفحه ای. اول از همه، این برای بازتولید صحیح ساختار منطقی، که در اسناد مدرن پیچیده تر می شود، ضروری بود. اما همچنین وجود دارد پاداش های اضافی: افزایش دقت و سرعت بخشیدن به پردازش اشیاء تکراری، شناسایی صحیح (و در نتیجه تشخیص) اشیاء "جریان" از صفحه به صفحه دیگر.

این همان چیزی است که برای آن طراحی شده است. ADRT(تکنولوژی تشخیص اسناد تطبیقی) - فناوری برای تجزیه و تحلیل و ترکیب یک سند در سطح منطقی. در نهایت، این کمک می کند که نتیجه کار FineReader تا حد ممکن شبیه به اصل باشد. برای انجام این کار، تصویر کل سند تجزیه و تحلیل می شود و کلمات شناسایی شده بسته به سبک، محیط و موقعیت صفحه در گروه ها (خوشه ها) ترکیب می شوند. بنابراین، برنامه، همانطور که بود، "منطق" نشانه گذاری سند را می بیند و در آینده می تواند طراحی نتیجه را متحد کند.

به لطف ADRT، FineReader از نسخه 9.0 شروع به شناسایی، شناسایی و بازتولید قطعات ساختاری و عناصر قالب بندی سند زیر کرده است:

متن اصلی؛
سرصفحه ها و پاورقی ها؛
شماره صفحات؛
سرفصل های هم سطح؛
فهرست مطالب؛
درج متن;
زیرنویس برای نقاشی؛
جداول;
پانویسها و منابع؛
مناطق امضا/چاپ؛
فونت ها و سبک ها

فرآیند شناسایی

طبق الگوریتم MDA، تشخیص واقعی از بالا به پایین، از سطح صفحه شروع می شود. واضح است که هر چه در مراحل اولیه این فرآیند تصمیمات اشتباه بیشتری گرفته شود، در مراحل بعدی نیز بیشتر خواهد بود. به همین دلیل است که دقت تشخیص تا حد زیادی به کیفیت نسخه های اصلی بستگی دارد، اما الگوریتم های پیش پردازش آنها نیز می تواند از اهمیت قابل توجهی برخوردار باشد. بنابراین، با افزایش محبوبیت اسناد رنگی در FineReader، یک رویه باینری سازی تطبیقی ظاهر شد (دودویی سازی تطبیقی، AB). اگر سندی را فوراً در حالت سیاه و سفید اسکن کنید، جایی که واترمارک وجود دارد یا متن روی یک بافت یا بستر رنگی قرار دارد، همیشه "آشغال" روی تصویر ظاهر می شود که جدا کردن آن از " بسیار دشوار خواهد بود. مفید» تصویر (زیرا اطلاعات اصلی در مورد او قبلاً از بین رفته است). به همین دلیل است که FineReader ترجیح می دهد با تصاویر رنگی یا خاکستری کار کند و آنها را به خودی خود به سیاه و سفید تبدیل کند (این فرآیند باینریزه شدن نامیده می شود). اما این همه ماجرا نیست. از آنجایی که رنگ متن و پس‌زمینه می‌تواند در یک صفحه و حتی در خطوط جداگانه متفاوت باشد، AB کلماتی را با ویژگی‌های کم و بیش یکسان برجسته می‌کند و پارامترهای دوتایی بهینه را برای هر کدام از نظر کیفیت تشخیص انتخاب می‌کند. این دقیقاً سازگاری الگوریتم است، که بنابراین نمونه ای از استفاده از بازخورد در MDA است. واضح است که اثربخشی AB به شدت به طراحی اسناد منبع بستگی دارد - در پایه آزمایشی ABBYY، این الگوریتم افزایش دقت تشخیص را 14.5٪ فراهم کرد.

اما جالب‌ترین، البته، زمانی آغاز می‌شود که فرآیند شناسایی به پایین‌ترین سطوح کاهش می‌یابد. به اصطلاح روش تقسیم خطی رشته ها را به کلمات و کلمات را به حروف جداگانه تقسیم می کند. علاوه بر این، مطابق با اصل IPA، مجموعه ای از فرضیه ها را تشکیل می دهد (یعنی گزینه هاچه نوع کاراکتری است، کلمه به چه کاراکترهایی تقسیم می شود و غیره) و با ارائه تخمین احتمالی برای هر کدام، آن را به ورودی موتور تشخیص کاراکتر منتقل می کند. دومی شامل یک سری به اصطلاح است طبقه بندی کننده هاکه هر کدام تعدادی فرضیه را نیز تولید می کنند که بر اساس درجه احتمال تخمین زده شده رتبه بندی می شوند. مهمترین ویژگیهر طبقه بندی کننده، میانگین موقعیت فرضیه صحیح است. واضح است که هر چه بالاتر باشد کار کمتربرای الگوریتم های بعدی - به عنوان مثال، بررسی فرهنگ لغت. اما برای طبقه‌بندی‌کننده‌هایی که به اندازه کافی خوب تنظیم شده‌اند، ویژگی‌هایی مانند دقت تشخیص طبق سه فرضیه اول یا فقط طبق فرضیه اول اغلب ارزیابی می‌شوند - یعنی به طور کلی، توانایی حدس زدن پاسخ صحیح از سه یا یک تلاش. ABBYY در سیستم های خود استفاده می کند انواع زیرطبقه بندی کننده ها: شطرنجی، ویژگی، دیفرانسیل ویژگی، کانتور، ساختاری و دیفرانسیل ساختاری - که در دو سطح منطقی گروه بندی می شوند.

اصول کارکرد، اصول جراحی، اصول عملکرد RK، یا طبقه بندی کننده شطرنجی، بر اساس مقایسه پیکسل به پیکسل تصویر نماد با مراجع است. دومی در نتیجه میانگین گیری تصاویر از نمونه آموزشی شکل می گیرد و به یک فرم استاندارد مشخص کاهش می یابد. بر این اساس، برای تصویر قابل تشخیص، اندازه، ضخامت عناصر و شیب نیز از قبل نرمال شده است. این طبقه‌بندی‌کننده با سهولت اجرا، سرعت عمل و مقاومت در برابر عیوب تصویر متمایز می‌شود، اما دقت نسبتاً کمی را ارائه می‌دهد و به همین دلیل است که در مرحله اول - برای تولید سریع فهرستی از فرضیه‌ها - استفاده می‌شود.

طبقه بندی ویژگی ( کامپیوترهمانطور که از نام آن پیداست، بر اساس وجود نشانه هایی از یک شخصیت خاص در تصویر است. اگر N چنین علامتی وجود داشته باشد، هر فرضیه را می توان با یک نقطه در فضای N بعدی نشان داد. بر این اساس، دقت فرضیه با فاصله از آن تا نقطه مطابق با استاندارد (که در مجموعه آموزشی نیز توسعه یافته است) برآورد می شود. واضح است که نوع و تعداد ویژگی ها تا حد زیادی کیفیت تشخیص را تعیین می کند، بنابراین معمولاً تعداد زیادی از آنها وجود دارد. این طبقه بندی کننده نیز نسبتا سریع و ساده است، اما در برابر عیوب مختلف تصویر چندان مقاوم نیست. علاوه بر این، رایانه شخصی نه با تصویر اصلی، بلکه با یک مدل خاص، انتزاعی عمل می کند، یعنی برخی از اطلاعات را در نظر نمی گیرد: به عنوان مثال، واقعیت حضور برخی عناصر مهمدر مورد موقعیت نسبی آنها چیزی نمی گوید. به همین دلیل، رایانه شخصی نه به جای، بلکه همراه با RK استفاده می شود.

طبقه بندی کنتور ( QC) نشان می دهد مورد خاص PC از این جهت متفاوت است که خطوط شخصیت مورد نظر را که از تصویر اصلی استخراج شده است، تجزیه و تحلیل می کند. به طور کلی، دقت آن کمتر از یک رایانه شخصی کامل است.

طبقه بندی دیفرانسیل ویژگی ( MPC) نیز مشابه PC است، اما صرفاً برای تشخیص اشیاء مشابه مانند "m" و "rn" استفاده می شود. بر این اساس، تنها مناطقی را تجزیه و تحلیل می‌کند که تفاوت‌ها در آن‌ها پنهان است، و نه تنها تصاویر اولیه، بلکه فرضیه‌هایی که در مراحل اولیه تشخیص شکل گرفته‌اند نیز تغذیه می‌شود. با این حال، اصل عملکرد آن تا حدودی با رایانه شخصی متفاوت است. در مرحله آموزش، دو "ابر" (گروه نقاط) از مقادیر ممکن برای هر یک از دو گزینه در فضای N بعدی تشکیل می شود، سپس یک ابر صفحه ساخته می شود که "ابرها" را از یکدیگر جدا می کند و تقریباً از آنها فاصله دارد. نتیجه تشخیص بستگی به این دارد که نقطه مربوط به تصویر اصلی در کدام نیمه فاصله قرار گیرد.

MPC به خودی خود فرضیه هایی را مطرح نمی کند، بلکه فقط فرضیه های موجود را اصلاح می کند (فهرست که به طور کلی با روش حباب مرتب شده است)، به طوری که ارزیابی مستقیم از اثربخشی آن انجام نمی شود، بلکه به طور غیرمستقیم با آن برابر می شود. ویژگی های کل سطح اول تشخیص OCR. با این حال، واضح است که این بستگی به صحت ویژگی های انتخاب شده و نماینده بودن نمونه استانداردها دارد که کار نسبتاً پر زحمتی است.

طبقه بندی دیفرانسیل سازه ( KFOR) در ابتدا برای پردازش استفاده می شد متون دست نویس. وظیفه آن تمایز بین اشیاء مشابه مانند "C" و "G" است. بنابراین، SDK بر اساس ویژگی های مشخصه هر جفت کاراکتر است، فرآیند یادگیری آن حتی پیچیده تر از MPC است، و سرعت کار کمتر از همه طبقه بندی کننده های قبلی است.

طبقه بندی سازه ( SC) افتخار ABBYY است، در ابتدا برای تشخیص متن به اصطلاح چاپ دستی، یعنی زمانی که شخصی با حروف "چاپ شده" می نویسد، ساخته شد، اما پس از آن برای چاپ استفاده شد. در مراحل پایانی شناسایی استفاده می شود و به ندرت عمل می کند، یعنی فقط زمانی که حداقل دو فرضیه با احتمال کافی به آن می رسند.

مشخصات کیفی کلیه طبقه بندی کننده ها در جدول زیر جمع آوری شده است. با این حال، آنها فقط به یک نفر اجازه می دهند اثربخشی الگوریتم ها را نسبت به یکدیگر ارزیابی کنند، زیرا آنها مطلق نیستند، بلکه بر اساس پردازش یک نمونه آزمایشی خاص به دست می آیند. ممکن است به نظر برسد که در آخرین مراحل تشخیص، مبارزه به معنای واقعی کلمه برای کسری از درصد است، اما در واقع، هر طبقه‌بندی کننده سهم قابل توجهی در بهبود دقت تشخیص دارد - به عنوان مثال، SC تعداد خطاها را به میزان قابل توجهی 20 کاهش می‌دهد. ٪.

	RK	کامپیوتر	QC	MPC*	KFOR**	SC **
دقت برای سه گزینه اول، %	99,29	99,81	99,30	99,87	99,88	-
دقت طبق گزینه اول %	97,57	99,13	95,10	99,26	99,69	99,73

* ارزیابی کل سطح اول الگوریتم ABBYY OCR
** تخمین کل الگوریتم پس از افزودن طبقه بندی کننده مربوطه

با این حال، جالب است که علیرغم دقت نسبتاً بالا، الگوریتم تشخیص خود آن را قبول نمی کند. تصمیم نهایی. طبق اصل MDA، فرضیه ها در هر سطح منطقی مطرح می شوند و تعداد آنها می تواند به صورت تصاعدی افزایش یابد. بر این اساس، آزمایش متوالی همه فرضیه‌ها بعید است مؤثر باشد، به همین دلیل است که سیستم‌های OCR ABBYY از روش ساختاردهی فرضیه‌ها، یعنی تخصیص آنها به مدل‌های خاص استفاده می‌کنند. دوجین مورد دومی وجود دارد، در اینجا فقط چند نوع وجود دارد: کلمه فرهنگ لغت، کلمه غیر دیکشنری، اعداد عربی، اعداد رومی، URL، عبارت منظم- و هر کدام می تواند شامل یک مجموعه باشد مدل های خاص(مثلا کلمه ای در یکی از زبان های شناخته شده لاتین، سیریلیک و غیره).

تمام اقدامات نهایی قبلاً با فرضیه های ساخته شده بر اساس مدل ها انجام شده است. به عنوان مثال، بررسی متنی زبان سند را تعیین می کند و بلافاصله احتمال استفاده از الفبای نادرست مدل ها را به میزان قابل توجهی کاهش می دهد و بررسی فرهنگ لغت خطاها در تشخیص نامشخص برخی از کاراکترها را جبران می کند: به عنوان مثال، کلمه "نوبت" موجود در فرهنگ لغت به انگلیسی- در مقابل «توم» (به هر حال جزو محبوب ها نیست). اگرچه اولویت فرهنگ لغت بالاتر از هر طبقه‌بندی‌کننده‌ای است، اما لزوماً آخرین راه‌حل نیست، و در حالت کلی، بررسی‌های بیشتر را متوقف نمی‌کند: اولا، همانطور که در بالا ذکر شد، یک مدل کلمه غیر دیکشنری وجود دارد، و ثانیاً، سازماندهی ویژه فرهنگ لغت به نسبت بالایی امکان حدس زدن اینکه آیا یک کلمه ناشناخته می تواند به یک زبان خاص تعلق داشته باشد، امکان پذیر است. با این وجود، بررسی فرهنگ لغت (و کامل بودن دیکشنری ها) تأثیر قابل توجهی در نتیجه تشخیص دارد و در تست های خود ABBYY تعداد خطاها را تقریباً به نصف کاهش می دهد.

نه تنها OCR

اسناد چاپی از نظر دیجیتالی و دیجیتالی کردن آنها تنها مورد توجه نیستند پردازش خودکار. اغلب شما باید با فرم ها کار کنید، به عنوان مثال اسنادی با فیلدهای از پیش تعریف شده و ثابت، که به صورت دستی، اما نسبتاً دقیق پر می شوند (به اصطلاح کاراکترهای چاپ دستی) - پرسشنامه های مختلف می توانند به عنوان مثال باشند. فناوری پردازش آنها نام جداگانه ای دارد - ICR(تشخیص شخصیت هوشمند) - و کاملاً متفاوت از OCR است. بله، زیرا در این مورداز آنجایی که وظیفه بازآفرینی کل سند نیست، بلکه استخراج داده های خاص از آن است، پس در دو کار فرعی اصلی قرار می گیرد: یافتن زمینه های لازم و در واقع شناخت محتوای آنها.

این یک منطقه نسبتاً خاص است و ABBYY یک محصول نرم افزاری کاملاً جداگانه ABBYY FlexiCapture را برای آن ارائه می دهد. این برای ایجاد سیستم های خودکار و نیمه خودکار طراحی شده است، شامل تنظیم برای انواع خاصی از اسناد است که الگوهای خاصی برای آنها ایجاد می شود، می تواند به طور هوشمند فیلدهای مختلف را در صفحات پیدا کند و داده ها را در آنها تأیید کند، و غیره. با این حال، بر اساس تشخیص کاراکتر است. الگوریتم‌هایی شبیه به الگوریتم‌هایی که در FineReader استفاده می‌شوند و طرح کلیبسیار شبیه:

با این حال، تفاوت مهمبا این وجود، وجود دارد: یک طبقه بندی ساختاری یک شرکت کننده اجباری در فرآیند است - این به دلیل ویژگی های شخصیت های دست نویس است. علاوه بر این، ICR شامل تعداد زیادی از خاص است چک های اضافی: برای مثال، اینکه آیا کاراکتر خط خطی نیست، یا اینکه آیا شخصیت های شناسایی شده در واقع تاریخ را تشکیل می دهند.

ترجمه متن در فرمت دیجیتالبرای کسانی که با اسناد کار می کنند یک کار نسبتاً رایج است. Abbyy Finereader با ترجمه خودکار کپشن ها از بیت مپ یا "خوانندگان" به متن قابل ویرایش، در زمان شما صرفه جویی می کند.

در این مقاله به نحوه استفاده از Abbyy Finereader برای OCR می پردازیم.

نحوه تشخیص متن از یک تصویر با استفاده از Abbyy Finereader

به منظور تشخیص متن در بیت مپ، به سادگی آن را در برنامه بارگذاری کنید، و Abbyy Finereader به طور خودکار متن را تشخیص می دهد. شما فقط باید آن را با برجسته کردن مورد نیاز خود ویرایش کنید و آن را در قالب مورد نیاز ذخیره کنید یا آن را در یک ویرایشگر متن کپی کنید.

می توانید متن را مستقیماً از اسکنر متصل تشخیص دهید.

در وب سایت ما بیشتر بخوانید.

نحوه ایجاد یک سند PDF و FB2 با Abbyy Finereader

برنامه Abbyy Finereader به شما امکان می دهد تصاویر را به یک یونیورسال تبدیل کنید فرمت PDFو فرمت FB2 برای خواندن کتاب های الکترونیکیو تبلت ها

روند ایجاد چنین اسنادی مشابه است.

1. در منوی اصلی برنامه قسمت E-Book را انتخاب کرده و FB2 را فشار دهید. نوع سند منبع را انتخاب کنید - اسکن، سند یا عکس.

2. سند مورد نیاز را پیدا کرده و باز کنید. صفحه به صفحه در برنامه بارگذاری می شود (ممکن است مدتی طول بکشد).

3. هنگامی که فرآیند شناسایی به پایان رسید، برنامه از شما می خواهد که فرمتی را برای ذخیره انتخاب کنید. FB2 را انتخاب کنید. در صورت لزوم، به "گزینه ها" بروید و وارد شوید اطلاعات تکمیلی(نویسنده، عنوان، کلید واژه ها، شرح).

پس از ذخیره، می توانید در حالت ویرایش متن بمانید و آن را به آن ترجمه کنید فرمت وردیا پی دی اف

ویژگی های ویرایش متن در Abbyy Finereader

چندین گزینه برای متنی وجود دارد که توسط Abbyy Finereader شناسایی شده است.

در سند اصلی، تصاویر و سرصفحه ها و پاورقی ها را ذخیره کنید تا به سند جدید منتقل شوند.

سند را تجزیه و تحلیل کنید تا بدانید چه خطاها و مشکلاتی ممکن است در طول فرآیند تبدیل ایجاد شود.

تصویر صفحه را ویرایش کنید گزینه‌هایی برای برش، تصحیح عکس و تغییر وضوح در دسترس هستند.

بنابراین ما به شما گفتیم که چگونه از Abbyy Finereader استفاده کنید. دارای طیف نسبتاً وسیعی از ویرایش و تبدیل متون است. اجازه دهید این برنامه به شما کمک کند تا هر سندی را که نیاز دارید ایجاد کنید.

یکی از محبوب ترین توابع برای کار با اسکن و پردازش فایل انواع مختلف- خواننده خوب عملکردی محصول نرم افزاریتوسط شرکت روسی ABBYY توسعه یافته است، نه تنها به شناسایی، بلکه پردازش اسناد (ترجمه، تغییر قالب و غیره) اجازه می دهد. بسیاری از کاربران فقط می توانند نصب کنند، اما نمی توانند بلافاصله نحوه استفاده از ABBYY FineReader را بفهمند. در این مقاله می توانید پاسخ بسیاری از سوالات را بیابید.

این برنامه به شما امکان می دهد متن را اسکن و تشخیص دهید - و نه تنها

برای درک دقیق نوع برنامه ABBYY FineReader 12، لازم است تمام ویژگی های آن را با جزئیات در نظر بگیرید. اولین و ساده ترین عملکرد اسکن یک سند است. دو گزینه اسکن وجود دارد: با تشخیص و بدون آن. در صورت اسکن معمولی یک برگه چاپ شده، تصویری را که اسکن کرده اید در پوشه مشخص شده در دستگاه رایانه خود دریافت خواهید کرد.

توجه. ورق باید دقیقاً روی قسمت اسکن چاپگر، در امتداد خطوط نشان داده شده روی چاپگر قرار گیرد. منبع را دستکاری نکنید، این می تواند منجر شود کیفیت پاییناسکن نهایی

شما باید خودتان تصمیم بگیرید که FineReader برای شما چیست، از آنجایی که این ابزار دارای عملکرد قابل توجهی است، به عنوان مثال، شما می توانید انتخاب کنید که چه رنگی می خواهید یک تصویر دریافت کنید، امکان تبدیل همه عکس ها به سیاه و سفید وجود دارد. در سیاه و سفید تشخیص رنگ سریعتر است، کیفیت پردازش افزایش می یابد.

اگر به عملکرد تشخیص متن ABBYY FineReader علاقه دارید، باید قبل از اسکن یک دکمه خاص را فشار دهید. در این حالت چندین گزینه برای به دست آوردن اطلاعات وجود دارد. به طور پیش فرض، یک قطعه شناسایی شده از برگه روی صفحه نمایش شما نمایش داده می شود که می توانید آن را به صورت دستی کپی یا ویرایش کنید.

اگر توابع دیگری را انتخاب کنید، می توانید بلافاصله فایل را به عنوان یک سند Word یا صفحه گسترده Excel دریافت کنید. انتخاب توابع بسیار ساده است، منو بصری است، پیکربندی آسان به دلیل این واقعیت است که تمام دکمه های مورد نیاز شما جلوی چشمان شما هستند.

مهم. قبل از تشخیص متن ABBYY FineReader، باید زبان پردازش را به دقت انتخاب کنید. با وجود این واقعیت که ابزار کاملاً خودکار کار می کند، این اتفاق می افتد کیفیت پایینکد منبع به شما اجازه نمی دهد بفهمید که چه نوع زبانی در کد منبع وجود دارد. این امر کیفیت نتایج نهایی برنامه را تا حد زیادی کاهش می دهد.

حالت های عملیاتی متعدد

برای درک کامل نحوه استفاده از ABBYY FineReader 12، باید دو حالت عملکرد را امتحان کنید: "از طریق" و "تشخیص سریع". حالت دوم برای تصاویر با کیفیت بالا مناسب است در حالی که حالت اول برای فایل های با کیفیت پایین مناسب است. پردازش فایل ها در حالت کامل 3 تا 5 برابر بیشتر طول می کشد.

تصویر نتیجه برنامه را نشان می دهد - تشخیص متن از یک تصویر

چه ویژگی های دیگری وجود دارد؟

تشخیص متن در ABBYY FineReader تنها مورد نیست ویژگی مفید. برای راحتی بیشتر کاربر، وجود دارد