برنامه برای شماره گیری صوتی. تایپ صوتی آنلاین در رایانه

اگر خیلی آهسته روی صفحه کلید تایپ کنید و یاد بگیرید روش ده انگشتیبرای تنظیم خیلی تنبل است، می توانید استفاده کنید برنامه های مدرنو خدمات ورودی صوتی

صفحه کلید غیرقابل انکار کافی است ابزار مفیدکنترل کامپیوتر با این حال، وقتی نوبت به تایپ متن طولانی می‌شود، ما تمام نقص آن (و صادقانه بگویم، مال ما :)) را درک می‌کنیم... هنوز باید بتوانید سریع روی آن تایپ کنید!

چند سال پیش، که می‌خواستم کارم را برای نوشتن مقاله آسان‌تر کنم، تصمیم گرفتم برنامه‌ای پیدا کنم که به من امکان تبدیل صدا به متن را بدهد. فکر می‌کردم چقدر خوب می‌شود اگر همه چیزهایی را که نیاز داشتم با میکروفون صحبت کنم و کامپیوتر به جای من تایپ کند :)

وقتی متوجه شدم که در آن زمان هیچ راه حل واقعاً مؤثر (و حتی بیشتر رایگان) برای این پرونده وجود نداشت، ناامید شدم. درست است ، تحولات داخلی مانند "گورینیچ" و "دیکتوگراف" وجود داشت. آنها زبان روسی را می فهمیدند، اما، متأسفانه، کیفیت تشخیص گفتار نسبتاً پایین بود، آنها نیاز به تنظیم طولانی با ایجاد یک فرهنگ لغت برای صدای خود داشتند، و آنها بسیار گران بودند ...

سپس اندروید متولد شد و وضعیت کمی از زمین خارج شد. در این سیستم، ورودی صوتی به عنوان یک جایگزین داخلی (و کاملا راحت) برای ورودی مجازی ظاهر شد. کیبورد روی صفحه. و اخیرا در یکی از کامنت ها از من پرسیده شد که آیا امکان ورودی صوتی برای ویندوز وجود دارد؟ من پاسخ دادم که هنوز نه، اما تصمیم گرفتم نگاه کنم و معلوم شد که، شاید کاملاً کامل نباشد، اما چنین امکانی وجود دارد! نتایج تحقیق من مقاله امروز خواهد بود.

مشکل تشخیص گفتار

قبل از شروع تجزیه و تحلیل راه حل های موجود در حال حاضر برای ورودی صوتی در ویندوز، من می خواهم کمی در مورد ماهیت مشکل تشخیص گفتار توسط رایانه روشن کنم. برای درک دقیق تر فرآیند، پیشنهاد می کنم به نمودار زیر نگاهی بیندازید:

همانطور که می بینید، تبدیل گفتار به متن در چند مرحله انجام می شود:

دیجیتالی شدن صدا. در این مرحله کیفیت به وضوح دیکشنری، کیفیت میکروفون و کارت صدا.
مقایسه یک مدخل با مدخل های یک فرهنگ لغت. در اینجا اصل "هرچه بیشتر - بهتر" کار می کند: هرچه لغت نامه حاوی کلمات ضبط شده بیشتری باشد، شانس بیشتری برای تشخیص صحیح کلمات شما وجود دارد.
خروجی متن. سیستم به طور خودکار، با هدایت مکث ها، سعی می کند واژگان فردی را از جریان گفتار که مطابق با واژگان الگو از فرهنگ لغت است استخراج کند و سپس مطابقت های یافت شده را در قالب متن نمایش می دهد.

مشکل اصلی، همانطور که ممکن است حدس بزنید، در دو نکته اصلی نهفته است: کیفیت بخش دیجیتالی گفتار و حجم فرهنگ لغت با الگوها. اولین مشکل را می توان حتی با یک میکروفون ارزان قیمت و یک کارت صدای استاندارد به حداقل رساند. فقط کافی است آهسته و واضح صحبت کنید.

با مشکل دوم، افسوس که همه چیز به این سادگی نیست... یک کامپیوتر، بر خلاف یک شخص، نمی تواند همان عبارتی را که مثلا یک زن و یک مرد گفته اند، به درستی تشخیص دهد. برای این کار، پایگاه داده آن باید شامل هر دو نسخه صداگذاری در صداهای مختلف باشد!

اینجاست که ترفند اصلی نهفته است. ایجاد فرهنگ لغت برای یک نفر، در اصل، چندان دشوار نیست، با این حال، با توجه به اینکه هر کلمه باید در چندین نسخه نوشته شود، معلوم می شود که بسیار طولانی و کار فشرده است. بنابراین، اکثر برنامه‌های تشخیص گفتار امروزی یا خیلی گران هستند یا دیکشنری مخصوص به خود را ندارند و به کاربر این فرصت را می‌دهند که خودشان آن‌ها را ایجاد کنند.

بیهوده نبود که کمی بالاتر به اندروید اشاره کردم. واقعیت این است که گوگل که آن را توسعه می دهد، تنها فرهنگ لغت آنلاین جهانی در دسترس عموم را برای تشخیص گفتار امروزی (و چند زبانه!) به نام ایجاد کرده است. Google Voice API. یک فرهنگ لغت مشابه برای زبان روسی نیز توسط Yandex ایجاد شده است، اما تا کنون، متأسفانه، هنوز برای استفاده در آن نامناسب است. شرایط واقعی. بنابراین، تقریباً همه راه حل های رایگان، که در زیر بررسی خواهیم کرد، به طور خاص با دیکشنری های گوگل کار می کند. بر این اساس، همه آنها دارای کیفیت یکسانی در تشخیص هستند و تفاوت های ظریف فقط در ویژگی های اضافی نهفته است ...

برنامه های ورودی صدا

برنامه های کامل زیادی برای ورودی صوتی در ویندوز وجود ندارد. بله، و آنهایی که وجود دارند و زبان روسی را می فهمند بیشتر پرداخت می شوند... به عنوان مثال، هزینه یک محبوب سیستم سفارشیتبدیل صدا به متن RealSpeaker از 2587 روبل شروع می شود و مجموعه حرفه ای Caesar-R از 35900 روبل شروع می شود!

اما در میان این همه نرم افزار گران قیمت، یک برنامه وجود دارد که یک پنی هزینه ندارد، اما در عین حال عملکردی را ارائه می دهد که برای اکثر کاربران بیش از حد کافی است. به آن MSpeech می گویند:

پنجره اصلی برنامه دارای ساده ترین رابط ممکن است - یک نشانگر سطح صدا و فقط سه دکمه: شروع ضبط، توقف ضبط و باز کردن پنجره تنظیمات. MSpeech نیز به سادگی کار می کند. باید دکمه ضبط را فشار دهید، مکان نما را در پنجره ای که متن باید در آن نمایش داده شود قرار دهید و شروع به دیکته کنید. برای راحتی بیشتر، بهتر است آن را با استفاده از کلیدهای داغ ضبط و متوقف کنید، که می تواند در تنظیمات تنظیم شود:

علاوه بر کلیدهای میانبر، ممکن است لازم باشد نوع متن ارسالی به ویندوز را تغییر دهید برنامه های مورد نظر. به طور پیش فرض، خروجی به پنجره فعال تنظیم شده است، با این حال، می توانید انتقال به فیلدهای غیرفعال یا به فیلدها را مشخص کنید. برنامه خاص. از ویژگی های اضافی، شایان ذکر است که گروه تنظیمات "Commands" که به شما امکان پیاده سازی را می دهد کنترل صداکامپیوتر با استفاده از عباراتی که شما مشخص کرده اید.

به طور کلی، MSpeech کاملا است برنامه مفید، که به شما امکان می دهد متن را به صورت صوتی در هر کدام تایپ کنید پنجره ویندوز. تنها نکته ظریف در استفاده از آن این است که رایانه باید به اینترنت متصل باشد تا به دیکشنری های Google دسترسی داشته باشد.

ورودی صوتی آنلاین

اگر نمی خواهید هیچ برنامه ای روی رایانه خود نصب کنید، اما می خواهید سعی کنید متن را به صورت صوتی وارد کنید، می توانید از یکی از بسیاری از سرویس های آنلاینی که بر اساس همان فرهنگ لغت گوگل کار می کنند استفاده کنید.

و البته، اولین چیزی که باید به آن اشاره کرد، سرویس «بومی» گوگل به نام Web Speech API است:

این سرویس به شما امکان می دهد بخش های نامحدود گفتار را به بیش از 50 زبان به متن ترجمه کنید! فقط باید زبانی را که صحبت می کنید انتخاب کنید، روی نماد میکروفون در سمت راست کلیک کنید گوشه بالاییفرم ها، در صورت لزوم، مجوز دسترسی سایت به میکروفون و شروع صحبت را تأیید کنید.

اگر از اصطلاحات بسیار تخصصی استفاده نکنید و واضح صحبت کنید، می توانید نتیجه بسیار خوبی بگیرید. علاوه بر کلمات، این سرویس علائم نگارشی را نیز "درک" می کند: اگر "نقطه" یا "کاما" بگویید، کاراکتر مورد نیاز در فرم خروجی ظاهر می شود.

در پایان ضبط، متن شناسایی شده به طور خودکار برجسته می شود و می توانید آن را در کلیپ بورد کپی کنید یا از طریق پست ارسال کنید.

از کاستی ها، شایان ذکر است که این سرویس فقط در مرورگر گوگل کروم قدیمی تر از نسخه 25 و همچنین عدم تشخیص چند زبانه می تواند کار کند.

به هر حال، در وب سایت ما در بالا یک نسخه کاملاً روسی شده از همان شکل تشخیص گفتار را خواهید یافت. از سلامتی خود لذت ببرید ;)

بر اساس سرویس Google، تعداد کمی از منابع تشخیص گفتار آنلاین مشابه وجود دارد. یکی از سایت های مورد علاقه ما Dictation.io است:

برخلاف Web Speech API، Dictation.io طراحی شیک تری شبیه دفترچه یادداشت دارد. مزیت اصلی آن نسبت به سرویس Google این است که به شما امکان می دهد ضبط را متوقف کنید و سپس دوباره آن را شروع کنید و در عین حال متن وارد شده قبلی ذخیره می شود تا زمانی که خودتان دکمه "Clear" را فشار دهید.

پسندیدن سرویس گوگل Dictation.io می تواند نقطه، کاما و همچنین قرار دهد علامت تعجبو علامت سوال، اما همیشه یک جمله جدید با حرف بزرگ شروع نمی شود.

اگر به دنبال سرویسی با حداکثر کارایی هستید، احتمالا یکی از بهترین ها در این زمینه خواهد بود:

مزایای اصلی سرویس:

وجود رابط روسی زبان؛
امکان مشاهده و انتخاب گزینه های تشخیص؛
وجود پیام های صوتی؛
توقف خودکار ضبط پس از یک مکث طولانی؛
ساخته شده است ویرایشگر متنبا عملکردهای کپی متن در کلیپ بورد، چاپ آن بر روی چاپگر، ارسال آن از طریق پست یا توییتر و ترجمه به زبان های دیگر.

تنها اشکال سرویس (به غیر از کلی که قبلاً توضیح داده شده است معایب وب Speech API) الگوریتم معمولی برای چنین خدماتی نیست. پس از فشار دادن دکمه ضبط و دیکته متن، باید آن را علامت بزنید، گزینه ای را انتخاب کنید که به بهترین شکل با آنچه می خواهید بگویید مطابقت دارد و سپس آن را به ویرایشگر متن زیر منتقل کنید. پس از آن، روش می تواند تکرار شود.

پلاگین های کروم

علاوه بر برنامه های کامل و خدمات آنلاین، راه دیگری برای تشخیص گفتار به متن وجود دارد. این روش از طریق افزونه های مرورگر پیاده سازی می شود. گوگل کروم.

مزیت اصلی استفاده از افزونه ها این است که با کمک آنها می توانید متن را نه تنها به صورت صوتی وارد کنید فرم خاصدر وب سایت خدمات، بلکه در هر زمینه ورودی در هر منبع وب! در واقع، پلاگین ها یک جایگاه متوسط بین سرویس ها و برنامه های کامل برای ورودی صوتی را اشغال می کنند.

یکی از بهترین افزونه هابرای ترجمه گفتار به متن SpeechPad است:

اگر بگویم SpeechPad یکی از بهترین خدمات ترجمه گفتار به متن به زبان روسی است، دروغ نخواهم گفت. در وب سایت رسمی، یک دفترچه یادداشت آنلاین نسبتا قدرتمند (البته کمی قدیمی) با بسیاری از ویژگی های پیشرفته، از جمله:

حمایت کردن دستورات صوتیمدیریت کامپیوتر؛
پشتیبانی از علائم نگارشی بهبود یافته؛
عملکرد بی صدا در رایانه شخصی؛
ادغام با ویندوز (البته به صورت پولی)؛
توانایی تشخیص متن از ضبط ویدیو یا صدا (عملکرد "رونویسی")؛
ترجمه متن شناخته شده به هر زبانی؛
ذخیره متن در فایل متنیبرای دانلود موجود است.

در مورد پلاگین، ساده ترین عملکرد سرویس را در اختیار ما قرار می دهد. مکان نما را در قسمت ورودی مورد نیاز خود قرار دهید، تماس بگیرید منوی زمینهو روی "SpeechPad" کلیک کنید. اکنون دسترسی به میکروفون را تأیید کنید و وقتی قسمت ورودی صورتی شد، دیکته کنید متن مورد نظر.

پس از توقف صحبت کردن (مکث بیش از 2 ثانیه)، افزونه ضبط را متوقف می کند و هر آنچه را که گفته اید در فیلد نمایش می دهد. در صورت تمایل می توانید به تنظیمات افزونه بروید (روی آیکون افزونه در بالا کلیک راست کنید) و تنظیمات پیش فرض را تغییر دهید:

به اندازه کافی عجیب، اما در کل فروشگاه آنلاین Google Extensions، دیگر با یک افزونه ارزشمند برخورد نکردم که اجازه ورود صدا را در هر زمینه متنی بدهد. تنها پسوند مشابه انگلیسی بود. این یک نماد میکروفون را به تمام فیلدهای ورودی در یک صفحه وب اضافه می کند، اما همیشه آن را به درستی قرار نمی دهد، بنابراین ممکن است خارج از صفحه نمایش داده شود...

فن آوری های مدرن برای ورودی و خروجی صوتی اطلاعات، فرصت های زیادی را برای تسهیل کار و صرفه جویی در وقت در اختیار کاربران قرار می دهد. هیچ کس از برنامه تبدیل متن به صدا یا برنامه ای که هر چیزی را که شما می گویید به جای شما تایپ می کند شگفت زده نمی شود. هنوز جا برای توسعه در این مسیر وجود دارد، اما حتی امروزه می توانید خدمات و نرم افزارهای کاملاً شایسته ای را برای ارتباط گفتاری با رایانه پیدا کنید. سیستم‌های تشخیص گفتار صدایی را که از میکروفون می‌آید دیجیتالی می‌کنند و با مراجعه به فرهنگ لغت‌های موجود اطلاعات را شناسایی می‌کنند (نرم‌افزار می‌تواند از زبان‌های مختلف پشتیبانی کند و دایره لغات زیادی داشته باشد)، پس از آن متن‌های چاپ شده را نمایش می‌دهند یا دستورات مختلفی را تنظیم می‌کنند.

این فناوری به طور فعال در تلفن های هوشمند، تبلت ها و سایر دستگاه ها استفاده می شود، جایی که به طور پیش فرض ممکن است برنامه هایی وجود داشته باشد که زبان کاربر را "درک" کند، که مدیریت آن بسیار راحت است. کاربران پیشرفته برای مدت طولانی به جای مجموعه ای از دستورات، پرس و جوها جدید نیستند خط جستجومرورگر با صفحه کلید برای استفاده از گفتار. اما پیشرفت متوقف نمی شود و تبدیل صدا به متن در حجم های قابل توجه تر نیز عادی می شود. کاربرد برنامه های ویژه، برنامه های افزودنی مرورگر و خدمات آنلاین برای ورودی گفتار به شما امکان می دهد تا حدی دستان خود را آزاد کنید و به بینایی خود فشار نیاورید و همچنین وظایف را سریعتر انجام دهید. این برای نمایندگان بسیاری از حرفه ها، از جمله وکلا، پزشکان، نویسندگان، کپی رایترها و سایر متخصصانی که با تایپ کردن کار می کنند بسیار ارزشمند است.

علیرغم این واقعیت که معمولاً افرادی که زیاد می نویسند این کار را خیلی سریع انجام می دهند و سرعت تایپ کاملاً در حد مطلوب است، اغلب استفاده از برنامه نکته ای دارد. اگر به دلایلی تایپ دستی ناخوشایند باشد، دستان شما مشغول چیزهای دیگری هستند یا ممکن است خسته شوند، تایپ صوتی به شما کمک می کند. کار طولانی. همچنین، در مورد افراد با معلول- برای آنها، چنین نوآوری هایی فقط نجات است. از طرف دیگر، همه "روش تایپ کور" را نمی دانند، با سرعت مناسب تایپ نمی کنند یا به سادگی تنبل هستند. بسیاری از نویسندگان، روزنامه‌نگاران و دیگران برای دهه‌ها از ضبط صدا استفاده کرده‌اند تا سریع‌تر این کلمه را به گوش مردم برسانند و افکارشان را از بین نبرند. برای همین منظور امروزه از برنامه هایی برای تایپ صوتی استفاده می شود.

البته تبدیل اطلاعات دیکته شده به نسخه چاپی هنوز در بهترین حالت خود قرار نگرفته است. سطح بالا. پس از اینکه برنامه صدا را به متن ترجمه کرد، قطعاً باید اصلاح شود، زیرا ممکن است برخی از کلمات در فرهنگ لغت نرم افزار گم شده باشند و همچنین به دلیل عبارات رمزگشایی نادرست توسط دستگاه، که ممکن است به دلیل عملکرد میکروفون باشد. یا تلفظ فازی فن‌آوری‌ها هنوز آنقدر کامل نیستند، زیرا توسعه مستلزم سرمایه‌گذاری قابل توجهی است، اما قطعاً تغییراتی وجود دارد. دورترین پیشرفت در این زمینه گوگلکه تعداد زیادی را تولید می کند محصولات نرم افزاریاز جمله برنامه های کاربردی برای ضبط و تبدیل صدا به متن.

کاربر می تواند حداکثر را انتخاب کند گزینه مناسب، از نرم افزار با دانلود آن در رایانه شخصی یا استفاده از منابع وب استفاده کنید. برنامه هایی برای ترجمه گفتار و صداهای ضبط شده به متن ممکن است به صورت رایگان برای دانلود یا توزیع تجاری در دسترس باشند.

یک برنامه تایپ صوتی با استفاده از Google Voice API، گفتار را به بیش از 50 زبان تشخیص می‌دهد، یک رابط انتخابی (روسی، انگلیسی) در دسترس است و طیف گسترده‌ای از گزینه‌ها، از جمله انتقال متن شناسایی شده به ویرایشگرها، امکان افزودن متن خود را دارد. برای فعال کردن/توقف فرآیند ضبط برای شناسایی، دستورات و اختصاص کلیدهای داغ. برنامه MSpeech کاملا رایگان است، با وجود این، عملکرد و کیفیت کار آن در سطح مناسبی است. متأسفانه، برنامه بدون اتصال به اینترنت قادر به کار نخواهد بود.

Voco

برنامه تایپ صوتی دارای دایره لغات نسبتاً بزرگی از 85000 کلمه است. نسخه های توسعه یافته این برنامه شامل فرهنگ لغت های موضوعی اضافی است که به لطف آنها استفاده از اصطلاحات در دسترس است. نرم افزارهای Voco Professional و Voco Enterprise علاوه بر دیکته از طریق میکروفون دستگاه، صداهای ضبط شده را نیز تشخیص می دهند. علامت گذاری به دستور انجام می شود و در مورد ترجمه رکوردهای فرمت صوتی به متن، علائم نگارشی در حالت خودکار. این برنامه به صورت پولی توزیع می شود، در دسترس است نسخه های ویندوز 7 و بالاتر. مزیت بزرگ نرم افزار امکان استفاده از آن در صورت عدم اتصال به اینترنت است که اگر زیاد بنویسید اما اغلب خارج از محدوده تحت پوشش شبکه هستید بسیار راحت است.

پسوند برای مایکروسافت آفیسدر سال 2017 منتشر شد و شما می توانید با نصب این ابزار علاوه بر بسته، از آن استفاده کنید. در به روز شده است نسخه های Word، PowerPoint و Outlook، سرویس Dictate به طور پیش فرض فعال نیست. افزونه رایگانبه شما امکان می دهد متن را به صورت صوتی به بیش از 20 زبان دنیا تایپ کنید و عملکرد ترجمه به 60 زبان را دارد. می توانید ابزار را در وب سایت رسمی مایکروسافت بارگیری کنید، در حالی که عمق بیت سیستم مناسب را انتخاب کنید. پس از نصب ساده فایل دیکته دانلود شده با استفاده از جادوگر نصب، تب Dictation در Word ظاهر می شود که امکان دیکته متن و در صورت لزوم ترجمه به زبان دیگر وجود دارد. برای کسانی که با این ویرایشگر کار می کنند، این یک گزینه عالی برای سرعت بخشیدن به سرعت بهره وری است، به جای اینکه ساعت ها کلیدها را بکوبند.

SpeechPad رایگان گوگل یک ابزار عالی برای تبدیل گفتار به متن است. برای استفاده از این سرویس، باید مرورگر Google Chrome را نصب کنید که برای همه راحت نیست، اما عملکرد آن قطعاً قابل توجه است. Notepad می تواند توسط دارندگان سیستم عامل های ویندوز، لینوکس و مک استفاده شود، اتصال به اینترنت مورد نیاز است. این سرویس آنلاین دارای گزینه هایی برای تبدیل صدا و تصویر به متن، ترجمه به زبان های دیگر، و برای راحتی، می توانید کلیدهای میانبر اختصاص دهید. علاوه بر این، هنگام نصب برنامه های افزودنی برای SpeechPad، شما باید ویژگی های اضافیورود مستقیم متن ماژول ادغام برای سیستم عاملبه شما امکان می دهد از ورودی گفتار در هر یک از برنامه های نصب شده در سیستم استفاده کنید.

محصول دیگری برای تایپ با صدا از گوگل، به ترتیب، به قیاس با دفترچه یادداشت SpeechPad، در مرورگر کروم اجرا می شود. Voisnot را می توان به عنوان یک برنامه افزودنی یا برنامه بر روی رایانه شما نصب کرد. هر گزینه ای را که انتخاب کنید، تسلط بر ابزار آسان است. می توانید مراحل ضبط را با کلیک بر روی نماد میکروفون شروع کنید، سپس فقط پیامی را با صدای خود تایپ کنید. برای جلوگیری تعداد زیادیخطاها باید واضح و واضح بیان شوند و مکث های کوتاهی انجام دهند.

این ابزار گفتار به نوشتار همچنین از دیکته به خوبی چاپ می‌کند، نتایج را از نظر نشانه‌گذاری و خطاهای گرامری بررسی می‌کند و عملکرد ترجمه دارد. اطلاعات متنیبر زبانهای مختلف. علاوه بر این، مزیت استفاده از برنامه، گزینه بسیار مورد نیاز است که امکان انتخاب گزینه هایی را برای کلماتی که TalkTyper به طور دقیق تشخیص نمی دهد، ارائه می دهد، آنها برجسته می شوند.

نحوه بهبود کیفیت ورودی متن گفتاری در رایانه

هر سرویس یا برنامه ای برای پردازش گفتار، تبدیل آن به نمای متناگر همه شرایط برای این کار فراهم باشد، بهتر کار خواهد کرد، زیرا کیفیت نوشتن به طور مستقیم به یک میکروفون به درستی پیکربندی شده، دیکشنری کاربر و عدم وجود نویز اضافی بستگی دارد. شما نباید امیدوار باشید که در صورت وجود نقص در گفتار آشکار، تشخیص دهنده صدا به درستی کار کند. برای کاهش تعداد خطاها و اختصاص زمان کمتر به تصحیح متن، باید شرایط زیر رعایت شود:

برای تبدیل صحیح گفتار، تلفظ واضح و عدم وجود صداهای بیگانه. اگر کلمات را تا حد امکان واضح با علائم نگارشی تلفظ کنید، مجبور نخواهید بود متن را برای مدت طولانی ویرایش کنید.
قبل از انجام کار، باید میکروفون را پیکربندی کنید. اگر امکان حذف وجود ندارد نویز خارجیبهتر است از حساسیت او کاسته شود و کلمات را بلندتر و واضح تر تلفظ کند.
نیازی به تلفظ عبارات بیش از حد طولانی، چاشنی شده با بسیاری از ساختارهای نحوی پیچیده نیست.

اگر این توصیه ها را دنبال کنید و به درستی دیکته کردن عادت کنید، برنامه متنی را با حداقل محتوای خطا می نویسد که بر بهره وری شما تأثیر مثبت خواهد گذاشت. در عین حال، هنوز لازم نیست ورودی صوتی را به عنوان یک جایگزین 100٪ برای تایپ صفحه کلید در نظر بگیرید، قطعاً نیاز به تنظیم است، اما برای بسیاری از کاربران این ویژگی کارهای روزمره را تسهیل می کند.

با سلام خدمت خوانندگان محترم سایت وبلاگ! خیلی وقت بود که قرار بود یادداشتی در مورد برنامه ها و سرویس آنلاینآه، که با آن می توانید صدای خود را مستقیماً به متن ترجمه کنید. من به عنوان یک داستان نویس (فکر می کنم) بد نیستم، اما برای بیان افکارم در قالب متن چاپی تلاش زیادی می شود. بنابراین به دنبال یافتن یک «سرویس معجزه‌آمیز» شدم که بتواند گفتار من را به متن تبدیل کند.

امروزه ارتباط تایپ با صدا آشکار است. از این گذشته، بیهوده نیست که توسعه‌دهندگان Google به آن‌ها دست می‌زنند مرورگر گوگلکروم جستجوی صوتی. و بر این اساس متن بازبرخی از برنامه نویسان و استادان وبساخت دفترچه یادداشت و خدمات مختلف برای تبدیل گفتار به متن در حالت آنلاین. برای بسیاری از کاربران، و به ویژه کاربران دارای معلولیت، این خدمات به سادگی ضروری هستند.

با امتحان کردن یکی از خدماتی که در زیر ارائه خواهم کرد، شاید همه به نتیجه مطلوب نرسند. مخصوصاً کسانی که دائماً در رایانه متن تایپ می کنند و پیامک منبع اصلی درآمد آنهاست. و بسیاری دوست دارند به نحوی این کار سخت را تسهیل کنند. اما اگر کمی تمرین کنید، ترجمه صدا به متندر این خدمات آنلاین می توان کیفیت کاملاً بالایی را به دست آورد.

برای شروع تبدیل صدا به متن، به یک میکروفون (در لپ تاپ ها داخلی) نیاز دارید، ترجیحاً یک میکروفون خوب. سرعت اتصال به اینترنتو مرورگر گوگل کروم حداقل نسخه 25 است. در سایر مرورگرها، عملکرد تایپ صوتی، متأسفانه، کار نمی کند. همانطور که قبلاً گفتم، کد تشخیص صدا برای ارسال پیام از توسعه دهندگان گوگل باز است و می توانید از آن در سایت خود استفاده کنید. بنابراین من آن را کمی روسی کردم و در وبلاگم نصب کردم.

ورودی متن صوتی با استفاده از Web Speech API

صفحه ورودی صوتی را در مرورگر کروم راه اندازی کنید. در پایین پنجره، زبانی را که قصد دارید متن را به آن دیکته کنید، انتخاب کنید. روی نماد میکروفون در گوشه سمت راست بالا کلیک کنید. و در خط پاپ آپ، روی "اجازه می دهد" مرورگر برای استفاده از میکروفون کلیک کنید.

اکنون می توانید عبارات کوتاه را به آرامی و واضح بیان کنید. پس از اتمام دیکته متن با صدا، می توان آن را نیز با استفاده از آن انتخاب کرد میانبرهای صفحه کلید Ctrl+C را در کلیپ بورد کپی کنید و سپس در هر ویرایشگر برای پردازش جایگذاری کنید. در صورت تمایل، متن را می توان بلافاصله از طریق ایمیل ارسال کرد.

شاید، Web Speech API- ساده ترین و با کیفیت ترین راه برای تبدیل گفتار خود به متن. از آنجایی که نیازی به حواس پرتی با برخی دستکاری های اضافی با صفحه کلید نیست. فقط میکروفون را روشن کنید و متن را بگویید. در هر صورت باید از مقداری اضافی استفاده کنید ویرایشگر متنبرای تصحیح بیشتر متن دیکته شده

تبدیل گفتار به متن در صفحه سایت دیکته آنلاین

یک دفترچه ساده "بورژوایی" واقع در صفحه دیکته، فقط سه دکمه دارد. میکروفون را برای ضبط روشن کنید، قسمت ورودی متن را پاک کنید و متن دیکته شده را به رایانه خود صادر کنید. درایو گوگل, ذخیره سازی دراپ باکسیا ارسال کنید پست الکترونیکدر متن فرمت TXT. همه چیز بسیار ساده است. امتحان کنید، تست کنید و از نتیجه لذت ببرید.

تایپ صوتی - سرویس آنلاین Talk Typer

این نوت بوک تشخیص صدای آنلاین "بورژوایی" دارای چندین ویژگی داخلی اضافی است. امکان جایگزینی کلمات دیکته شده با گزینه های پیشنهادی دیگر. درج علائم نگارشی با کلیک بر روی نماد بلندگو به متن دیکته شده گوش دهید. ترجمه ای به زبان خارجی انتخابی انجام دهید. در صورت تمایل می توانید صفحه نمایش را تغییر دهید. ظاهرو اندازه فونت را با کلیک بر روی نماد چرخ دنده. تنها ناراحتی: پس از هر عبارت گفتاری، باید با کلیک بر روی فلش، آن را به پایین نوت بوک انداخت و سپس میکروفون را دوباره روشن کرد. به طور کلی، این یک سرویس تمام عیار است که می توانید در آن تبدیل کنید گفتار به متنو آن را به دلخواه ویرایش کنید. متن تمام شده را می توان چاپ، توییت یا از طریق ایمیل ارسال کرد.

تشخیص صدا در نوت بوک VoiceNote

این سرویس تشخیص صدا به متن می تواند به عنوان برنامه نصب کنید V مرورگر کروم، یا به سادگی سایت را نشانه گذاری کنید، که واقع شده است. از نظر عملکرد، Voisnot عملاً هیچ تفاوتی با سرویس یادداشت تشخیص گفتار Talk Typer قبلی ندارد. همان عیب اصلی، بعد از هر عبارت گفتاری، باید دوباره میکروفون را روشن کنید. اما از طرف دیگر، لازم نیست متن دیکته شده را مانند Talk Typer جابجا کنید. ساده و بسیار رابط کاربر پسندسرویس تبدیل متن من فکر می کنم بسیاری از مردم آن را دوست خواهند داشت. تست کنید و نتیجه بگیرید.

یکی از ویژگی های مفیددر اندروید شماره گیری صوتی است. با یادگیری نحوه استفاده ماهرانه از آن، می توانید زمان زیادی را صرفه جویی کنید و بسیاری از عملیات را بدون استفاده از صفحه کلید استاندارد انجام دهید.

این نوع تایپ باعث می شود که با فشار دادن کلیدهای گاهی بسیار کوچک حواس شما پرت نشود. این بسیار راحت است، به عنوان مثال، زمانی که شما در حال رانندگی یک ماشین هستید. برای انجام اقدامات لازم، فقط باید دستورالعمل های خود را به دستگاه دیکته کنید. اما قبل از این چندین اقدام اولیه است که باید از قبل انجام شود.

ابتدا باید مکان نما را به گونه ای قرار دهید که ظاهر شود صفحه کلید استاندارد. روی تصویر میکروفون کلیک کنید و دستگاه وارد حالت ورودی صوتی می شود. این اقدامبسته به دستگاه و نسخه سیستم متفاوت است. در بیشتر موارد، باید نماد میکروفون را در یکی از دکمه‌ها (فضا یا تغییر زبان) پیدا کنید و آن را نگه دارید.

پس از انجام این مراحل، یک پنل ورودی صوتی آماده برای استفاده روی صفحه ظاهر می شود. شما می توانید آن را نه تنها برای تماس ها یا مجموعه ای از پیام های SMS، بلکه در مرورگر نیز استفاده کنید. این بسیار راحت است، به خصوص زمانی که نیاز به تایپ یک پیام طولانی برای ارسال یا هر متن دیگری دارید.

در این لحظه یک نشانگر میکروفون بر روی صفحه نمایش دستگاه ظاهر می شود. به کادر قرمز رنگ اطراف آن دقت کنید. ضخامت آن میزان صدای شما را نشان می دهد. پس از تلفظ کلمه، بلافاصله پردازش و شناسایی می شود و پس از آن در یک فیلد خاص نمایش داده می شود.

دوستان ادامه میدیم بررسی اجمالی دقیقنوآوری های فردی که ویندوز 10 پس از معرفی یک به روز رسانی بزرگ در پاییز به دست آورد به روز رسانی سازندگان. و در این مقاله می خواهم به صفحه کلید لمسی به روز شده سیستم عامل توجه کنم. به طور اساسی بازطراحی شده و با ویژگی های جدید به روز شده است. صفحه‌کلید لمسی به‌روزرسانی‌شده از حالت Swype پشتیبانی می‌کند - زمانی که می‌توانید در حین تایپ اسلاید کنید، یعنی. بدون اینکه آن را از صفحه کلید بردارید، با انگشت یا قلم خود بکشید. چه مدت است که امکان انجام این کار وجود دارد دستگاه های تلفن همراه. صفحه کلید لمسیویندوز 10 همچنین عملکرد متن ورودی صوتی را اضافه کرد. اگر در مورد رایانه های رومیزی و لپ تاپ صحبت کنیم، افزودن این ویژگی در واقع تنها نوآوری مفید است. سازندگان پاییزبه روز رسانی در این بخش از عملکرد سیستم. با این حال، با منظم ورودی صداداده ها چندان واضح نیستند.

امکان صحبت کردن با میکروفون به جای تایپ دستی کاراکترها روی صفحه کلید محیط ویندوز 10 فقط برای به انگلیسی. مایکروسافت قول داده است که در آینده زبان‌های شناسایی دیگری را اضافه کند، اما تا کنون فقط آنچه را داریم داریم. البته این یک محدودیت جدی است و بر این اساس، تنها کسانی که انگلیسی را خوب می دانند و با تایپ به این زبان در مقیاس جدی کار می کنند، می توانند از این تابع استفاده کنند. با این وجود، عملکرد جالب است، بیایید نحوه استفاده از آن را در نظر بگیریم.

روی پنل وظایف ویندوزبا منوی زمینه تماس بگیرید و گزینه "نمایش دکمه صفحه کلید لمسی" را علامت بزنید.

اکنون صفحه کلید لمسی به طور مداوم در سینی سیستم نمایش داده می شود، جایی که می توان آن را در هر زمان راه اندازی کرد. هنگام تغییر طرح به انگلیسی، نمادی به شکل میکروفون روی صفحه کلید ظاهر می شود. برای دیکته، باید هر فیلد ورودی متن را باز کنید (هر ویرایشگر متن نصب شده در سیستم، هر فرم برنامه، هر فرم وب در پنجره مرورگر). خوب، در واقع، شروع به صحبت با میکروفون کنید.

یک نکته مهم: تایپ صوتی تنها زمانی امکان پذیر خواهد بود که خدمات گفتاری در سیستم غیرفعال نباشد. این را می توان در برنامه تنظیمات با رفتن به بخش حریم خصوصی بررسی کرد. در تب Speech دست خطو متن را وارد کنید" باید دکمه ای را برای خاموش کردن خدمات گفتار نمایش دهد. بر این اساس، این بدان معنی است که خدمات در حال حاضر فعال هستند.

در غیر این صورت دکمه Enable Speech Services نمایش داده می شود. و بنابراین، باید شامل شود.