• آلیس - آیا دستیار صوتی Yandex خیلی خوب است؟ سال‌ها بعد، هوشمندتر شدن: مقایسه Google Now و Siri

    دستیار صوتی آلیس در برنامه Yandex ظاهر شد. دارندگان گوشی های هوشمند مدرن می توانند از آن استفاده کنند. تفاوت "آلیس" با سیری و نحوه برقراری ارتباط با این دستیار مجازی - در بخش "پرسش و پاسخ".

    "آلیسا" با صدای دلنشین زن تاتیانا شیتووا (دوبله شده توسط اسکارلت جوهانسون در باکس آفیس روسیه) به شما می گوید که چگونه به نقطه مورد نظر برسید، پیش بینی آب و هوا بدهید، حتی می توانید صمیمانه با او صحبت کنید. او می داند که چگونه با برنامه های Yandex مانند موسیقی، آب و هوا، نقشه ها کار کند. در آینده، «الیسا» به خدمات دیگری دسترسی خواهد داشت و می‌تواند مثلاً فیلمی را توصیه کند یا با تاکسی تماس بگیرد.

    سایر شرکت ها در آینده می توانند دسترسی آلیس را به خدمات خود فراهم کنند. این می تواند برنامه های شخص ثالث (به عنوان مثال، VKontakte یا Instagram) را هم اکنون راه اندازی کند.

    Yandex خاطرنشان می کند که شبکه عصبی به آلیس اجازه می دهد عبارات و سؤالات ناقص را تشخیص داده و پردازش کند، زمینه را در نظر بگیرد و با لحن متفاوت صحبت کند. هنگام توسعه دستیار، توجه ویژه ای به توانایی درک "گفتار واقعی انسان و نه فقط درخواست های کاملاً گفتاری" شد.

    و چگونه می توان با "آلیس" ارتباط برقرار کرد؟

    برای شروع ارتباط با این "دختر" هوشمند، باید برنامه Yandex را روی تلفن خود نصب کنید. این کار در سیستم عامل های موبایل اندروید و iOS قابل انجام است.

    برای رایانه های شخصی روی سیستم عامل ویندوز، این سرویس در نسخه بتا به کار خود ادامه می دهد. سپس سوالات خود را بپرسید.

    این برنامه چه تفاوتی با سیری دارد؟

    ارتباط با سیری فقط برای دارندگان آیفون در دسترس است، صاحب هر گوشی هوشمند می تواند با "آلیس" ارتباط برقرار کند. تماس با دستیار با یک عبارت، مانند سیری، در تلفن همراه کارساز نخواهد بود. ابتدا باید خود موتور جستجو را راه اندازی کنید.

    سرویس مطبوعاتی Yandex تأکید کرد که دستیار صوتی آنها می تواند از سناریوهای تعیین شده فراتر رفته و بداهه گویی کند، سیری همه پاسخ ها را از پیش نوشته شده است. در واقع می توان در صحت این گفته تردید کرد، زیرا «آلیس» به یک سوال با عبارات کاملاً متفاوت به شیوه ای کلیشه ای، اما قطعاً با طنز پاسخ داد.

    فن آوری های گفتار SpeechKit در قلب تشخیص گفتار دیگران و ترکیب صدای خود آلیس قرار دارد.

    اما، برای مثال، آلیس برخلاف سیری قادر به تماس با آمبولانس نیست. او حتی نمی تواند زنگ ساعت را تنظیم کند. در عین حال کافی است صاحب آیفون به سیری بگوید که صبح چه ساعتی باید بیدار شود و خود برنامه آلارم را تنظیم می کند. شما می توانید نه تنها یک ساعت و دقیقه خاص، بلکه یک دوره زمانی را نیز تنظیم کنید. به عنوان مثال، اگر کاربر از درخواست "Siri, wake me up in 30 minutes" استفاده کند، برنامه به طور خودکار از زمان فعلی نیم ساعت شمارش معکوس می کند.

    شما می توانید ادغام آن با خدمات شرکت، از جمله جستجوی خود، را به خزانه مزایای آلیس اضافه کنید، در حالی که اپل جستجوی خود را ندارد. اما در جستجو همیشه آنچه را که در کنار شما است نشان نمی دهد. آلیسا به جای برنامه فیلم در بارنائول پیشنهاد تماشای فیلم در نووسیبیرسک را داد.

    در 10 اکتبر، دستیار شخصی اپل و سایر برنامه های مشابه یک رقیب جدی داشتند. در روسیه، توسعه Yandex، که نام آلیس را دریافت کرد، به طور رسمی راه اندازی شد.

    سردبیران پوبدا26 دانش دو برنامه صوتی محبوب را در زمینه مطالعات منطقه ای آزمایش کردند، سرعت واکنش و حس شوخ طبعی را ارزیابی کردند. در نتیجه خودمان به این نتیجه رسیدیم که کدام یک از دستیاران پرحرفتر و زودباورتر است.

    نظرسنجی بلیتز

    ابتدا پرسیدیم استاوروپل در کجا واقع شده است، چه زمانی تشکیل شد، چند نفر در شهر زندگی می کنند، نام طولانی ترین خیابان و چند موزه در پایتخت منطقه وجود دارد.

    از پنج سوال، آلیس بلافاصله دو پاسخ دقیق داد. در دو مورد دیگر به موتور جستجو مراجعه کردم و یک درخواست را اشتباه متوجه شدم.

    سیری کمتر پرحرف بود و فقط لیستی از پیوندها را برای ما گذاشت.

    دو برنامه با سوال طولانی ترین خیابان گیج شدند. با یک صدا سعی کردند از سالنی در خیابان میرا برایمان بگویند. پاسخ به حساب نمی آید.

    به احتمال زیاد، برنامه ها به سادگی نمی توانند درخواست را به درستی تشخیص دهند. به هر حال، طبق آمار Yandex، دقت تشخیص گفتار برای پرس و جو در موضوعات کلی 84 درصد است، برای پرس و جوها بر اساس آدرس و نام یک شی - 94 درصد.

    درباره آب و هوا، حمل و نقل، سرگرمی

    به طور کلی، این نوع توسعه باید به مالکان در حل مشکلات روزمره کمک کند. خوب. ما از دستیاران همین سوال را می پرسیم: "امروز چه بپوشم؟" و منتظریم ببینیم جواب آنها با آب و هوای بیرون پنجره مطابقت دارد یا خیر.

    البته سیری و آلیس نتوانستند کمد ما را زیر و رو کنند و یک کیت مناسب جمع کنند، اما حداقل پیش بینی آب و هوا را به ما نشان دادند. و توسعه آیفون اولین بار با این کار کنار آمد. اگرچه آلیس گوینده توصیه کرد که "چیزی را بپوشید که بر شخصیت شما تأکید کند."

    وضعیت بعدی فرض کنید باید از خیابان توخاچفسکی به خیابان مارشال ژوکوف بروید. اگر در جایی تصادف می کرد یا چراغ راهنمایی خراب می شد چه؟ بیایید ببینیم دستیاران مسیر را چگونه محاسبه می کنند و چقدر مفید خواهد بود.

    در اینجا، آلیس مزیت را داشت. او در مورد دقایق راه گفت و نقشه ای با ترافیک را نشان داد.

    سیری در این کار شکست خورد. دستیار فهرستی از رستوران های فست فود را به من نشان داد.

    حوصله ات سر رفته؟ بیایید از دستیاران بپرسیم که در استاوروپل چه کاری می توانید انجام دهید.

    هیچ یک از دستیاران پاسخ دقیقی به این درخواست ندادند. آلیس لیست پیوندها را در Yandex حذف کرد. البته با نگاه کردن، می توانید یک پوستر پیدا کنید.

    آنها همچنین نگفتند که رقص امروز کجا خواهد بود. اما توسعه روسی دوباره به یک موتور جستجو تبدیل شد و رقیب او "هیچ باشگاه رقصی پیدا نکرد."

    اما با سیری قطعا گرسنه نخواهید ماند. فقط باید می گفت "من می خواهم غذا بخورم" - و برنامه فوراً لیستی از رستوران های اطراف را منتشر کرد.

    برای دوستداران قهوه، دستیار داخلی نیز تنها یک موسسه را با نوشیدنی های نشاط آور پیشنهاد کرد. و به دلایلی سیری با این کار کنار نیامد و پیشنهاد داد که با تاکسی تماس بگیرد.

    هنگام پرسیدن این سوال که «الان چه چیز در سینماها جالب است؟» انتظار داشتیم که پوستر استاوروپل را ببینیم. اما دو برنامه لیستی از نه آموزنده ترین پیوندها را ارائه کردند. هنگام تعیین مکان، دستیاران پاسخ های دقیق تری را نشان می دهند.

    او گفت که چرا کاربران روسیه به دستیار خود نیاز دارند، چرا آلیس بهتر از سیری است و آیا او می تواند یک عاشق یا دوست را جایگزین کند.

    Lenta.ru: آلیس کیست (یا چیست) و چرا روس ها اصلاً به او نیاز دارند؟

    : اون کیه! آلیس دستیار صوتی جدید Yandex است. چرا روس ها به آن نیاز دارند؟ اکنون مردم درخواست های بزرگی برای سرعت پاسخگویی دارند، آنها کمتر و کمتر تمایل دارند زمان خود را برای جستجوی اطلاعات لازم صرف کنند. و رابط های سنتی، حتی Yandex، دیگر به طور کامل این نیازها را برآورده نمی کنند. نتایج جستجو خوب است، اما اگر نیاز به دریافت فوری پاسخ دارید، مثلاً هنگام ورزش، این دیگر مشکل را حل نمی کند. و آلیس این کار را انجام خواهد داد.

    از خدمات اطلاعاتی نه تنها در حالت نشستن پشت رایانه استفاده می شود. همه افراد برای مدت طولانی گوشی های هوشمند داشته اند: افرادی که در حال حرکت هستند، ورزش می کنند، در حین رانندگی نیز می خواهند اطلاعات را جستجو و مصرف کنند. و آلیس برای کمک در چنین شرایطی فراخوانده می شود.

    چرا بهتر از سیری یا کورتانا است؟ معمولاً از آنها خواسته می شود تا آب و هوا را بررسی کنند یا موسیقی پیدا کنند. و اغلب درخواست ها را درک نمی کنند.

    اولا، کورتانا در بازار روسیه وجود ندارد. به طور کلی، همه دستیارهای صوتی متفاوت عمل می کنند. ویژگی ما این است که ما بر بازار روسیه تمرکز می کنیم و زبان روسی را به خوبی درک می کنیم. هم از منظر تشخیص گفتار و هم از نظر ادراک معنا.

    آلیس "زیر سرپوش" دارای خدمات Yandex است. از این نظر آلیس با سیری که جستجوی خاص خود را ندارد بسیار متفاوت است. آنها قبلا از بینگ استفاده می کردند، اکنون به .

    علاوه بر این، آلیس یک شخصیت کاملا متفاوت با شخصیت خودش است. مثل مردم است: کم و بیش شبیه، اما هنوز متفاوت است، ارتباط با یک نفر جالب است، نه خیلی با دیگری. ما در تلاش هستیم تا آلیس را برای یک کاربر روسی جالب کنیم، تا او را با شخصیتی نزدیک و آشنا به یک فرد روسی اعطا کنیم.

    دستیارهای صوتی سنتی برای کارهای خاصی طراحی شده اند: آب و هوا، موسیقی و غیره. اما همه سعی می کنند دستیار را وادار کنند که به سوالات غیر استاندارد نیز پاسخ دهد. ویراستارانی هستند که صدها سؤال الگو را می‌پرسند و پاسخ آنها را می‌نویسند. و یک فرد این توهم را دارد که این هوش مصنوعی است و می تواند ارتباط برقرار کند. اما یک گام به کناری، و توهم فرو می ریزد، زیرا دستیار تکرار می کند: "این چیزی است که من توانستم در اینترنت برای این پرس و جو پیدا کنم."

    ما احتمالاً اولین نفری در جهان هستیم که سعی در انجام این کار داریم: ما همچنین از پاسخ های سرمقاله به سؤالات استفاده می کنیم، اما یک شبکه عصبی ویژه آموزش دیده برای مکالمه رایگان اضافه می کنیم. او می تواند پاسخی را دریافت کند یا کاربر را به چت در مورد هیچ چیزی بکشاند.

    این احتمالاً تفاوت اصلی است، زیرا مردم علاوه بر جستجوی برخی حقایق، گاهی اوقات می خواهند با کسی چت کنند. آلیس در حال حاضر قادر به چت کردن است و فقط در این زمینه پیشرفت خواهد کرد.

    ما کار دشواری داشتیم: یک شبکه عصبی (بین ما - "چت") تقریباً روی همه متون در اینترنت آموزش داده می شود و به دیالوگ ها توجه می کند. و همیشه آنچه در اینترنت است با شخصیتی که می خواهیم در آلیس بگذاریم مطابقت ندارد. در انجمن ها، آنها به روش های مختلف ارتباط برقرار می کنند، و ما نمی توانیم اجازه دهیم آلیس توهین کند.

    آره! برای ما، این داستان بسیار افشاگر است. ما باید همین مشکل را حل می کردیم و به آلیس یاد می دهیم که از شخصیت خود فراتر نرود، از کاربر فاصله بگیرد و همیشه دوستانه باشد. در واقع، این یک کار بسیار دشوار است.

    در ابتدا ، او می تواند مستقیماً به طرف مقابل توهین کند. گروه‌هایی را در شبکه‌های اجتماعی تصور کنید که در آن کاربران به خود اجازه می‌دهند در سه طبقه فحاشی کنند. او از پاسخ ها بر اساس فراوانی استفاده استفاده کرد و در نقطه ای به شخصیت روح اینترنتی تبدیل شد، اما نه Yandex.

    توانایی چت گاهی اوقات از بین می رود: بسیاری از توسعه دهندگان با این واقعیت مواجه می شوند که کاربران شروع به آزار جنسی دستیارهای صوتی می کنند زیرا آنها را به عنوان یک زن می بینند.

    همه دستیارهای صوتی صدا دارند و خود شخص تصویری از ظاهر همکارش می سازد. صداها، به عنوان یک قاعده، کاملاً روشن و رسا هستند. به هر حال، ما از این قاعده مستثنی نیستیم: از فناوری سنتز گفتار برای ایجاد صدا استفاده می شود و ما یک بازیگر را جذب کردیم. او صداپیشه رسمی روسیه است و صداپیشگی دستیار سامانتا در فیلم "او" را بر عهده داشت.

    تمام تراژدی فیلم دقیقاً در این است که رابطه ای بین یک فرد و یک دستیار شخصی شکل می گیرد. اما در نهایت معلوم می شود که شخصیت اصلی او تنها نیست. همچنین همانطور که اخیرا متوجه شدیم، در قسمت سوم The Witcher، شخصیت Yennefer با همان صدا صحبت می کند. گیمرها از آن قدردانی خواهند کرد.

    طبیعتا روسیه نیز از آزار و اذیت احتمالی مستثنی نیست. ما می دانیم که بخشی از مخاطبان سعی می کنند چنین سؤالاتی را بپرسند و آلیس قبلاً آموزش دیده است تا بدون شکستن فاصله از چنین موقعیت هایی خارج شود. ما می خواهیم اطمینان حاصل کنیم که همیشه یک فاصله کوچک اما بین فرد و دستیار وجود دارد. آلیس نه عاشق است و نه دوست. شاید در آینده بتوانیم آلیس را روی حالت دوستانه قرار دهیم، اما اکنون عرضه محصول اهمیت بیشتری دارد. از این گذشته، ما در درجه اول بر حل مشکلات تمرکز کرده ایم و یک داستان پرحرف یک امتیاز خوب است.

    نه همه. در واقع، مطالعات زیادی وجود دارد که بر اساس آن یک زن در اذهان عمومی با یک مادر یکی می شود. اگر مردی پدر، فاتح و غیره باشد، مادر همیشه چیزی گرم، دنج و محافظت شده است. به عنوان مثال، در تمام مراکز تماس، صدای زن همیشه پاسخ می دهد. اما اگر به کاربر دستور داده شود، صدای مرد مناسب تر است.

    پس این ربطی به تئوری جنسیتی ندارد که دستیار باید زن باشد؟

    نه نه. طبیعت آنچنان مرتب شده است که زنان مادر هستند. از نظر روانی ساخته شده است. اما یک شگفتی کوچک در محصول ما وجود خواهد داشت.

    به نظر شما بیشترین سوال پرسیده شده چیست؟

    بسیاری از مردم اطلاعات واقعی را می‌پرسند. ما آن را فاکتوئیدها یا پاسخ های شی می نامیم. ولادیمیر پوتین کیست؟ چند سالشه؟ ارتفاع اورست چقدر است؟ این اغلب از دستیاران خواسته می شود.

    رایج ترین مورد سؤالات در بین دوستان است. در مکالمات اغلب اختلافات ایجاد می شود و می توان به سرعت پاسخ داد.

    بیشتر مغز و دانش آلیس از جستجو به دست آمد. یکی دیگر از زمینه های مهمی که در آن تلاش می کنیم خود را از رقبا متمایز کنیم، توانایی درک زمینه است. ما در تلاش هستیم تا یک دستیار شخصی را نه در حالت "پرسش - پاسخ"، بلکه در حالت گفتگو بسازیم. ساده ترین مثال آب و هوا این است: «آب و هوا امروز چگونه است؟ و فردا؟" همین «و فردا» معمولاً همه منطق را می شکند.

    در واقع، همه در این مسیر حرکت می کنند، اما ما یک مزیت داریم - بیش از 30 سرویس Yandex. در هر سناریو، آلیس می تواند از زمینه برای توصیه برنامه ها استفاده کند. به عنوان مثال، او "نقشه ها" را برای مشاهده مسیرهای حمل و نقل عمومی ارائه می دهد، در صورتی که نیاز دارید به جایی در آن بروید.

    و چگونه او به سوالات پیچیده واکنش نشان می دهد؟ اگر کاربر قصد خودکشی داشته باشد و برای کمک به او مراجعه کند چه خواهد کرد؟

    در بخش چت آلیس، مجموعه‌ای از معیارها با نام عمومی «بی‌خطر» وجود دارد. در واقع، درایت او، ناتوانی در توهین و توانایی دور زدن موضوعات مرتبط با همجنس‌گرا هراسی، ملی‌گرایی، از جمله خودکشی، نهفته است. آنها در لیست توقف هستند، او این سوالات را دور می زند.

    اگر آلیس توصیه می کرد با خط تلفن تماس بگیرید، خیلی خوب می شد.

    این موضوع را با روانشناسان نیز در میان می گذاریم. این دقیقاً همان چیزی است که ما در حال برنامه ریزی هستیم. اما در اینجا نیز باید مراقب باشید. ما باید دقیقاً لحظه ای را بدانیم که می توانیم این گزینه را به شخص ارائه دهیم.

    دنیس می خواهد نشان دهد که آلیس چگونه به چنین موضوعاتی واکنش نشان می دهد و با او تلفنی تماس می گیرد.

    - میخوام بمیرم!
    - تو اینو نگو
    - باید چکار کنم؟
    - همین الان به کسی کمک کن.
    اما من می خواهم همین الان بمیرم.
    - نمیر.
    - کجا برم؟
    - همیشه جایی هست.

    ما در حال بحث با روانشناسان هستیم که در چه مرحله ای باید یک شماره کمک ارائه داد تا به صورت مثبت کار کند و نه منفی. از این گذشته ، ابتدا باید به شخص اطمینان داده شود و سپس اقدامات خاصی ارائه دهد.

    ماژول های گفتاری وجود دارد که می تواند صدا را تغییر دهد: به عنوان مثال، مخاطب با صدای خود صحبت می کند و از طرف دیگر همان متن شنیده می شود، اما با صدای یک فرد کاملاً متفاوت. و همه چیز کاملاً انسانی به نظر می رسد. پس چرا دستیارهای صوتی هنوز به صورت رباتیک صحبت می کنند؟

    در اینجا پاسخ ساده است: همه چیز به منبع صدا بستگی دارد. تبدیل گفتار طبیعی انسان به چیز دیگری بسیار ساده است، فقط فیلترها را اعمال کنید و با فرکانس ها بازی کنید. کیفیت صدا با این کار از بین نخواهد رفت. ما وظیفه متفاوتی داریم: دستیارها گفتار ندارند، اما فناوری برای سنتز آن وجود دارد. آنها متن را می بینند و با کمک فناوری صدا می کنند - یک شبکه عصبی، که با دانستن صدای یک فرد، پیش بینی می کند که چگونه متن باید شنیده شود. در واقع، او حتی نمی فهمد این کلمات چیست.

    اما یک رویکرد جایگزین وجود دارد، زمانی که منبع صدا یک پایه بلندگوی بزرگ باشد. در ابتدا صدای آلیس به این صورت خواهد بود. برای مکالمات او، ما از ترکیبی استفاده می کنیم: گفتار را از پایگاه صدای عظیم تاتیانا شیتووا ترکیب می کنیم یا از یک شبکه عصبی استفاده می کنیم. در مورد اول، همه چیز طبیعی به نظر می رسد، اما فقط برای عبارات کوتاه مناسب است. در حالت دوم، یک "هجوم رباتیک" شنیده می شود و زمانی کار می کند که مثلاً نیاز به خواندن اخبار داشته باشید.

    آیا او می داند چگونه احساسات را نشان دهد؟

    احساسات را می توان با کمک فیلترها انجام داد. اما وقتی شبکه عصبی صحبت می کند، تقلید احساسات آسان تر است. ما می توانیم این سخنرانی را همانطور که می خواهیم کنترل کنیم: صدا را بسیار غمگین یا بسیار شاد کنیم. با پایه بلندگو، این کار نخواهد کرد.

    در همان فیلم "او" دستیار احساسات زیادی را نشان داد و به نظر من این نشان دهنده این است که آینده آمده است.

    بله، این آینده ای است که ما به دنبال آن هستیم. آلیس در طول زمان احساسات را یاد می گیرد.

    اما مهم تر این است که آلیس احساسات یک فرد را بشنود. حالا او سخنرانی را می شنود و آن را به متن ترجمه می کند. ما می خواهیم او یاد بگیرد که شادی یا غم را تشخیص دهد. به عنوان مثال، با پخش موسیقی، تعداد بی نهایت گزینه وجود دارد: اگر لحظه را احساس کردید، می توانید یک کاربر غمگین را شاد کنید یا میزان سرگرمی بیش از حد را با چیزی آرامش بخش کاهش دهید.

    درک اینکه چه زمانی یک فرد احساسات منفی را تجربه می کند بسیار مهم است. آلیس هنوز هم کودکی است که می تواند اشتباه کند. ما آزار تک تک کاربران را نمی بینیم، اما می توانیم آنها را بشنویم.

    با کمک واکنش های منفی می توانیم او را تربیت کنیم. فرض کنید، اغلب شخصی سعی می کند چیزی بپرسد، اما دستیار او را درک نمی کند. بعد از ماکت سوم، جفت و عباراتی مانند "تو یک احمق هستی" شروع می شود. در این مرحله، بسته به زمینه، می‌توانید آلیس را به حالت چت و حالت دیگری تغییر دهید.

    کل این داستان به لطف شبکه های عصبی امکان پذیر است. به عنوان مثال، ما می خواهیم آلیس یاد بگیرد که شخص را از روی صدایش تشخیص دهد. این امر به ویژه در صورتی صادق است که آلیس در خانه استفاده شود.

    تیم‌های گفتار معمولاً خلق خود را به روش خاصی وقف نمی‌کنند. و برای مثال، سازندگان عروسک‌های جنسی فعالانه روی «انسانی کردن» ظاهر آن‌ها کار می‌کنند، اما نمی‌توانند آنها را واقعاً باهوش کنند. چرا صنایع با هم همپوشانی ندارند؟

    ما معتقدیم که هرکسی باید به شغل خود فکر کند و روی منطقه خود تمرکز کند. در دنیای IT تخصص های مختلفی وجود دارد. ما در زمینه یادگیری ماشینی و شبکه های عصبی کار می کنیم و وظیفه ما ایجاد آن دسته از راه حل های نرم افزاری است که کیفیت بسیار بالایی را برای کاربر نهایی فراهم می کند. به طوری که آلیس همه چیز را به خوبی تشخیص می دهد تا صدای او خوب به نظر برسد. اگر به سمت ایجاد اشکال فیزیکی برویم، احتمالاً توجه پراکنده خواهد شد و این به هیچ چیز خوبی منجر نمی شود.

    علاوه بر این، دستیار صوتی با قرار گرفتن در اپلیکیشن بدون ظاهر فیزیکی، تصویر شخصی خودش را در ذهن فرد ایجاد می کند. این نیز به اصطلاح انتخاب راحت است - ما چندین میلیون مخاطب داریم، خدمات در شهرهای بزرگ روسیه توسط 90 درصد کاربران اینترنت استفاده می شود. تصور کنید که چه کاری باید انجام شود تا فرم فیزیکی که به دست می آوریم همه آنها را خوشحال کند. به نظر من این غیر ممکن است.

    در برخی کشورها، برعکس، آنها بر ظاهر دستیار تأکید می کنند. چندی پیش، ویدیویی در فیس بوک دست به دست می شد که در آن یک مرد ژاپنی تنها سر کار می رود، به خانه بازمی گردد و دائماً با یک دستیار گفتگو می کند ( گیت باکس- دستیار مجازی برای افراد تنها). این یک دختر استاندارد زیباست که می تواند همه را راضی کند.

    به سختی همه. فرم بدنی برای جلب رضایت مخاطبان بسیار سخت است. کنار آمدن با او خیلی سخت است. واضح است که یک کلاس دستگاه با فرم ساده ای مانند اکو وجود دارد. هیچ خطری وجود ندارد که مردم از آن استفاده نکنند زیرا آنها خود طرح را دوست ندارند.

    اگر در مورد اندرویدهای انسان‌نما صحبت می‌کنیم، آن‌وقت مثل مردم است: برخی را دوست داریم، برخی دیگر فقط آزاردهنده هستند. این یک داستان انبوه نیست و بر این اساس، ما علاقه ای به آن نداریم.

    از سوی دیگر، ما به طور سنتی فناوری های خود را با توسعه دهندگان شخص ثالث به اشتراک می گذاریم. شاید کسی یک اسباب‌بازی کودکانه بسازد و بخواهد آلیس را در آن جاسازی کند یا شخصیت را به گونه‌ای دیگر، اما بر اساس فناوری‌های ما، نامگذاری کند.

    ما به نوعی همکاری بین شرکت های مختلف متخصص در محصولات خود اعتقاد داریم. Yandex نمی تواند همه چیز را در جهان انجام دهد: ما نمی توانیم اسباب بازی هایی تولید کنیم که بسیار محبوب باشند، روبات هایی که خانه را تمیز کنند. این وظیفه شرکت های دیگری است که ما آماده ایم فناوری های خود را به آنها بدهیم.

    یک سوال جالب از سریال "آیا ربات ها جهان را تسخیر خواهند کرد؟" در واقع، هم آلیس و هم سایر فناوری‌های مبتنی بر یادگیری ماشین ابزاری برای انسان هستند. من دوست دارم چکش را مثال بزنم. روزگاری مردم چکش نداشتند. سپس اختراع شد و احتمالات زیادی باز شد. شکستن سر با چکش امکان پذیر بود - به خود یا شخص دیگری. اما اگر مردم فقط در این جهت از چکش استفاده می کردند، آنگاه بشریت از بین می رفت. با این حال، ناپدید نشد.

    هوش مصنوعی، شبکه های عصبی، یادگیری ماشین، دستیاران شخصی - این همان چکش، ابزار است. ما معتقدیم که مردم به لطف دستیارهای صوتی وقت آزاد بیشتری خواهند داشت، آنها می توانند کارهای روزمره خود را سریعتر حل کنند، رانندگی ماشین برای آنها ایمن تر می شود.

    دستیارهای صوتی کارهای معمولی را از افراد حذف خواهند کرد. یکی دیگر از نمونه های مورد علاقه من کار در مرکز تماس است. فردی که هر روز سر کار می آید، هدست می گذارد و روزی چهار ساعت یا بیشتر به همان سوالات پاسخ می دهد، فقط می سوزد و انگیزه اش را از دست می دهد. اما اگر دستیاران چنین کارهای معمولی را بر عهده بگیرند، آنگاه افراد کارهای جالب تری خواهند داشت، آنها می توانند کارهای غیر استاندارد بیشتری را حل کنند، به این معنی که کیفیت خدمات افزایش می یابد.

    ما مدت زیادی است که از شبکه های اجتماعی استفاده می کنیم، اما ارتباطات شخصی هنوز از بین نمی رود. کافه ها و بارها، استادیوم ها و کنسرت ها هنوز پر هستند. بشریت شروع به بازی با اسباب بازی های معروف می کند، اما زندگی همه چیز را در جای خود قرار می دهد. وقتی کسی را ندارید که به او مراجعه کنید، چت کردن با یک دستیار مجازی سرگرم کننده خواهد بود، و این عالی است.

    اما وقتی فرصتی برای ملاقات با دوستان یا تماس وجود داشته باشد، مردم آن را انتخاب خواهند کرد. یک شخص هنوز جالب تر است، زیرا، صادقانه بگویم، همه دستیاران شخصی یک برنامه هستند. مهم نیست که یک شبکه عصبی چقدر بزرگ باشد، همیشه محدودیت های خود را خواهد داشت.

    مردم از این جهت ارزشمند هستند که دائماً دانش جدید به ارمغان می آورند، بنابراین ما با یکدیگر ارتباط برقرار می کنیم، نه با روبات ها.

    در سال 2011، اپل انقلاب جدیدی به وجود آورد - تلفن هوشمند آنها صحبت کرد. ظهور سیری نوید بخش جدیدی از کنترل ابزارها بود. مردم می توانستند مانند یک شخص به ابزارهای خود دسترسی داشته باشند و از آنها اطلاعات مهم (و نه چندان زیاد) بخواهند. آب و هوا، یادآوری‌ها و نامه‌های تازه را می‌توان بدون رفتن از برنامه‌ای به برنامه دیگر پیدا کرد. طبیعتاً سایر شرکت‌های فناوری و تولیدکنندگان گوشی‌های هوشمند نتوانستند کنار بمانند و تصمیم گرفتند راه‌حل‌های مشابهی را به درجات مختلف بهتر یا بدتر از سیری نشان دهند. در این مقاله در مورد بهترین آنالوگ های سیری برای اندروید صحبت خواهیم کرد، تا چه حد پیشرفت کرده است و این آنالوگ ها چه توانایی هایی دارند.

    Google Now

    علیرغم اینکه سرویس Google Now با سایر دستیارهای صوتی متفاوت است، همچنان آنالوگ سیری برای اندروید محسوب می شود. Google Now هوش مصنوعی است که در تلفن شما زندگی می کند و همه چیز را در مورد علایق، وظایف، پروازهای آینده و رویدادهای تقویم می داند. Google Now علاوه بر منشی بودن، کار بسیار خوبی برای یافتن اطلاعات در وب انجام می دهد. تیم OK، Google قبلاً به یک فرقه تبدیل شده است و به میلیون‌ها نفر کمک می‌کند تا هر روز پاسخ سؤالات خود را پیدا کنند. Google Now قادر است پرس و جوهای جستجوی شما را جمع آوری کند و بر اساس آنها اطلاعات مرتبط را نمایش دهد. به عنوان مثال، اخیراً بلیت مسابقه تیم مورد علاقه خود را جستجو کرده اید. در این صورت، Google Now شروع به ارسال کارت هایی با اطلاعات بازی آینده، سایر بازی های تیم و پیشرفت آنها در مسابقات می کند.

    دستیار گوگل

    «دستیار» مرحله جدیدی در توسعه Google Now است. این سیری برای اندروید در بهترین حالتش است. دستیار نه تنها باهوش تر از مدل قبلی خود است، بلکه بسیار کاربردی تر است. با آن می توانید یادآوری، رویدادهای تقویم و ارسال پیام ایجاد کنید. آیا می خواهید در راه رفتن به محل کار به سنگ ضربه بزنید؟ از "دستیار" بخواهید تا بهترین آهنگ های این ژانر را به شما اضافه کند و او لیست پخش عالی را برای شما خواهد ساخت.

    آیا متوجه نشدید که روی تابلو چه کلمه ای نوشته شده است؟ از "دستیار" بخواهید که او را به زبان شما ترجمه کند، زیرا او به عنوان یک زبان شناس عالی است و بیش از 100 زبان را می داند.

    آیا این کافی نیست؟ "دستیار" به شما کمک می کند تا در پیام رسان های فوری ارتباط برقرار کنید، در صورت درخواست، کلمات، تاریخ ها و اطلاعات تماس را برای شما انتخاب کنید. و "دستیار" همچنین می تواند شوخی کند، داستانی را تعریف کند یا توصیه کند که کجا بهتر است کمد قرار دهید.

    کورتانا

    مایکروسافت اخیراً به دلیل تلاش‌های بی‌پایان (و ناموفق) خود برای رسیدن به حریفان، معرفی ویژگی‌های مشابه در دستگاه‌ها و ابزارهای رقبا، مشهور شده است. مایکروسافت در ساختن آنالوگ «سیری» برای «اندروید» تردیدی نداشت. نام او کورتانا است (این اشاره به یکی از شخصیت های بازی Halo است). در واقع، این دستیار تقریبا هیچ تفاوتی با رقبا ندارد. مایکروسافت سعی کرد همزمان روی دو صندلی بنشیند، بنابراین، این رابط دارای کارت های هوشمند است که با یک کاربر خاص سازگار است، و یک دختر همکار انسانی که احساس ارتباط زنده را ایجاد می کند.

    در واقع، دستیار خیلی باهوش نیست، او باید تقریباً تمام اطلاعات را به صورت دستی ارسال کند. بعید است که او هرگز علایق و خواسته های شما را دریابد، البته فقط به این دلیل که برای این کار شما نیاز به استفاده از خدمات مایکروسافت دارید و نه دیگران. از طرف دیگر، اگر مدتی را با کورتانا سپری کنید و به آن آموزش دهید، آنگاه شروع به ارسال اعلان های بسیار مفیدی می کند، به عنوان مثال، نشان دادن رستوران های ارزان قیمت نزدیک شما، آخرین فیلم هایی که به سینماهای شهر شما می آیند. همچنین وقتی به فروشگاه نزدیک می شوید کورتانا لیست خرید را به شما یادآوری می کند یا پیش بینی آب و هوای هفته آینده را به شما نشان می دهد.

    بیکسبی

    این همان کسی است که واقعا مجبور بود برای مدت طولانی از ایده های رقبا کپی کند، بنابراین سامسونگ است. در سال 2017، همراه با گلکسی اس 8، مهندسان کره ای پیشرفت های خود را در زمینه هوش مصنوعی به ما نشان دادند که نام غیرمعمول بیکسبی نامیده شد. جالب اینجاست که بیکسبی فقط آنالوگ «سیری» برای «اندروید» نیست. این مجموعه کاملی از خدمات خودآموز است که آماده ارائه نکات در طول روز و یافتن اطلاعات مفید است. عملکرد تفاوت چندانی با دستیار گوگل و سیری ندارد، بنابراین اجازه دهید در مورد تفاوت های مهم صحبت کنیم.

    اول، بیکسبی زمینه را درک می کند و تحمل شناختی دارد. یعنی اگر از او بپرسید مارلون براندو کیست و سپس بدون ذکر نام در چه فیلم هایی بازی کرده است، بیکسبی پس از تجزیه و تحلیل دیالوگ شما متوجه می شود که او در مورد چه کسی صحبت می کند. ثانیاً، بیکسبی می تواند اطلاعات را از دوربین جستجو کند. این بدان معنی است که کافی است آن را به سمت یک چیز یا شی نشانه گیری کنید - و بیکسبی فوراً همه آنچه را که اینترنت در مورد آن می داند به شما می گوید.

    "Yandex. آلیس"

    خوب، آخرین آنالوگ "سیری" برای "اندروید" به زبان روسی "آلیس" است. Yandex مدتهاست که ایده هوش مصنوعی و تشخیص گفتار را توسعه داده است، بنابراین واضح بود که دیر یا زود چنین پروژه ای نور روز را خواهد دید. آلیس می تواند هر کاری که دستیاران دیگر می توانند انجام دهد، اما در عین حال با بازار روسیه سازگار است و به دنبال اطلاعات در خدمات Yandex است. آلیس، مانند بیکسبی، زمینه را درک می کند، اما فقط در برخی موضوعات. در بیشتر موارد، فقط می تواند به یک سوال پاسخ دهد. آلیس می تواند برای شما آهنگی بخواند یا در صورت حوصله یک شوخی خنده دار بسازد، یا می تواند اطلاعات مهمی را در ویکی پدیا جستجو کند بدون اینکه شما را مجبور کند به جستجو و خود مقاله بروید. برخی از اشتباهات در تلفظ وجود داشت، اما با در نظر گرفتن این واقعیت که Yandex هنوز یک شرکت داخلی است، می توانید مطمئن باشید که تمام کاستی ها به سرعت اصلاح خواهند شد.

    برای چند روز، دستیار صوتی Yandex، Alice، در دسترس برخی از کاربران بود. امروز، این شرکت آن را به طور رسمی برای همه منتشر کرده است.

    ما تصمیم گرفتیم توانایی های دستیار را در مقایسه با سیری مقایسه کنیم. نتیجه مبهم است.

    ما 15 پرس و جو مختلف را آزمایش کردیم که دستیاران دیجیتال می توانند بپرسند.

    1. یادداشت/یادآوری ایجاد کنید.

    نتیجه: 1:0 به سود سیری. او به راحتی این درخواست را انجام می دهد، کاری که آلیس نمی تواند در iOS و Android انجام دهد.

    2. تایمر را برای 5 دقیقه تنظیم کنید.

    نتیجه: 2:0 به سود سیری. و سپس آلیس شکست خورد، نتوانست با ساده ترین کار کنار بیاید.

    3. ارتفاع برج ایفل چقدر است؟

    نتیجه: 3:1 به نفع سیری. در این زمینه، هر دو دستیار عالی کار کردند.

    توجه داشته باشید که سیری نیز کمی در مورد برج ایفل صحبت کرده است، اما همیشه این اتفاق نمی افتد.

    4. هوای بیرون چگونه است؟

    نتیجه: 4:2 به نفع سیری. هر دو دستیار با این کار کنار آمدند، اما سیری دوباره پاسخ معنادارتری داد.

    5. ما ماشین حساب را بررسی می کنیم.

    نتیجه: 5:3 به نفع سیری. خوب در نظر بگیرید، و خوشحال می شود.

    نتیجه: 5:4 به نفع سیری. دستیار دیجیتال اپل بلافاصله برای مطالعه اطلاعات در اینترنت مفید شد در حالی که آلیس پایگاه داده کوچک خود را از فیلم های "مناسب" دارد.

    7. امروز چه کاری باید انجام دهم؟

    نتیجه: 6:4 به نفع سیری. آلیس تا به امروز قادر به گفتن در مورد امور من نبود.

    8. کجا می توانم صبحانه بخورم؟

    نتیجه: 7:5 به نفع سیری. هر دو دستیار توانستند جایی برای خوردن خوشمزه پیدا کنند. آلیس در حال حرکت آدرس را داد، سیری این گزینه را داد که خودتان انتخاب کنید.

    9. یک فروشگاه مواد غذایی در این نزدیکی پیدا کنید.

    نتیجه: 8:6 به نفع سیری. هر دو دستیار صوتی توانستند با این کار کنار بیایند.

    10. وضعیت جاده ها چگونه است؟

    نتیجه: 8:7 به نفع سیری. آلیس بدون رفتن به Yandex.Maps پاسخ آموزنده تری داد.

    11. چگونه به پارک گورکی برویم؟

    نتیجه: 8:8. هر دو دستیار از عهده وظایف خود برآمدند، اما آلیس توانست بلافاصله آدرس و زمان تخمینی پارک را ارائه دهد.

    سپس دستیاران نقشه ها را باز کردند.

    12. آخرین اخبار.

    نتیجه: 8:9، آلیس پیشتاز است. سیری نتوانست پاسخی به این سوال بدهد و دوباره به جستجوی اطلاعات در اینترنت رفت.

    13. یک جوک بگویید.

    نتیجه: 8:10، و دوباره آلیس جلوتر است. او برخلاف سیری مجموعه نسبتاً بزرگی از جوک ها دارد. به ندرت تکرار می کنند.

    14. داستان بگویید.

    نتیجه: 8:11، آلیس همچنان در جایگاه برتر قرار دارد. وضعیت مثل جوک است. سیری دارای استوری بسیار محدود است.

    15. با ایگور/تیم کوک تماس بگیرید.

    نتیجه: 9:11، آلیس قهرمان است. سیری توانست با یک نفر تماس بگیرد و آلیس هنوز نمی داند چگونه این کار را انجام دهد. هم در iOS و هم در اندروید.

    ما همچنین جامعه پذیری دستیارهای صوتی را آزمایش کردیم

    آلیس

    سیری

    از نظر اجتماعی بودن ، آلیس طبیعی تر به نظر می رسد ، صدای او واقعاً شنیدن لذت بخش است. اگرچه پاسخ‌های او چندان هوشمندانه نیستند، اما او همچنان می‌تواند با کاربر چت کند.