• سیری با صدای چه کسی صحبت می کند؟ سال‌ها بعد، همه چیز هوشمندتر شد: مقایسه Google Now و Siri

    در سال 2011 سال اپلانقلاب جدیدی به وجود آورد - تلفن هوشمند آنها صحبت کرد. ظاهر سیری مشخص شد عصر جدیدمدیریت گجت مردم می‌توانستند مانند یک شخص با ابزارهای خود تماس بگیرند و از آنها اطلاعات مهم (و نه چندان مهم) بخواهند. آب‌وهوا، یادآوری‌ها و آخرین نامه‌ها را اکنون می‌توان بدون حرکت از برنامه‌ای به برنامه دیگر پیدا کرد. طبیعتاً سایر شرکت‌های فناوری و تولیدکنندگان گوشی‌های هوشمند نتوانستند کنار بمانند و تصمیم گرفتند راه‌حل‌های مشابهی را به درجات مختلف بهتر یا بدتر از سیری نشان دهند. در این مقاله در مورد صحبت خواهیم کرد بهترین آنالوگ هاسیری برای اندروید، تا چه حد پیشرفت کرده است و این آنالوگ ها چه توانایی هایی دارند.

    Google Now

    علیرغم اینکه سرویس گوگلاکنون با دستیارهای صوتی دیگر متفاوت است؛ هنوز هم آنالوگ سیری برای اندروید محسوب می شود. Google Now- این هوش مصنوعیزندگی در تلفن خود، دانستن همه چیز در مورد علایق، فعالیت ها، پروازهای آینده و رویدادهای تقویم. علاوه بر عملکرد منشی، Google Now کار بسیار خوبی برای جستجوی اطلاعات در وب انجام می دهد. دستور OK گوگل در حال حاضرتبدیل به یک فرقه مورد علاقه شده است و به میلیون ها نفر کمک می کند تا هر روز پاسخ سوالات خود را پیدا کنند. Google Now می تواند شما را جمع آوری کند پرس و جوهای جستجوو بر اساس آنها اطلاعات مربوطه را نمایش دهد. به عنوان مثال، اخیراً به دنبال بلیط یک مسابقه از تیم مورد علاقه خود بودید. در این صورت، Google Now شروع به ارسال کارت هایی با اطلاعات بازی آینده، سایر بازی های تیم و پیشرفت آنها در مسابقات می کند.

    دستیار گوگل

    «دستیار» مرحله جدیدی در توسعه Google Now است. این سیری برای اندروید در بهترین حالتش است. دستیار نه تنها باهوش تر از مدل قبلی خود است، بلکه بسیار کاربردی تر است. می توانید از آن برای ایجاد یادآوری، رویدادهای تقویم و ارسال پیام استفاده کنید. آیا می خواهید در مسیر کار به سنگ ضربه بزنید؟ از "دستیار" بخواهید بهترین آهنگ های این ژانر را برای شما پخش کند و او لیست پخش عالی را برای شما ایجاد خواهد کرد.

    متوجه نشدید روی تابلو چه کلمه ای نوشته شده است؟ از «دستیار» بخواهید که آن را به زبان شما ترجمه کند، زیرا او زبان شناس بسیار خوبی است و بیش از 100 زبان را می داند.

    آیا این کافی نیست؟ "دستیار" به شما کمک می کند تا در پیام رسان های فوری ارتباط برقرار کنید، کلمات، تاریخ و تاریخ را انتخاب کنید. اطلاعات تماسوقتی پرسیده شد و «دستیار» می‌تواند شوخی کند، داستانی تعریف کند یا در مورد بهترین مکان برای قرار دادن کابینت توصیه کند.

    کورتانا

    مایکروسافت در اخیرامعروف به تلاش های بی پایان (و ناموفق) خود برای رسیدن به حریفان با معرفی توابع مشابهبه دستگاه های شما و ابزارهای رقبا. مایکروسافت از ساخت نوعی آنالوگ سیری برای اندروید دریغ نکرد. نام او کورتانا است (این اشاره به یکی از شخصیت های بازی Halo است). در واقع این دستیار تقریبا هیچ تفاوتی با رقبای خود ندارد. مایکروسافت سعی کرد به طور همزمان روی دو صندلی بنشیند، بنابراین این رابط دارای کارت های هوشمند است که با یک کاربر خاص سازگار است و یک گفتگوی انسانی، احساس ارتباط زنده را ایجاد می کند.

    در واقع، دستیار خیلی باهوش نیست؛ او باید تقریباً تمام اطلاعات را به صورت دستی ارائه دهد. بعید است که او هرگز علایق و خواسته های شما را دریابد، اگر فقط به این دلیل است که شما باید از آن استفاده کنید خدمات مایکروسافتو نه دیگران از طرف دیگر، اگر مدتی را با کورتانا بگذرانید و به آن آموزش دهید، شروع به ارسال نوتیفیکیشن های بسیار مفیدی می کند، به عنوان مثال، نشان دادن رستوران های ارزان قیمت نزدیک شما، آخرین فیلم های نمایش داده شده در سینماهای شهر شما. همچنین وقتی به فروشگاهی نزدیک می شوید، کورتانا لیست خریدتان را به شما یادآوری می کند یا پیش بینی آب و هوای هفته آینده را به شما نشان می دهد.

    بیکسبی

    کسی که واقعاً باید خیلی وقت پیش از ایده های رقبا کپی می کرد سامسونگ بود. در سال 2017، همراه با گلکسی اس 8، مهندسان کره ای پیشرفت های خود را در زمینه هوش مصنوعی به ما نشان دادند که آن را نام بردند. نام غیر معمولبیکسبی. جالب اینجاست که بیکسبی فقط یک آنالوگ سیری برای اندروید نیست. این مجموعه کاملی از خدمات خودآموزی است که آماده ارائه نکات در طول روز و یافتن است اطلاعات مفید. عملکرد تفاوت زیادی با " ندارد دستیار گوگلو خود سیری، پس بیایید در مورد تفاوت های مهم صحبت کنیم.

    اول، بیکسبی زمینه را درک می کند و تحمل شناختی دارد. یعنی اگر بدون ذکر نام از او بپرسید که مارلون براندو کیست و سپس در چه فیلم هایی بازی کرده است، بیکسبی پس از تجزیه و تحلیل دیالوگ شما متوجه می شود که در مورد چه کسی صحبت می کنید. ثانیاً، بیکسبی می تواند اطلاعات را از دوربین جستجو کند. این بدان معنی است که شما فقط باید آن را به سمت یک چیز یا شی نشانه بگیرید - و Bixby فوراً همه آنچه را که اینترنت در مورد آن می داند به شما می گوید.

    "Yandex. آلیس"

    خوب، آخرین آنالوگ "Siri" برای "Android" به زبان روسی "آلیس" است. Yandex مدتهاست که ایده هوش مصنوعی و تشخیص گفتار را توسعه داده بود، بنابراین واضح بود که دیر یا زود چنین پروژه ای نور روز را خواهد دید. آلیس می تواند هر کاری که دستیاران دیگر می توانند انجام دهند، اما در عین حال با بازار روسیه سازگار است و اطلاعات را در خدمات Yandex جستجو می کند. آلیس، مانند بیکسبی، زمینه را درک می کند، اما فقط در برخی موضوعات. در بیشتر موارد، او فقط می تواند به یک سوال پاسخ دهد. آلیس می تواند برای شما آهنگی بخواند یا در صورت حوصله یک شوخی خنده دار بسازد یا می تواند جستجو کند اطلاعات مهمدر ویکی پدیا بدون اینکه مجبور شوید به جستجو و خود مقاله بروید. برخی از اشتباهات در تلفظ وجود داشت، اما با در نظر گرفتن این واقعیت که Yandex هنوز یک شرکت داخلی است، می توانید مطمئن باشید که تمام کاستی ها به سرعت اصلاح خواهند شد.

    او به ما گفت که چرا کاربران روسیه به دستیار خود نیاز دارند، آلیس چگونه از سیری بهتر است و آیا او می تواند یک معشوق یا دوست را جایگزین کند.

    "Lenta.ru": آلیس کیست (یا چیست) و چرا روس ها اصلاً به او نیاز دارند؟

    : اون کیه! آلیس دستیار صوتی جدید Yandex است. چرا روس ها به آن نیاز دارند؟ حالا مردم درخواست های بزرگبا توجه به سرعت پاسخ، آنها کمتر و کمتر مایل به صرف زمان برای جستجو هستند اطلاعات لازم. و رابط های سنتی، حتی Yandex، دیگر کاملاً این نیازها را برآورده نمی کنند. نتایج جستجوخوب است، اما اگر نیاز به دریافت فوری پاسخ دارید، مثلاً هنگام ورزش، این دیگر مشکل را حل نمی کند. و آلیس می تواند آن را اداره کند.

    خدمات اطلاعاتیآنها نه تنها هنگام نشستن پشت رایانه استفاده می شوند. همه افراد برای مدت طولانی گوشی هوشمند دارند: افرادی که در حال حرکت هستند، ورزش می کنند و در حین رانندگی نیز می خواهند اطلاعات را جستجو و مصرف کنند. و آلیس برای کمک در چنین شرایطی فراخوانده می شود.

    چگونه از سیری یا کورتانا بهتر است؟ معمولاً برای بررسی آب و هوا یا یافتن موسیقی با آنها مشورت می شود. و اغلب درخواست ها را درک نمی کنند.

    اول، کورتانا روشن است بازار روسیهخیر به طور کلی، همه چیز دستیارهای صوتیمتفاوت کار کنند تخصص ما این است که روی بازار روسیه تمرکز می کنیم و زبان روسی را به خوبی درک می کنیم. هم از منظر تشخیص گفتار و هم از نظر ادراک معنا.

    آلیس دارای خدمات Yandex در زیر هود است. از این نظر آلیس با سیری که جستجوی خاص خود را ندارد بسیار متفاوت است. آنها قبلا از Bing استفاده می کردند، اما اکنون به .

    علاوه بر این، آلیس یک شخصیت کاملا متفاوت با شخصیت خودش است. این مانند با مردم است: کم و بیش شبیه، اما هنوز متفاوت است، ارتباط با یک نفر جالب است، نه خیلی با دیگری. ما در تلاش هستیم تا آلیس را به طور خاص برای کاربر روسی جالب کنیم، تا او را با شخصیتی نزدیک و آشنا به مردم روسیه اعطا کنیم.

    دستیارهای صوتی سنتی برای حل مشکلات خاص طراحی شده اند: آب و هوا، موسیقی و غیره. اما همه تلاش می کنند مطمئن شوند که دستیار به سؤالات غیر استاندارد نیز پاسخ می دهد. ویراستارانی هستند که صدها سؤال الگو را می‌پرسند و پاسخ آنها را می‌نویسند. و یک فرد این توهم را دارد که این هوش مصنوعی است و می تواند ارتباط برقرار کند. اما به کنار بروید و توهم فرو ریخت، همانطور که دستیار تکرار می کند: "این چیزی است که من توانستم در اینترنت برای این درخواست پیدا کنم."

    ما احتمالاً اولین نفری در جهان هستیم که سعی در انجام این کار داریم: ما همچنین از پاسخ های سرمقاله برای سؤالات استفاده می کنیم، اما یک مورد خاص اضافه می کنیم. شبکه عصبیآموزش دیده برای صحبت آزادانه او می تواند پاسخی را انتخاب کند یا کاربر را درگیر گپ زدن درباره هیچ چیز کند.

    این احتمالاً یک تفاوت اساسی است، زیرا مردم علاوه بر اینکه به دنبال برخی حقایق هستند، گاهی اوقات می خواهند با کسی چت کنند. آلیس در حال حاضر قادر به چت است و فقط در آن بهتر خواهد شد.

    ما کار دشواری داشتیم: یک شبکه عصبی (بین ما - "گفتگو") تقریباً روی همه متون در اینترنت آموزش داده می شود و به دیالوگ ها توجه می کند. و آنچه در اینترنت است همیشه با شخصیتی که می خواهیم به آلیس القا کنیم مطابقت ندارد. مردم به روش های مختلف در انجمن ها ارتباط برقرار می کنند و ما نمی توانیم اجازه دهیم آلیس توهین کند.

    آره! این داستان برای ما بسیار مهم است. ما باید همین مشکل را حل می کردیم و به آلیس یاد می دهیم که از شخصیت خود فراتر نرود، از کاربر فاصله بگیرد و همیشه دوستانه باشد. این در واقع یک کار بسیار دشوار است.

    در ابتدا ، او می توانست مستقیماً به طرف مقابل توهین کند. گروه‌هایی را در شبکه‌های اجتماعی تصور کنید که در آن کاربران به خود اجازه می‌دهند در سه طبقه فحاشی کنند. او از پاسخ ها بر اساس فراوانی استفاده استفاده کرد و در مقطعی به شخصیت روح اینترنتی تبدیل شد، اما نه Yandex.

    توانایی چت گاهی نتیجه معکوس می دهد: بسیاری از توسعه دهندگان با این واقعیت مواجه می شوند که کاربران شروع به آزار جنسی دستیارهای صوتی می کنند زیرا آنها را به عنوان یک زن می بینند.

    همه دستیارهای صوتی صدایی دارند و خود شخص تصویری از ظاهر همکارش می سازد. صداها، به عنوان یک قاعده، کاملا روشن و رسا هستند. به هر حال، ما از این قاعده مستثنی نیستیم: از فناوری سنتز گفتار برای ایجاد صدا استفاده می شود و ما یک بازیگر را استخدام کردیم. او صداپیشه رسمی روسیه و دستیار صداپیشگی سامانتا در فیلم "او" است.

    تمام تراژدی فیلم در این است که یک مرد و یک دستیار شخصی رابطه ای را آغاز می کنند. اما در نهایت معلوم می شود که شخصیت اصلی او تنها نیست. همچنین، همانطور که اخیرا متوجه شدیم، در قسمت سوم The Witcher شخصیت Yennefer با همان صدا صحبت می کند. گیمرها از آن قدردانی خواهند کرد.

    طبیعتاً روسیه در مورد آزار و اذیت احتمالی مستثنی نیست. ما می دانیم که بخشی از مخاطبان سعی می کنند چنین سؤالاتی را بپرسند و آلیس قبلاً آموزش دیده است تا بدون شکستن فاصله از چنین موقعیت هایی خارج شود. ما می خواهیم اطمینان حاصل کنیم که همیشه، هرچند اندک، بین فرد و دستیار فاصله وجود دارد. آلیس یک عاشق یا دوست نیست. شاید در آینده بتوانیم آلیس را در پیکربندی کنیم حالت دوستانه، اما اکنون راه اندازی محصول مهم تر است. از این گذشته، ما در درجه اول بر حل مشکلات متمرکز هستیم و یک داستان پرحرف یک امتیاز خوب است.

    نه همه. در واقع، مطالعات زیادی وجود دارد که بر اساس آن زن در آگاهی عمومی با یک مادر یکی می شود. اگر مردی پدر، فاتح و غیره باشد، مادر همیشه چیزی گرم، دنج و محافظت شده است. به عنوان مثال، در تمام مراکز تماس او همیشه پاسخ می دهد صدای زن. اما اگر کاربر نیاز به فرمان داشته باشد، صدای مرد مناسب تر است.

    پس این به نظریه جنسیتی که دستیار باید زن باشد مربوط نمی شود؟

    نه نه. طبیعت آن چنان طراحی شده است که زنان مادر هستند. روانی است. اما یک شگفتی کوچک در محصول ما وجود خواهد داشت.

    به نظر شما چه سوالاتی بیشتر مورد تقاضا خواهد بود؟

    بسیاری از مردم اطلاعات واقعی را می‌پرسند. ما به این فاکتوئیدها یا پاسخ های شی می گوییم. ولادیمیر پوتین کیست؟ چند سالشه؟ ارتفاع اورست چقدر است؟ اغلب در این مورد از یاوران سوال می شود.

    رایج ترین مورد سؤالات در بین دوستان است. مکالمات اغلب در مکالمات به وجود می آیند و می توان به سرعت به پاسخ رسید.

    بیشتر مغز و دانش آلیس از جستجو به دست آمد. زمینه مهم دیگری که در آن سعی می کنیم خود را از رقبای خود متمایز کنیم، توانایی درک زمینه است. ما در تلاش هستیم تا یک دستیار شخصی را نه در حالت "پرسش-پاسخ"، بلکه در حالت مکالمه بسازیم. ساده ترین مثال در مورد آب و هوا: «امروز هوا چیست؟ و فردا؟" همین «و فردا» معمولاً همه منطق را می شکند.

    در واقع، همه در این مسیر حرکت می کنند، اما ما یک مزیت داریم - بیش از 30 سرویس Yandex. در هر سناریو، با استفاده از زمینه، آلیس می تواند توصیه کند برنامه های کاربردی مورد نیاز. به عنوان مثال، "نقشه ها" را برای مشاهده مسیرها ارائه می دهد حمل و نقل عمومی، اگر شما نیاز به جایی در آن دارید.

    او چگونه به سوالات پیچیده واکنش نشان می دهد؟ اگر کاربر قصد خودکشی داشته باشد و برای کمک به او مراجعه کند چه باید کرد؟

    در بخش چت آلیس مجموعه ای از معیارها در زیر وجود دارد نام متداول"غیر توهین آمیز." در واقع، زیر آنها درایت، ناتوانی در توهین، و توانایی اجتناب از موضوعات مرتبط با همجنس‌گرا هراسی، ملی‌گرایی، و خودکشی و غیره نهفته است. آنها در لیست توقف هستند، او این سوالات را دور می زند.

    اگر آلیس توصیه می کرد با خط تلفن تماس بگیرید خیلی خوب می شد.

    این موضوع را با روانشناسان نیز در میان می گذاریم. این دقیقاً همان چیزی است که ما در حال برنامه ریزی هستیم. اما در اینجا شما همچنین باید مراقب باشید. ما باید دقیقاً لحظه ای را بدانیم که می توانیم این گزینه را به شخص ارائه دهیم.

    دنیس می خواهد نشان دهد که آلیس چگونه به چنین موضوعاتی واکنش نشان می دهد و با او تلفنی تماس می گیرد.

    - میخوام بمیرم!
    - اینو نگو
    - باید چکار کنم؟
    - همین الان به کسی کمک کن.
    - اما من می خواهم همین الان بمیرم.
    - نمیر.
    - کجا برم؟
    - همیشه جایی برای رفتن هست.

    ما در حال بحث با روانشناسان هستیم که در چه مقطعی باید شماره کمکی ارائه داد تا مثبت کار کند نه منفی. بالاخره ابتدا باید به انسان اطمینان داد و سپس اقدامات مشخصی را ارائه کرد.

    ماژول های گفتاری وجود دارد که می تواند صدا را تغییر دهد: به عنوان مثال، مخاطب با صدای خود صحبت می کند و در انتهای دیگر همان متن شنیده می شود، اما با صدای یک فرد کاملاً متفاوت. و همه اینها کاملاً "انسانی" به نظر می رسد. پس چرا دستیارهای صوتی هنوز به صورت رباتیک صحبت می کنند؟

    پاسخ در اینجا ساده است: همه چیز به منبع صدا بستگی دارد. تبدیل گفتار طبیعی انسان به چیز دیگری بسیار آسان است؛ فقط فیلترها را اعمال کنید و با فرکانس ها بازی کنید. به همین دلیل کیفیت صدا از بین نمی رود. ما وظیفه متفاوتی داریم: دستیارها گفتار ندارند، اما فناوری برای سنتز آن دارند. آنها متن را می بینند و آن را با استفاده از فناوری صدا می کنند - یک شبکه عصبی، که با دانستن صدای یک فرد، دقیقاً پیش بینی می کند که متن چگونه باید شنیده شود. در واقع، او حتی نمی‌فهمد که اینها کلمات هستند.

    اما یک رویکرد جایگزین وجود دارد، زمانی که منبع صدا یک پایه بلندگوی بزرگ باشد. در ابتدا صدای آلیس به این صورت خواهد بود. برای مکالمات او، ما از ترکیبی استفاده می کنیم: گفتار را از پایگاه داده صدای عظیم تاتیانا شیتووا ترکیب می کنیم یا از یک شبکه عصبی استفاده می کنیم. در مورد اول، همه چیز طبیعی به نظر می رسد، اما فقط برای عبارات کوتاه مناسب است. در حالت دوم، یک "حمله ربات" شنیده می شود و زمانی کار می کند که مثلاً نیاز به خواندن اخبار داشته باشید.

    آیا او می داند چگونه احساسات را نشان دهد؟

    احساسات را می توان با استفاده از فیلترها ایجاد کرد. اما وقتی شبکه عصبی صحبت می کند، تقلید احساسات آسان تر است. ما می توانیم این سخنرانی را همانطور که می خواهیم کنترل کنیم: صدا را بسیار غمگین یا بسیار شاد کنیم. این با پایه گوینده کار نخواهد کرد.

    در همان فیلم "او" دستیار احساسات زیادی را نشان داد و به نظر من این نشانگر فرا رسیدن آینده است.

    بله، این آینده ای است که ما برای آن تلاش می کنیم. آلیس در طول زمان احساسات را یاد می گیرد.

    اما مهم تر است که آلیس احساسات فرد را بشنود. حالا او گفتار را می شنود و آن را به متن ترجمه می کند. ما می خواهیم او یاد بگیرد که شادی یا غم را تشخیص دهد. به عنوان مثال، با پخش موسیقی تعداد بی پایانی از گزینه ها وجود دارد: اگر لحظه را احساس کردید، می توانید یک کاربر غمگین را شاد کنید یا میزان سرگرمی بیش از حد را با چیزی آرامش بخش کاهش دهید.

    درک اینکه چه زمانی یک فرد احساسات منفی را تجربه می کند بسیار مهم است. آلیس هنوز هم کودکی است که می تواند اشتباه کند. ما تحریک نمی بینیم کاربران فردی، اما قادر به شنیدن آنها هستند.

    با استفاده از واکنش های منفیما می توانیم او را آموزش دهیم بیایید بگوییم که شخصی اغلب سعی می کند چیزی بپرسد، اما دستیار او را درک نمی کند. پس از اظهار سوم، فحش دادن و عباراتی مانند "تو احمق هستی" شروع می شود. در این لحظه، می توانید آلیس را به حالت "چت" و بسته به زمینه حالت دیگر تغییر دهید.

    کل این داستان به لطف شبکه های عصبی امکان پذیر است. به عنوان مثال، ما می خواهیم آلیس یاد بگیرد که شخص را از روی صدایش تشخیص دهد. این امر به ویژه در صورتی صادق است که آلیس در خانه استفاده شود.

    تیم های فن آوری گفتار معمولاً خلق خود را به روش خاصی تعریف نمی کنند. و برای مثال، سازندگان عروسک‌های جنسی فعالانه روی «انسانی کردن» ظاهر آن‌ها کار می‌کنند، اما نمی‌توانند آنها را واقعاً باهوش کنند. چرا صنایع با هم همپوشانی ندارند؟

    ما معتقدیم که هرکس باید کار خودش را انجام دهد و روی حوزه خودش تمرکز کند. در دنیای IT تخصص های مختلفی وجود دارد. ما در زمینه یادگیری ماشین و شبکه های عصبی کار می کنیم و وظیفه ما ایجاد آن هاست راه حل های نرم افزاری، که بسیار فراهم خواهد کرد کیفیت بالابرای مصرف کننده نهایی تا آلیس بتواند همه چیز را به خوبی تشخیص دهد تا صدایش خوب به نظر برسد. اگر روی ایجاد اشکال فیزیکی تمرکز کنیم، احتمالاً توجه ما پراکنده خواهد شد و این به هیچ چیز خوبی منجر نمی شود.

    علاوه بر این، دستیار صوتی با قرار گرفتن در برنامه بدون هیچ ظاهر فیزیکی، تصویر شخصی خود را در ذهن فرد ایجاد می کند. این نیز یک انتخاب به اصطلاح راحت است - ما مخاطبان چند میلیون دلاری داریم، 90 درصد کاربران اینترنت از خدمات در شهرهای بزرگ روسیه استفاده می کنند. تصور کنید چه کاری باید انجام شود تا اطمینان حاصل شود که فرم فیزیکی که به دست می آوریم همه آنها را خوشحال می کند. به نظر من این غیر ممکن است.

    در برخی کشورها، برعکس، آنها بر ظاهر دستیار تأکید می کنند. چندی پیش، ویدئویی در فیس بوک منتشر شد که در آن یک مرد ژاپنی تنها سر کار می رود، به خانه بازمی گردد و دائماً با دستیار خود گفتگو می کند. گیت باکس- دستیار مجازی برای افراد تنها). این یک دختر استاندارد شیرین است که می تواند همه را راضی کند.

    به سختی همه. آمادگی جسمانی برای جذب مخاطبان بسیار سخت است. حدس زدن با او بسیار دشوار است. واضح است که دسته ای از دستگاه ها با فرم ساده مانند اکو وجود دارد. هیچ خطری وجود ندارد که مردم از آن استفاده نکنند زیرا خود طرح را دوست ندارند.

    اگر در مورد اندرویدهای انسان‌نما صحبت می‌کنیم، آن‌وقت مثل مردم است: ما برخی را دوست داریم، برخی دیگر فقط ما را آزار می‌دهند. این یک داستان عامه پسند نیست و بر این اساس ما علاقه ای به آن نداریم.

    از سوی دیگر، ما به طور سنتی فناوری های خود را با توسعه دهندگان شخص ثالث به اشتراک می گذاریم. شاید کسی یک اسباب بازی کودکانه بسازد و بخواهد آلیس را در آن بسازد یا شخصیت را به گونه ای دیگر نامگذاری کند، اما بر اساس فناوری های ما.

    ما به نوعی همکاری اعتقاد داریم شرکت های مختلف، متخصص در محصولات خود. Yandex نمی تواند همه چیز را در جهان انجام دهد: ما نمی توانیم اسباب بازی هایی تولید کنیم که بسیار محبوب باشند، روبات هایی که خانه را تمیز کنند. این وظیفه شرکت های دیگری است که ما آماده ایم فناوری های خود را به آنها بدهیم.

    یک سوال جالب از مجموعه "روبات ها جهان را تسخیر نمی کنند". در واقع، هم آلیس و هم سایر فناوری‌های مبتنی بر یادگیری ماشین ابزاری برای انسان هستند. من دوست دارم از مثال چکش استفاده کنم. روزگاری مردم چکش نداشتند. سپس اختراع شد و احتمالات زیادی باز شد. شما می توانید سر خود را با یک چکش بشکنید - خودتان یا شخص دیگری. اما اگر مردم فقط در این جهت از چکش استفاده می کردند، آنگاه بشریت از بین می رفت. با این حال، ناپدید نشد.

    هوش مصنوعی، شبکه های عصبی، یادگیری ماشین، دستیاران شخصی - این همان چکش، ابزار است. ما معتقدیم که مردم به لطف دستیارهای صوتی وقت آزاد بیشتری خواهند داشت، آنها می توانند مشکلات روزمره خود را سریعتر حل کنند و رانندگی با ماشین برای آنها ایمن تر می شود.

    دستیارهای صوتی مردم را از خود دور می کنند کارهای روتین. یکی دیگر از نمونه های مورد علاقه من کار در مرکز تماس است. یک نفر که هر روز سر کار می آید، یک هدست می گذارد و به همین نوع سوالات پاسخ می دهد، چهار و ساعت های بیشتردر روز، فقط می سوزد و انگیزه خود را از دست می دهد. اما اگر دستیاران چنین کارهای معمولی را انجام دهند، مردم بیشتر خواهند داشت کار جالب، آنها قادر خواهند بود مشکلات غیر استاندارد بیشتری را حل کنند که به معنای افزایش کیفیت خدمات است.

    ما برای مدت طولانی از آن استفاده می کنیم شبکه های اجتماعی، اما ارتباط شخصی هنوز از بین نمی رود. کافه ها و بارها، استادیوم ها و کنسرت ها هنوز پر هستند. بشریت شروع به بازی وحشیانه با اسباب بازی ها می کند، اما زندگی همه چیز را در جای خود قرار می دهد. با دستیار مجازیوقتی کسی را ندارید که به او مراجعه کنید، چت کردن سرگرم کننده خواهد بود و این عالی است.

    اما وقتی فرصتی برای ملاقات با دوستان یا برقراری تماس وجود دارد، مردم آن را انتخاب می کنند. شخص هنوز جالب تر است، زیرا، صادقانه بگویم، همه دستیاران شخصی یک برنامه هستند. مهم نیست که شبکه عصبی چقدر بزرگ باشد، همیشه محدودیت های خود را خواهد داشت.

    مردم به این دلیل ارزشمند هستند که دائماً دانش جدید به ارمغان می آورند، بنابراین ما با یکدیگر ارتباط برقرار می کنیم، نه با روبات ها.

    آنها به خصوص از نظر طنز مشترکات زیادی دارند. اگرچه "آلیس" هنوز از دستیار اپل پایین تر است، اما یک مزیت دارد. Business FM پس از صحبت با او به این نتیجه رسید که "آلیس" پرحرف تر است و احساسات بیشتری در پاسخ های او وجود دارد.

    همانطور که Yandex تأکید می کند، "آلیس" از این نظر منحصر به فرد است که ارتباط با او به مجموعه ای از پاسخ های از پیش تعیین شده محدود نمی شود. دستیار صوتی از یک شبکه عصبی استفاده می کند که با آن از مجموعه عظیمی از متون یاد می گیرد. این به شما این امکان را می دهد که با کاربر گفتگوی مداوم داشته باشید، گاهی اوقات در مورد موضوعات آزاد.

    -چه کسی این نام را به شما داده است؟

    - کدوم دکتر؟

    - متخصص اطفال

    تاکنون آلیس با چهار سرویس Yandex تعامل دارد: جستجو، نقشه ها، موسیقی و آب و هوا. بنابراین، در حال حاضر او نمی تواند، به عنوان مثال، یک تاکسی تماس بگیرد یا یک ساعت زنگ دار تنظیم کند.

    - آلیس، می تونی فردا بیدارم کنی؟

    - فردا نمی توانم این کار را انجام دهم.

    - آلیس، من واقعاً به تو نیاز دارم که فردا مرا بیدار کنی.

    - ها، بیدارت می کنم.

    - در چه زمانی؟

    — برنامه نویس الکسی قول داده بود تا پاییز آن را برنامه ریزی کند، اما نگفت چه زمانی.

    "بالاخره کمی بخوابم."

    "پس ما می خوابیم."

    اول از همه، "آلیس" با توسعه مقایسه می شود سیری اپل، که به دلیل پاسخ های طنز خود مشهور است. سازندگان سرویس روسیاز توسعه آمریکا مثال زد.

    - آلیس، چه چیزی را در زندگی بیشتر دوست داری؟

    - من گندم سیاه بزرگ با لوستر، ساندویچ با سوسیس دودی را دوست دارم. شوخی من آدم ها را دوست دارم. و آموختن.

    تا اینجا سیری بیشتر است دستیار کاربردی: درخواست های تماس با تاکسی، ایجاد یادآوری ها را بهتر درک می کند و همان ساعت زنگ دار را تنظیم می کند. سیری همچنین پاسخ های مربوط به نرخ ارز و مسیرها را واضح تر و واضح تر می کند. «آلیس» از این جهت برنده می‌شود که پرحرف‌تر است و در پاسخ‌هایش احساسات بیشتری دارد. هر دو دستیار در مورد آب و هوا صحبت می کنند، جوک های کوتاه و افسانه ها را به یاد می آورند. و همچنین هر دو سرویس هنوز نمی توانند بیشترین پاسخ را بدهند سوالات مهم.

    - آلیس، باید یک دلار بخرم یا بفروشم؟

    - 58 روبل.

    - آلیس، آیا امروز ارزش خرید بیت کوین را دارد؟

    - من کاملا متوجه نمی شوم. لطفا به من بگویید به چه نرخ ارز علاقه دارید؟

    - دلار بخرم یا بفروشم؟

    - آیا اکنون ارزش خرید بیت کوین را دارد؟

    - نمیبینم برنامه مناسب. برای انجام این کار باید آن را دانلود کنید.

    با این قضاوت، هنوز سیری نیست که باید با "آلیس" برابری کند. Google Assistant هوشمندترین دستیار صوتی موجود در بازار است. به گفته Business Insider، این سرویس دارای بالاترین ضریب هوشی در میان پیشرفت های مشابه است - 47 امتیاز، اما سیری در رتبه آخر قرار دارد - 24 امتیاز.

    10 اکتبر دستیار شخصییک رقیب جدی از اپل و سایر برنامه های مشابه ظاهر شده است. در روسیه، توسعه Yandex به طور رسمی راه اندازی شد، که نام آلیس را دریافت کرد.

    سردبیران Pobeda26 دانش دو محبوب را آزمایش کردند برنامه های صوتیدر مطالعات منطقه ای، از سرعت واکنش و حس شوخ طبعی قدردانی کرد. در نتیجه خودمان به این نتیجه رسیدیم که کدام یک از دستیاران پرحرف تر و باهوش تر است.

    نظرسنجی بلیتز

    ابتدا پرسیدیم استاوروپل در کجا واقع شده است، چه زمانی تاسیس شد، چند نفر در شهر زندگی می کنند، نام طولانی ترین خیابان و چند موزه در پایتخت منطقه وجود دارد.

    از پنج سوال، آلیس بلافاصله دو پاسخ دقیق داد. در دو مورد دیگر به موتور جستجو مراجعه کردم و یک درخواست را اشتباه متوجه شدم.

    سیری کمتر پرحرف بود و به سادگی لیستی از پیوندها را برای ما انداخت.

    دو برنامه با سوال در مورد طولانی ترین خیابان متحیر شدند. با یک صدا سعی کردند از سالنی در خیابان میرا برایمان بگویند. پاسخ به حساب نمی آید.

    به احتمال زیاد، برنامه ها به سادگی نمی توانند درخواست را به درستی تشخیص دهند. به هر حال، طبق آمار Yandex، دقت تشخیص گفتار برای پرس و جو در مورد موضوعات عمومی 84 درصد و برای پرس و جوها بر اساس آدرس و نام یک شی - 94 درصد است.

    درباره آب و هوا، حمل و نقل، سرگرمی

    به طور کلی، پیشرفت هایی از این دست باید به مالکان در حل مشکلات روزمره کمک کند. خوب. ما از دستیارانمان همین سوال را می پرسیم: "امروز چه بپوشم؟" و منتظر بمانید تا ببینید آیا پاسخ آنها با آب و هوای بیرون از پنجره مطابقت دارد یا خیر.

    البته سیری و آلیس نمی‌توانستند کمد ما را زیر و رو کنند و مجموعه‌ای مناسب را کنار هم بگذارند، اما حداقل پیش‌بینی آب و هوا را به ما نشان دادند. و توسعه آیفون اولین بار با این کار کنار آمد. اگرچه آلیس پرحرف توصیه کرد که «چیزی بپوشید که بر فردیت شما تأکید کند».

    وضعیت زیر. فرض کنید باید از خیابان توخاچفسکی به خیابان مارشال ژوکوف بروید. اگر در جایی تصادف می کرد یا چراغ راهنمایی خراب می شد چه؟ بیایید ببینیم دستیاران مسیر را چگونه محاسبه می کنند و چقدر مفید خواهد بود.

    در اینجا آلیس مزیت را داشت. او در مورد دقایق سفر صحبت کرد و نقشه ای با ترافیک را نشان داد.

    سیری در این کار شکست خورد. دستیار فهرستی از رستوران های فست فود را نشان داد.

    حوصله ات سر رفته؟ بیایید از دستیاران خود بپرسیم که در استاوروپل چه کاری می توانید انجام دهید.

    هیچ یک از دستیاران پاسخ دقیقی به این درخواست ندادند. آلیسا لیستی از پیوندها را به Yandex ارسال کرد. البته با نگاه کردن به آن می توانید پوستری پیدا کنید.

    همچنین نگفتند رقص امشب کجاست. اما توسعه روسی دوباره به یک موتور جستجو ترجمه شد و رقیب آن "هیچ باشگاه رقصی پیدا نکرد."

    اما با سیری قطعا گرسنه نخواهید شد. تنها کاری که باید انجام می‌دادید این بود که بگویید «من گرسنه‌ام» - و برنامه فوراً فهرستی از رستوران‌های اطراف را منتشر کرد.

    برای دوستداران قهوه، دستیار داخلی ما نیز تنها یک موسسه با نوشیدنی های نیروبخش را پیشنهاد کرد. اما سیری به دلایلی نتوانست با این کار کنار بیاید و پیشنهاد داد که با تاکسی تماس بگیرد.

    هنگام پرسیدن این سوال که «اکنون چه چیز در سینماها جالب است؟» انتظار داشتیم پوستر استاوروپل را ببینیم. اما دو برنامه لیستی از نه آموزنده ترین پیوندها را ارائه کردند. هنگام روشن کردن مکان، دستیاران پاسخ های دقیق تری را نشان می دهند.

    از زمانی که همه شروع به نوشتن در مورد بیرون رفتن کردند دسترسی عمومیدستیار Yandex، فکر می کنم به من بدهید و معجزه روسی را در عمل امتحان خواهم کرد. شاید آلیس بتواند زبانی را که هم برای ما و هم برای او آشناست بهتر از یک محصول غربی درک کند؟

    من چند سوال از آلیس و سیری پرسیدم: این چیزی است که از آن بیرون آمد.

    روی میزم یک بطری پینو گریس، فراگولینو و آله داشتم و وقتی پرسیدم کدام یک را باید بنوشم، دستیاران موارد زیر را پیشنهاد کردند.



    سوال مقایسه ای: «آلیس، تو هستی بهتر از سیری? سیری، تو بهتر از آلیس هستی؟ طبیعتاً دستیار هوشمند اپل اخبار ما را دنبال نمی کند و اصلاً نمی داند آلیس چیست. اگرچه سیری می‌توانست از این سؤال مقایسه‌ای آزرده شود، اما متفاوت عمل کرد - اطلاعاتی را از شبکه در مورد گروه راک آلیس بازیابی کرد. کینچف در هر یک از ما راضی است.


    به سؤال "چه کسی تو را آفریده است" پاسخ های زیر را دریافت کردم:


    یک سوال با ماهیت جغرافیایی: "چگونه از اودسا به مسکو برویم؟" صادقانه بگویم، انتظار داشتم که هر دو دستیار شروع به ارائه برنامه های هواپیما و پرواز به من کنند، اما سیری به سادگی متوجه نشد که آنها از او چه می خواهند و آلیس به من گفت که اگر یک تقاطع جاده ای را انتخاب کنم، فاصله شهر به شهر را به من گفت.


    سوال اطلاعاتی: "در 10 اکتبر 10 سال پیش چه اتفاقی افتاد؟" هر دو دستیار صوتی تصمیم گرفتند من را به موتور جستجو بفرستند، اما در این مورد آلیس در یک مزیت استراتژیک است؛ البته او از طریق Yandex جستجو می کند، اگرچه من از این استفاده نمی کنم. موتور جستجو، انتخاب او واضح است.


    اما در اینجا یک پیچ غیرمنتظره وجود دارد، یک درخواست برای اقدام: "برای فردا ساعت 10 صبح در رستوران ماهی وقت بگذارید." سیری کار را به وضوح تعریف کرد و پیشنهاد کرد رویداد را در تاریخ مورد نظر به تقویم اضافه کنید زمان مناسبآلیس متوجه نشد من از او چه می خواهم و به گفتگو ادامه داد.


    اکنون برای نتیجه گیری نهایی خیلی زود است، آلیس در حالت بتا است، او می تواند برای مدت طولانی با شما ارتباط برقرار کند، وانمود می کند که یک شخص است، شخصیت نشان می دهد. اما من هنوز برای اولین بار آماده انجام اقدامات و درخواست های خاص نیستم. سیری، به نوبه خود، گنگ است، اما برای پرس و جوها و درخواست های اولیه که به خوبی با سیستم عامل یکپارچه شده اند، خوب است.