مقایسه میان سه دستیار صوتی هوشمند Google now، Siri و Cortana در پاسخ‌دهی به سؤالات مبتنی بر دانش

تاریخ : 1393/7/29 نویسنده: مریم رشنو
برچسب‌ها :	دستیار شخصی هوشمند Intelligent Personal Assistant ، سیری Siri ، Google Now ، کورتانا Cortana ، گوگل Google ، اپل Apple ، مایکروسافت Microsoft

واحد خبر mobile.ir : موسسه مشاوره استون تمپل (Stone Temple Consulting) نتایج تازه‌ترین پژوهش خود را در خصوص دستیارهای صوتی هوشمند منتشر کرد.

بسته به نوع گوشی که از آن استفاده می‌کنید ممکن است از دستیار صوتی هوشمند خاصی بهره ببرید. یکی از کارکردهای اصلی این اپلیکیشن‌ها آن است که تا حد امکان با سرعت به پرسش‌های کاربر پاسخ‌های مفید دهند. اما کدام یک از این برنامه‌ها عملکرد بهتری دارد؟ به تازگی موسسه مشاوره استون تمپل نتایج پژوهش خود را در این باره در تاریخ 7 اکتبر 2014 ( 15 مهر) منتشر کرده است. در این پژوهش سه دستیار صوتی هوشمند مشهور یعنی Google Now، Siri و Cortana برای انجام مقایسه برگزیده شدند. این مؤسسه برای سنجش کارایی سه اپلیکیشن فوق و مقایسه احتمال انجام صحیح درخواست کاربر 3086 پرسش واقعی و متفاوت را در برابر آنها قرار داد تا مشخص شود کدام یک بهترین عملکرد را از خود نشان می‌دهد. مطابق نتایج این بررسی دستیار هوشمند Google Now با اختلاف قابل توجهی نسبت به سایرین کارایی بهتری از خود نشان داد.

از جهت سخت‌افزاری، Cortana روی گوشی نوکیا لومیا 635 با سیستم عامل ویندوزفون، Siri روی گوشی‌های آیفون 4 اس و آیفون 5 و گوگل اپ (که برنامه Google Now جزئی از آن به شمار می‌رود) نیز روی آیفون 4 اس و آیفون 5 اجرا شد. در این طرح، اندازه‌گیری اینکه هر یک از این برنامه‌ها از چه تعداد منبع داده استفاده می‌کنند، میزان دقت نتایج حاصل از جستجو و شناسایی تمام موارد تشخیص اشتباه مد نظر قرار گرفت. البته در این مسیر مقایسه ویژگی‌های متفاوت این اپلیکیشن‌ها مورد توجه نبوده بلکه این برنامه‌ها باتوجه به میزان دانش موجود در هنگام پرسش قیاس شده‌اند. به جهت دشواری امتیازدهی، انتخاب پرسش‌ها به گونه‌ای بوده است که یک پانل دانش (knowledge panel) شکل گیرد و از این جهت پرسش‌های طرح‌شده به هیچ عنوان تصادفی نبوده‌اند. منظور از پانل دانش یا جعبه دانش (knowledge box) محتوایی است که پس از جستجوی یک عنوان به جستجوکننده ارائه می‌شود و حاوی پاسخ مستقیم به سؤال مطرح شده است.

Knowldge Box

تصویر بالا: نمونه‌ای از یک جعبه دانش (Knowldge-Box)

مطابق اعلام موسسه، منابع مورد استفاده در این آزمون بر اساس گوگل و بینگ طراحی شده است و این امر به دلیل ویژگی‌های متفاوت این دو موتور جستجو است. در واقع گوگل نه تنها از منابع زیادی برای استخراج داده استفاده می‌کند بلکه روش‌های مختلفی برای نمایش نتایج دارد. به طور مثال اگر از Google Now بپرسید ارتفاع برج ایفل چقدر است، علاوه بر پاسخ به این پرسش اسامی دیگر برج‌های بلند نیز به شما گفته خواهد شد (گوگل از اطلاعات زیادی برای گراف دانش استفاده می‌کند). این در حالی است که نتایج Siri در پاسخ به پرسش فوق بر پایه جستجویی سریع در ویکی پدیا یا ولفرام آلفا است که برج خلیفه یا امپایر استیت بیلدینگ را در نظر نمی‌گیرد. علاوه بر این، از دید مؤسسه STC نتایج اپل معمولا ضعیف است؛ گاهی اوقات پاسخ طنز به شما داده می‌شود و برخی اوقات پاسخ جدی. از سوی دیگر، با آن که Cortana از منابع مختلفی برای جستجو بهره می‌گیرد اما همیشه پاسخ صحیح را نشان نمی‌دهد. مثلا اگر بپرسید که قدمت تونل لینکلن در نیویورک چقدر است، در پاسخ اطلاعاتی راجع به آبراهام لینکلن -- شانزدهمین رئیس جمهور آمریکا -- دریافت خواهید کرد.

Siriو Cortana, and Google Now

تصویر بالا (از چپ به راست): پاسخ‌های Cortana ،Siri و Google Now به پرسش «بلندترین کوه جهان کدام کوه است؟»

بر اساس گفته‌های اریک انگ (Eric Enge) از موسسه STC، تمام پرسش‌های این آزمون حتی در زمان استفاده از موتور جستجوی گوگل و بینگ نیز براساس فرامین صوتی انجام شده است. پس از جمع‌آوری نتایج حاصل از پاسخ‌های این سه دستیار مجازی هوشمند، پاسخ های Google Now با 88% پاسخ کامل از دیگر برنامه‌ها پیشی گرفته است. این دستیار دیجیتال به 88٪ پرسش‌ها پاسخ کامل داده است، در صورتی که Siri با 53٪ و Cortana با40٪ پاسخ کامل، عملکرد ضعیف‌تری را نشان داده‌اند. در واقع آمار فوق نشان‌دهنده میزان گستردگی و کامل بودن اطلاعات ارائه‌شده به هر پرسش است که به صورت مجموع در نظر گرفته شده است. از این رو محققان STC نتیجه گرفته‌اند که توانایی گوگل برای نشان دادن اطلاعات -- از جمله جزئیات و لینک‌های تکمیلی درباره موضوعات مشابه -- بیشتر است.

Siri, Cortana,and Google Now Answer Rates

البته نکته قابل توجه در خصوص نتایج این پژوهش آن است که نمی‌توان چنین نتایجی را به طور کامل به توانایی هر یک از دستیاران هوشمند -- به ویژه در زمینه انجام وظیفه دستیاری -- منتسب کرد. در واقع در کنار درک صحیح فرمان صوتی مخاطب که سنجش آن احتمالا به روش‌های دیگری نیاز خواهد داشت، کیفیت و تنوع ‌پاسخ‌های ارائه شده تا حدود زیادی به نحوه طراحی سؤالات و ارتباط این سؤالات با بانک‌ اطلاعاتی مورد استفاده مرتبط است. از این رو این پژوهش بیش از آنکه توانایی هر یک از سه دستیار مورد اشاره را نشان دهد، بازتابی از ذهنیت طراحان سؤال و کیفیت اطلاعات موجود در بانک‌های اطلاعاتی و موتورهای جستجوی مرتبط با هر یک از سؤالات است. لذا احتمال بسیاری وجود دارد که در پژوهشی دیگر، که از زاویه‌ای متفاوت و بر مبنایی دیگر به طراحی سؤالات پرداخته باشد، نتایجی کاملا متفاوت به دنیای دیجیتال ارائه شود.

منبع : Stone Temple Consulting