درخواست پتنت اپل برای تشخیص کلمات با استفاده از حسگرهای حرکتی – آیا Siri لب‌خوانی خواهد کرد؟

نمایش خبر

تاریخ : 1402/5/19        نویسنده: مسعود بهرامی شرق
برچسب‌ها : حق اختراع Patent ، مالکیت معنوی Intellectual Property ، اداره ثبت اختراعات و علائم تجاری آمریکا USPTO ، اپل Apple
واحد خبر mobile.ir : دستیارهای صوتی ابزارهایی کاربردی بوده و احتمالا (حداقل یک بار) از این دستیارها استفاده کرده‌اید. Siri (محصول اپل)، الکسا (محصول آمازون)، کورتانا (محصول مایکروسافت) و Google Assistant مهم‌ترین دستیارهای صوتی حال حاضر در دنیای فناوری هستند. اگر زیاد با این دستیارها سروکار دارید، احتمالا برای شما اتفاق افتاده که دستیار با گفتن یک عبارت دیگر، ناخواسته فعال شده باشد. به عنوان مثال فرض کنید در حال کار با آیفون و در حال صحبت یا دوست خود از عبارت Hey Seriously استفاده کنید و دستیار اپل آن را با Hey Siri اشتباه گرفته و فعال شود. اما طبق درخواست پتنتی که اخیرا به نام اپل ثبت شده، شاید این مشکل به‌زودی برطرف شود.

شاید دیوایس‌های اپل در آینده با استفاده از تشخیص حرکت اقدام به لب‌خوانی کرده و به این ترتیب موجب فعال شدن Siri (بدون نیاز به میکروفن) شوند. اگر سن شما به اندازه کافی زیاد باشد، ممکن است با شنیدن این مطلب، یاد فیلم «2001: ادیسه فضایی» ساخته استنلی کوبریک بیفتید؛ فیلمی که در آن یک کامپیوتر به نام HAL 9000 توانایی خارق‌العاده‌ای در تشخیص صدا داشت؛ همان چیزی که Siri هنوز نتوانسته آن را صد در صد و بی عیب و نقص به سرانجام برساند. از این رو، چنان‌چه یک جنبه دیگر مثل توانایی تشخیص حرکات دهان و سر به Siri اضافه شود، می‌تواند میزان دقت این دستیار صوتی را بالاتر ببرد.

این دقیقا همان چیزی‌ست که در متن درخواست پتنت جدید اپل به آن اشاره شده است. عنوان این درخواست پتنت Keyword Detection Using Motion Sensing (تشخیص کلمه کلیدی با استفاده از حس کردن حرکت) بوده و سازوکار مورد نظر اپل را این گونه توصیف می‌کند: « [داده] از یک سنسور حرکتی دریافت می‌شود، به عنوان مثال، ثبت حرکت یک کاربر در هنگامی که او یک ورودی گفتاری را به زبان می‌آورد.» پس از آن باید تعیین شود که آیا بخشی از این داده حرکتی با داده مرجع برای مجموعه‌ای از یک یا چند کلمه مطابقت دارد یا خیر. در صورت تطابق، Siri فرمان صوتی را اجرا خواهد کرد.

به گفته اپل، سیستم‌های کنترلی که صرفا به صدای شخص واکنش نشان می‌دهند، ممکن است دچار خطا شوند (شبیه مثالی که در مقدمه ذکر شد). این خطا ممکن است به دلیل اختلال ناشی از نویزهای محیطی و یا صدای ناخواسته یک کاربر دیگر اتفاق بیفتد. حال در این سناریوی جدید، اگر Siri توانایی لب‌خوانی داشته باشد، چنین خطاهایی رخ نخواهد داد.

این طرح جدید علاوه بر افزایش دقت Siri، یک فایده دیگر هم دارد و آن کاهش مصرف انرژی است. در حال حاضر، راه‌اندازی یک دستیار صوتی مثل Siri مستلزم آن است که میکروفن‌ها همواره فعال و آماده دریافت فرمان صوتی باشند (حتی زمانی که هیچ داده صوتی دریافت نشود). همین امر موجب مصرف انرژی و منابع پردازشی خواهد شد. اما اگر Siri به قابلیت لب‌خوانی مجهز شود، دیگر نیازی به آماده‌باش بودن میکروفن‌ها نبوده و این می‌تواند در نهایت به کاهش مصرف باتری ختم شود.

نکته جالب دیگری نیز در درخواست پتنت اپل ذکر شده که شاید از دید اکثر افراد مغفول بماند: زمانی که شخصی در حال صحبت کردن است، دهان، سر، صورت و گردن او حرکات و ارتعاشاتی را ایجاد می‌کنند. حسگرهای حرکتی مثل شتاب‌سنج و ژیروسکوپ می‌توانند این حرکات را تشخیص دهند. این حسگرهای حرکتی برخلاف سنسورهای صوتی (مثل میکروفن) انرژی کمتری مصرف می‌کنند و این باز هم گام دیگری در جهت کاهش مصرف و افزایش عمر باتری خواهد بود.

یک نکته مهم را نباید فراموش کنیم. زمانی که کاربر عبارات ساده (مثل Siri) یا فرمان‌های متداول (مثل Next track) را به کار می‌برد، تشخیص حرکت و لب‌خوانی برای Siri چندان دشوار نیست. اما وقتی فرمان صوتی کمی از فرمان‌های متداول فاصله می‌گیرد، بعید است قابلیت تشخیص حرکت بتواند به درستی کار کند. اما حداقل فایده این قابلیت در آنجاست که به محض تشخیص عبارات ساده (مثل Hey Siri)، میکروفن دستگاه فعال شده و آماده شنیدن ادامه فرمان صوتی کاربر خواهد بود.

در پایان لازم به ذکر است، اپل مشخص نکرده که کدام دیوایس‌های این شرکت می‌توانند از قابلیت لب‌خوانی بهره‌مند شوند، اما یکی از بهترین گزینه‌ها برای استفاده از این قابلیت، هدست Apple Vision Pro خواهد بود.

منبع : USPTO


خرید گوشی موبایل سامسونگ گلکسی آ 55 از دیجی کالا