معرفی پروژه تریلیوم ARM، شامل طراحی پردازنده‌های یادگیری ماشینی و تشخیص شئ

نمایش خبر

فهرست اخبار
تاریخ : 1396/11/27        نویسنده: مسعود بهرامی شرق
برچسب‌ها : آرم ARM ، هوش مصنوعی Artificial Intelligence ، یادگیری ماشین Machine Learning ، پردازنده Processor

واحد خبر mobile.ir : اخیرا NPUها یا "واحدهای پردازش عصبی" به موضوعی بحث‌برانگیز تبدیل شده و مقالات فراوانی در این زمینه به نگارش درآمده‌اند. واحد پردازش عصبی می‌تواند استنتاج یادگیری ماشینی را – بدون استفاده از رایانش ابری – روی اسمارت‌فون‌ها پیاده‌سازی کند. هواوی با تولید چیپ‌ست Kirin 970 (مجهز به NPU)، به پیشرفت‌های خوبی در زمینه پردازنده‌های مخصوص هوش مصنوعی دست یافت. اما کمپانی ARM – طراح اصلی پردازنده‌هایی چون Cortex-A73 و Cortex-A75 – به تازگی از طراحی پلتفرمی جدید در یادگیری ماشینی، تحت عنوان پروژه تریلیوم (Project Trillium) خبر داده است. این پروژه، از یک پردازنده یادگیری ماشینی (ML) و نسل دوم پردازنده‌های تشخیص شئ (OD) تشکیل شده که توسط نرم‌افزاری متن‌باز در زمینه شبکه‌های عصبی (NN) توسعه خواهد یافت.

Introducing ARM Trillium New Machine Learning Platform

همانطور که می‌دانید، شرکت انگلیسی ARM، هیچ چیپ‌ستی را تولید نمی‌کند بلکه در زمینه طراحی پردازنده‌ها فعالیت دارد. ARM به قدری در این کار توانمند است که ردپای معماری‌هایش عملا در همه پردازنده‌های اسمارت‌فون‌ها، دوربین‌ها و دیوایس‌های اینترنت اشیا دیده می‌شود. شاید برای‌تان جالب باشد که شرکای ARM تا کنون بیش از 125 میلیارد تراشه را بر مبنای معماری‌های ARM عرضه کرده‌اند. حال، این کمپانی قصد دارد پردازنده‌های جدیدی را در زمینه‌های یادگیری ماشینی (ML) و تشخیص شئ (OD) طراحی کند؛ پردازنده‌های ML به منظور انجام پردازش‌های کلی حوزه هوش مصنوعی و پردازنده‌های OD برای تشخیص چهره‌ها، افراد، حالت‌های آنها و ... طراحی می‌شوند.

در ابتدا به پردازنده یادگیری ماشینی می‌پردازیم. این پردازنده – با طراحی جدید و متفاوت از اجزای قبلی ARM – برای عملکرد و کارایی بالا طراحی شده است. به گفته ARM، عملکرد این پردازنده در استنتاج (Inference)، در مقایسه با CPUها، GPUها و DSPها، افزایش یافته که این امر با استفاده از شبکه‌های عصبی از پیش آموزش دیده (pre-trained neural networks) تحقق می‌یابد. ARM همواره از نرم‌افزارهای متن‌باز پشتیبانی کرده و پروژه تریلیوم نیز از طریق نرم‌افزار متن‌باز اجرا خواهد شد.

Introducing ARM Trillium New Machine Learning Platform

اگر با مفاهیمی چون یادگیری ماشینی و شبکه‌های عصبی آشنایی ندارید، به توضیحات زیر توجه کنید: شبکه‌های عصبی یکی از چندین تکنیک متفاوتی‌ به حساب می‌آید که در یادگیری ماشینی از آن استفاده می‌شود تا شناسایی اشیا در تصاویر، کلام یا هر چیز دیگر را به کامپیوتر آموزش دهد. یک شبکه عصبی برای شناسایی اشیا، بایستی آموزش ببیند. به این ترتیب که ابتدا اشیای نمونه (تصاویر، صداها و ...) به همراه طبقه‌بندی درست آنها، به شبکه وارد می‌شوند. سپس شبکه با استفاده از تکنیک بازخورد، آموزش می‌بیند. این روند برای تمام ورودی‌ها در "داده‌های آموزشی" تکرار می‌شود. به محض آموزش دیدن، شبکه قادر است خروجی مناسب را ارائه دهد، حتی زمانی که ورودی‌ها قبلا دیده نشده باشند.

این فرآیند در نگاه اول ساده به نظر می‌رسد، اما در عین حال، می‌تواند بسیار پیچیده باشد. با تکمیل پروسه آموزش، شبکه عصبی به یک مدل ایستا تبدیل شده و می‌تواند برای استنتاج در میلیون‌ها دیوایس به کار گرفته شود (منظور از استنتاج، طبقه‌بندی و شناسایی ورودی‌های دیده نشده است). گفتنی‌ست، مرحله استنتاج از مرحله آموزش آسان‌تر بوده و پردازنده جدید ARM نیز در همین مرحله مورد استفاده قرار خواهد گرفت.

به گفته جم دیویس (Jem Davies)، مدیر داخلی ARM در حوزه یادگیری ماشینی، شرکت می‌توانست در طراحی این پردازنده‌ها از داشته‌های قبلی خود کمک بگیرد و به تکمیل آنها بپردازد، اما نهایتا تصمیم بر آن شد که یک طراحی کاملا جدید ارائه شود. وی می‌افزاید: «بسیاری از بخش‌های بازار ما با محدودیت انرژی مواجهند، لذا احتیاج داشتیم آن طراحی جدید کم‌مصرف و کارآمد باشد.» با وجود اینکه تیم طراح می‌توانست در این زمینه روی معماری GPUهای کنونی خود کار کرده و آن را گسترش دهد، اما به گفته دیویس، GPUها در مدیریت حافظه چندان عالی عمل نمی‌کنند.

Introducing ARM Trillium New Machine Learning Platform

نسل اول این پردازنده‌های ML، دیوایس‌های موبایل را هدف گرفته و طبق ادعای ARM، بالاترین عملکرد در میلی‌متر مربع، به این پردازنده تعلق خواهد داشت. ARM توان عملیاتی آن را (در لیتوگرافی 7 نانومتری) بیش از 4.6 تریلیون عمل در ثانیه اعلام کرده و انتظار دارد با بهینه‌سازی‌های بعدی، این عدد بالاتر هم برود. پیدا کردن تعادل مناسب بین توان و عمر باتری، بخش مهمی از عمده کار ARM بوده و البته به گفته مسئولین شرکت، تیم طراح در این زمینه به ترکیب موردنظر خود دست یافته است. البته کمیت تریلیون عملیات در ثانیه (TOPs) به تنهایی نمی‌تواند معیار خوبی برای نشان دادن قدرت یک پردازنده باشد، اما در حال حاضر – تا زمانی که صنعت بتواند معیار بهتری برای سنجش پیدا کند – گزینه مناسبی است.

می‌رسیم به دومین جزء پروژه تریلیوم یعنی پردازنده تشخیص شئ (OD). برای تقریب این مفهوم به ذهن، باید بگوییم چیزی شبیه به همان فناوری تشخیص چهره در دوربین اسمارت‌فون‌هاست، البته به مراتب پیشرفته‌تر. به گفته ARM، این پردازنده OD جدید می‌تواند عمل تشخیص افراد را (در ویدئوی فول اچ‌دی با سرعت 60 فریم در ثانیه) بدون هیچ وقفه‌ای و به شکل بی‌درنگ انجام دهد. عمل تشخیص، مواردی چون جهت چهره افراد و اینکه چه‌قدر از بدن او قابل مشاهده است را نیز در بر می‌گیرد. مثلا این پردازنده می‌تواند حالت‌های زیر را تشخیص دهد: جهت سر به سمت راست، بالاتنه به سمت بالا، کل بدن به سمت چپ و ... . به نظر می‌رسد این پردازنده، نتیجه خرید کمپانی تصویربرداری Apical توسط ARM در سال 2016 باشد. گفتنی‌ست، این نسل دوم پردازنده‌های تشخیص شئ ARM بوده و نسل اول این پردازنده‌ها در ساخت دوربین‌های هوشمند امنیتی Hive به کار گرفته شده بود.

Introducing ARM Trillium New Machine Learning Platform

ARM انتظار دارد بسیاری از کمپانی‌ها، هر دو تراشه یادگیری ماشینی و تشخیص شئ را با هم استفاده کنند. از ترکیب دو پردازنده ML و OD، سیستم قدرتمندی حاصل می‌شود که می‌تواند ابتدا شئ را تشخیص داده و سپس با استفاده از یادگیری ماشینی، آن را شناسایی کند. این بدان معناست که پردازنده ML تنها روی آن بخش از تصویر کار می‌کند که حاوی شئ دلخواه است. به عنوان مثال، اگر چنین سیستمی در اپلیکیشن دوربین پیاده‌سازی شود، ابتدا امکان تشخیص چهره افراد در فریم را فراهم می‌کند و سپس با استفاده از یادگیری ماشینی، آن چهره‌ها را شناسایی می‌کند.

Introducing ARM Trillium New Machine Learning Platform

مثالی که ARM در این زمینه بیان کرده، یک ماسک غواصی مجهز به واقعیت افزوده است که می‌تواند نام ماهی‌هایی را که در هنگام غواصی مشاهده می‌کنید، برای‌تان به نمایش بگذارد. اما مثال واقع‌گرایانه‌تر، می‌تواند راه‌کاری در اینترنت اشیا باشد که با استفاده از ویدئو، بر یک تقاطع شلوغ نظارت کرده و شما را در جریان باز یا مسدود بودن آن قرار می‌دهد. اعلام زمان مناسب برای خالی کردن سطل زباله نیز، نمونه دیگری‌ست که به نظر می رسد امروزه کاربرد فراوانی پیدا کرده است. در مجموع، فعلا موارد استفاده این نوع تراشه‌ها در عرصه موبایل چندان شناخته شده نیست، اما در حوزه دوربین و سیستم‌های نظارتی، کاربردهای فراوانی دارند.

شاید یکی از مهم‌ترین ویژگی‌های این سیستم در آن باشد که عمل استنتاج، به جای فضای ابری، در خود دیوایس و به صورت local اتفاق می‌افتد. این امر چند مزیت دارد؛ نخست آنکه موجب صرفه‌جویی در پهنای باند می‌شود (با همه‌گیر شدن این تکنولوژی‌ها، افزایش قابل‌توجهی در تبادل داده بین دیوایس و فضای ابری به منظور شناسایی، پیش‌بینی می‌شود). دوم آنکه موجب صرفه‌جویی در مصرف انرژی می‌شود (چه در گوشی و چه در اتاق سرور). علت در آن است که با این سیستم، دیگر نیازی به روشن کردن وای-فای یا اینترنت دیتای گوشی برای ارسال و دریافت داده‌ها نبوده و سرور نیز برای عمل تشخیص، مورد استفاده قرار نمی‌گیرد. مزیت سوم آن است که با انجام عمل استنتاج در خود دیوایس، نتایج سریع‌تر ارائه شده و از میزان تأخیر کاسته می‌شود. نهایتا، چهارمین فایده این سیستم، امنیت بالای آن است، چرا که دیگر نیازی به ارسال داده‌های شخصی به فضای ابری نخواهد بود.

جم دیویس ریاست بخش یادگیری ماشین و رنه هاس (Rene Haas)، رییس بخش IP Products Group در شرکت ARM، پیش‌بینی می‌کنند که بسیاری از تراشه‌های دارای پردازنده‌های فوق، در ساخت خودرو مورد استفاده قرار گیرند. در حالی‌که کمپانی Nvidia با تعبیه ابرکامپیوتر در خودروها، آنها را به خودروهای بدون راننده تبدیل می‌کند، ARM بر این باور است که در صورت وجود محدودیت‌های مکانی و حرارتی، تنها با قرار دادن این تراشه‌های جدید در یک آینه هوشمند، می‌توان عمل تشخیص اشیا را به‌خوبی انجام داد و اتومبیل را به یک وسیله نقلیه خودران تبدیل کرد. کاربرد دیگر این تراشه‌ها، به گفته ARM، در صنعت ساخت نمایشگر است. با تجهیز نمایشگر به این تراشه‌ها، می‌توان تدبیری اندیشید که ویدئوی در حال پخش، بر اساس محتوای نمایشی، تنظیم شده و کیفیت آن بهبود یابد.

اما می‌رسیم به قسمت سوم پروژه تریلیوم، یعنی بخش نرم‌افزاری آن. این بخش متشکل از کتابخانه‌ها و راه‌اندازهای نرم‌افزاری‌ست که ARM در اختیار شرکایش قرار داده تا بتوانند حداکثر استفاده و بهره‌وری را از دو پردازنده ML و OD داشته باشند. این کتابخانه‌ها و راه‌اندازها برای مهم‌ترین قالب‌های شبکه‌های عصبی بهینه‌سازی شده‌اند، از جمله TensorFlow، Caffe و رابط برنامه‌نویسی Android Neural Networks. نرم‌افزارهای موردنیاز، از روز سه‌شنبه 13 فوریه (24 بهمن) در وب‌سایت توسعه‌دهندگان ARM و همچنین در وب‌سایت Github، در اختیار توسعه‌دهندگان قرار گرفته است.

Introducing ARM Trillium New Machine Learning Platform

انتظار می‌رود طراحی پردازنده OD در سه‌ماهه نخست 2018 به دست شرکای ARM برسد. اما طراحی پایانی پردازنده ML احتمالا در نیمه سال 2018 به اتمام رسیده و پس از تحویل به شرکا (در بهترین حالت) امید است در اواسط یا اواخر سال 2019 شاهد عرضه چیپ‌ست‌های مجهز به این پردازنده باشیم.

در پایان گفتنی‌ست، اخیرا تعدادی از کمپانی‌های سازنده اسمارت‌فون در محصولات‌شان از تراشه‌های هوش مصنوعی ساخت خود استفاده می‌کنند. به عنوان نمونه می‌توان به تراشه پردازشگر تصویر Pixel Visual Core (محصول گوگل)، Neural Engine (موتور عصبی) در تراشه A11 (محصول اپل) و چیپ‌ست Kirin 970 (محصول هواوی) اشاره کرد. مشخص است که در چنین شرایطی، ARM به دنبال سهم خود از این کسب‌وکار می‌گردد.  

منبع : ARM