پروژه مایکروسافت و اینتل برای تبدیل بدافزارها به تصویر؛ گام جدید برای حفاظت از کامپیوترها

 
 
مایکروسافت و اینتل اخیرا با یکدیگر پروژه جدیدی برای حفاظت از کامپیوترها را آغاز کرده‌اند. این پروژه «STAMINA» نام دارد و  نوع جدیدی از شناسایی و دسته‌بندی بدافزارها را ارائه می‌کند. روش جدیدی که این دو کمپانی توسعه داده‌اند، بدافزارها را به عکسی سیاه و سفید تبدیل کرده و سپس آن را اسکن و بررسی می‌کند.
 
پروژه STAMINA (سرواژه STAtic Malware-as-Image Network Analysis) به معنی «آنالیز شبکه‌ای ثابت بدافزار به عنوان عکس» به کمک تکنیک جدیدی، بدافزارها را به عکس سیاه و سفید تبدیل می‌کند و سپس با اسکن تصویر، به دنبال بافت‌ها و ساختارهای الگویی مشخص و مختص به هر بدافزار می‌گردد. تیم تحقیقات مایکروسافت و اینتل می‌گویند تمامی فرایندهای تشخیص بدافزار، تنها در چند مرحله ساده صورت می‌گیرد.
 
اولین گام دریافت یک فایل و تبدیل سیستم باینری (دودویی) آن به جریانی از داده‌های پیکسلی است. محققین سپس این جریان پیکسلی تک بعدی را به یک تصویر دو بعدی تبدیل می‌کنند تا الگوریتم‌های متداول آنالیز تصویر بتوانند آن را تحلیل کنند. عرض تصویر بر اساس حجم فایل ورودی و طبق جدول زیر انتخاب می‌شود. ارتفاع یا طول تصویر نیز به صورت پویا، متغیر خواهد بود که به کمک آن می‌توان جریان داده‌های پیکسلی را بر اساس ارزش عرض عکس، تقسیم‌بندی کرد. پس از سرهم کردن جریان داده‌های پیکسلی به یک تصویر نرمال دو بعدی، محققین تصویر نهایی را به ابعادی کوچکتر کاهش می‌دهند.

محققین دو کمپانی اینتل و مایکروسافت می‌گویند کاهش ابعاد تصویر «تاثیر منفی بر نتایج دسته‌بندی» نخواهد داشت و در اصل یک گام ضروری است تا منابع رایانشی آن‌ها با میلیاردها پیکسل سر و کار نداشته باشند، زیرا در غیر این صورت فرایند تحلیل به شدت کند پیش خواهد رفت. آن‌ها در گام بعدی عکس به دست آمده را به یک شبکه عصبی عمیق از پیش تعلیم داده شده می‌دهند تا آن را اسکن کرده و در دسته سالم یا آلوده قرار دهد.
 
مایکروسافت می‌گوید ۲.۲ میلیون نمونه آلوده فایل پرتابل قابل اجرا را در پایگاه داده این شبکه عصبی قرار داده است تا پایه و اساس تحقیقات را تشکیل دهد. آن‌ها ۶۰ درصد بدافزارهای شناخته شده را به عنوان نمونه برای آموزش شبکه عصبی عمیق، ۲۰ درصد آن را برای صحت‌سنجی این شبکه عصبی عمیق و ۲۰ درصد دیگر را برای فرایند اصلی تست استفاده کردند.

محققین این دو کمپانی در نهایت اعلام کرده‌اند که STAMINA توانسته با دقت ۹۹.۰۷ درصد و با نرخ مثبت کاذب ۲.۵۸ درصد، بدافزارها را شناسایی و دسته‌بندی کند (نرخ مثبت کاذب در این جا به این معناست که فایل‌های عادی به عنوان بدافزار شناخته شوند). محققین در رابطه با این نتیجه می‌گویند «نتایج این پروژه نشان می‌دهد که می‌توان از یادگیری انتقال عمیق برای اهداف دسته‌بندی بدافزارها استفاده کرد.»
 
البته STAMINA برای فایل‌های حجیم‌تر چندان پاسخگو نیست، زیرا محدودیت‌ها باعث می‌شوند تبدیل میلیاردها پیکسل به یک تصویر JPEG و سپس کاهش ابعاد آن، بهینه نباشد. البته احتمالا چنین چیزی از کمترین میزان اهمیت برخوردار است، زیرا محققین در ابتدا نیز این پروژه را برای فایل‌های کم‌حجم توسعه داده بودند. در نهایت انتظار می‌رود این پروژه کم کم راه خود را به نرم‌افزار دیفندر مایکروسافت باز کرده تا میلیاردها دستگاه را به لایه جدیدی از حفاظت در برابر بدافزارها تجهیز کند.