پروژه مایکروسافت و اینتل برای تبدیل بدافزارها به تصویر؛ گام جدید برای حفاظت از کامپیوترها
مایکروسافت و اینتل اخیرا با یکدیگر پروژه جدیدی برای حفاظت از کامپیوترها را آغاز کردهاند. این پروژه «STAMINA» نام دارد و نوع جدیدی از شناسایی و دستهبندی بدافزارها را ارائه میکند. روش جدیدی که این دو کمپانی توسعه دادهاند، بدافزارها را به عکسی سیاه و سفید تبدیل کرده و سپس آن را اسکن و بررسی میکند.
پروژه STAMINA (سرواژه STAtic Malware-as-Image Network Analysis) به معنی «آنالیز شبکهای ثابت بدافزار به عنوان عکس» به کمک تکنیک جدیدی، بدافزارها را به عکس سیاه و سفید تبدیل میکند و سپس با اسکن تصویر، به دنبال بافتها و ساختارهای الگویی مشخص و مختص به هر بدافزار میگردد. تیم تحقیقات مایکروسافت و اینتل میگویند تمامی فرایندهای تشخیص بدافزار، تنها در چند مرحله ساده صورت میگیرد.
اولین گام دریافت یک فایل و تبدیل سیستم باینری (دودویی) آن به جریانی از دادههای پیکسلی است. محققین سپس این جریان پیکسلی تک بعدی را به یک تصویر دو بعدی تبدیل میکنند تا الگوریتمهای متداول آنالیز تصویر بتوانند آن را تحلیل کنند. عرض تصویر بر اساس حجم فایل ورودی و طبق جدول زیر انتخاب میشود. ارتفاع یا طول تصویر نیز به صورت پویا، متغیر خواهد بود که به کمک آن میتوان جریان دادههای پیکسلی را بر اساس ارزش عرض عکس، تقسیمبندی کرد. پس از سرهم کردن جریان دادههای پیکسلی به یک تصویر نرمال دو بعدی، محققین تصویر نهایی را به ابعادی کوچکتر کاهش میدهند.
محققین دو کمپانی اینتل و مایکروسافت میگویند کاهش ابعاد تصویر «تاثیر منفی بر نتایج دستهبندی» نخواهد داشت و در اصل یک گام ضروری است تا منابع رایانشی آنها با میلیاردها پیکسل سر و کار نداشته باشند، زیرا در غیر این صورت فرایند تحلیل به شدت کند پیش خواهد رفت. آنها در گام بعدی عکس به دست آمده را به یک شبکه عصبی عمیق از پیش تعلیم داده شده میدهند تا آن را اسکن کرده و در دسته سالم یا آلوده قرار دهد.
مایکروسافت میگوید ۲.۲ میلیون نمونه آلوده فایل پرتابل قابل اجرا را در پایگاه داده این شبکه عصبی قرار داده است تا پایه و اساس تحقیقات را تشکیل دهد. آنها ۶۰ درصد بدافزارهای شناخته شده را به عنوان نمونه برای آموزش شبکه عصبی عمیق، ۲۰ درصد آن را برای صحتسنجی این شبکه عصبی عمیق و ۲۰ درصد دیگر را برای فرایند اصلی تست استفاده کردند.
محققین این دو کمپانی در نهایت اعلام کردهاند که STAMINA توانسته با دقت ۹۹.۰۷ درصد و با نرخ مثبت کاذب ۲.۵۸ درصد، بدافزارها را شناسایی و دستهبندی کند (نرخ مثبت کاذب در این جا به این معناست که فایلهای عادی به عنوان بدافزار شناخته شوند). محققین در رابطه با این نتیجه میگویند «نتایج این پروژه نشان میدهد که میتوان از یادگیری انتقال عمیق برای اهداف دستهبندی بدافزارها استفاده کرد.»
البته STAMINA برای فایلهای حجیمتر چندان پاسخگو نیست، زیرا محدودیتها باعث میشوند تبدیل میلیاردها پیکسل به یک تصویر JPEG و سپس کاهش ابعاد آن، بهینه نباشد. البته احتمالا چنین چیزی از کمترین میزان اهمیت برخوردار است، زیرا محققین در ابتدا نیز این پروژه را برای فایلهای کمحجم توسعه داده بودند. در نهایت انتظار میرود این پروژه کم کم راه خود را به نرمافزار دیفندر مایکروسافت باز کرده تا میلیاردها دستگاه را به لایه جدیدی از حفاظت در برابر بدافزارها تجهیز کند.