بیش از ۳ میلیون‌ نفر برای داده‌کاوی کرونا مشارکت کردند

وحشت عمومی از ابتلا به کرونا در حالی سراسر کشور را فرا گرفته که حتی وزارت ارتباطات هم در مورد عدم اطلاع‌رسانی دقیق و مدرن در این زمینه زبان به انتقاد گشوده. حالا هم این انتقاد با مجموعه‌ای از اطلاع‌رسانی‌های مستقل مبتنی بر داده‌کاوی از بیماران احتمالی یا شناخته شده کرونا همراه شده که حاوی داده‌هایی هرچند تکراری ولی همچنان مهم است.
 
مسئولان وزارت ارتباطات در چند هفته اخیر چندین بار انتقاد کرد‌ه‌اند به دلیل ذهن‌های سنتی مدیران کشور به راحتی به آنها اجازه دسترسی به داده‌های دقیق و شفاف داده نمی‌شود تا از این طریق به کاهش خسارت شیوع این ویروس در کشور کمک کنند. حتی در این زمینه سازمان بهداشت جهانی نیز در توییتی این موضوع را به تصمیم‌گیران در ایران یادآور شده و نوشته‌ که درست است که  استراتژی‌ها و اولویت‌های ایران برای کنترل ویروس کرونا در جهت صحیح در حال تکامل است؛ اما ایران باید برای جمع‌آوری، تجزیه و تحلیل داده‌ها در این زمینه کارهای بیشتری انجام دهد.
 
در ابتدای هفته جاری دستورالعمل و مصوبات مربوط به ویروس کرونا به منظور دسترسی شفاف و بدون محدودیت همه شهروندان روی سامانه انتشار و دسترسی آزاد به اطلاعات قرار گرفت؛ اما یکی از کمبودهای اطلاعاتی این سامانه، داده‌های مربوط با ویروس کروناست. وزارت بهداشت تا امروز و بعد از گذشته نزدیک به ۴ هفته از گسترش این ویروس در کشور حاضر به اشتراک‌گذاری داده‌های مربوط به این ویروس روی این سامانه نشده است. ممانعت این وزارتخانه برای انتشار شفاف این داده‌ها حتی صدای انتقاد مدیران وزارت ارتباطات و فناوری اطلاعات را نیز بلند کرده است. برای نمونه امیر ناظمی، معاون وزیر ارتباطات و رئیس سازمان فناوری اطلاعات در چندین توییت نسبت به نگاه‌های سنتی مدیران در اشتراک‌گذاری داده‌ها در این زمینه انتقاد کرده بود. با این حال او اعلام می‌کند که با وجود این نگاه‌های سنتی که مانع اشتراک‌گذاری اطلاعات دقیق و شفاف می‌شوند، بانک‌های داده مختلفی به کمک مردم در این زمینه شکل گرفته است.
 
با استفاده از همین پایگاه داده نیز در دو روز گذشته وزیر ارتباطات و فناوری اطلاعات در توییت‌های مختلف میزان مناطق آلوده به این ویروس در تهران و بعد هم کل کشور را به نمایش گذاشت و اعلام کرد که با کمک اطلاعات مبتلایان به ویروس کرونا و تحلیل اطلاعات حمل‌ونقل و پرداخت حضوری توسط متخصصان داده‌کاوی و استخراج مدل شیوع مشخص شده که سه مرکز مهم پخش این ویروس در کشور بیمارستان‌ها، پمپ بنزین‌ها و سوپرمارکت‌ها بوده‌اند.
 
 
 
 
نقشه‌ی که وزیر ارتباطات در توییتر خود به اشتراک گذاشته که میزان خطرپذیری مناطق مختلف کشور به ویروس کرونا را نشان می‌دهد. این اطلاعات خروجی گرفته شده از داده‌ کاوی ۳.۵ میلیون مشارکت ‌کننده در اپلیکیشن سامانه ضدکرونا به دست آمده است.
 
اما این اطلاعات یا داده‌ها چگونه به دست آمده‌اند؟ امیر ناظمی، معاون وزیر ارتباطات و رئیس سازمان فناوری اطلاعات در گفت‌وگو با پیوست از به دست آمدن این داده‌ها از ۳ شیوه مختلف اشاره می‌کند.
 
او در توضیح نحوه جمع‌آوری این داده‌ها به پیوست گفت: «پیش از هر مساله‌ای لازم است توضیح داده شود که «مقررات سلامت بین‌المللی (INTERNATIONAL HEALTH REGULATIONS) ویرایش سوم که توسط سازمان بهداشت جهانی (WHO) منتشر شده است در اصل ۴۵ به موضوع داده‌های شخصی می‌پردازد. در حقیقت این اصل به این موضوع می‌پردازد که داده‌های فرد بیمار که می‌تواند در سیاست‌گذاری سلامت مورد استفاده قرار گیرد، بنا به چه شرایطی قابل محاسبه است و سازمان‌های دولتی با رعایت چه شرایطی می‌توانند از آن استفاده کنند. همچنین سازمان بهداشت جهانی با شیوع کرونا COVID19 پروتکلی در خصوص چگونگی مراقبت بهداشتی منتشر کرد که نوع داده‌ها را مشخص می‌کرد و در همان پروتکل نیز به اصل ۴۵ مورد اشاره استناد می‌کند.» او ادامه داد: «بر اساس این اصل داده‌ها باید صرفا برای اهداف سلامت مشخص مورد بهره‌برداری قرار گیرد.»
 
به گفته او در مورد کرونا چندین نوع هدف برای استفاده از داده اهمیت دارد. او در توضیح این دو هدف گفت: «دو هدف اصلی عبارتند از یک، شناسایی مکان‌های پرخطر: یعنی مکان‌هایی که افراد مبتلا در آن مکان‌ها حضور داشته‌اند. به همین دلیل نیاز به «ردیابی مکان» (Location Tracking) است. بر اساس این روش مکان‌هایی که بیماران در طول روزهای ابتلا خود در آن‌ها حضور داشته‌اند به دست می‌آید که ورودی سیاست‌گذار، مدل‌سازی انتشار شیوع بیماری و همچنین راهنمایی به شهروندان می‌شود. دومین هدف شناسایی افراد در معرض خطر سرایت است. افراد در معرض سرایت همان افرادی هستند که لازم است تا شناسایی ارتباط نزدیک (Close Contact Detection) در موردشان انجام شود. مثلا خانواده یک بیمار اولین کسانی هستند که باید ارتباط نزدیکشان شناسایی شود.»
 
 
آنطور که امیر ناظمی توضیح می‌دهد این داده‌ها بر اساس اصل ۴۵ باید دارای ویژگی‌های زیر باشند:
 
ناشناس بودن (anonymous) داده حفط شود. یعنی داده یک فرد مشخص نباشد یا به طریقی نتوان فهمید که آن داده یا جابه‌جایی دقیقا متعلق به کیست.
دارای پردازش‌هایی فراتر از اهداف نباشد.
قابلیت به‌اشتراک‌گذاری داشته باشد.
دلیل مشخص و منطقی برای محاسبه و جمع‌آوری آن وجود داشته باشد.
داده‌های فردی محرمانه باشد و تنها داده‌های تجمیعی قابلیت انتشار داشته باشد.
ناظمی تاکید می‌کند که بر اساس این منطق لازم بود تا داده‌ها برای سیاست‌گذاران فراهم شود؛ صرف نظر از این که سیاست‌گذاران از آن استفاده می‌کنند یا خیر !
 
به گفته ناظمی براساس رعایت همین پروتکل‌ها هم مجموعه‌های داده‌ای زیادی با اجازه دسترسی تولید شده که نمونه‌هایی از آن‌ها در رسانه‌ها نیز استفاده شده است. او در مورد اینکه این داده‌ها منتشر شده اخیر چگونه جمع‌آوری شده‌اند به پیوست گفت:‌«دسته اول این داده‌ها با کمک داده‌های بیماران به دست می‌آیند. در واقع یک مرکز تماس تلفنی خاص با خانواده این بیماران تماس و مجموعه اطلاعاتی را دریافت می‌کند تا با ردیابی آنها مشخص شود که این بیماران در طول بیماری خود کجاها رفته و با چه افرادی تماس داشته‌اند. البته بانک اطلاعات مربوط به خانوار افراد برای شناسایی نخستین افراد دارای احتمال ابتلا از بانک داده خانواده‌ها به صورت اتوماتیک تهیه می‌شود. همچنین داده‌هایی مانند آدرس سکونت برای شناسایی پراکندگی بیماران در سطح شهر یا شهرها نیز استخراج می‌شود.»
 
او با اشاره به دسته دوم داده‌ها اعلام کرد: «دسته دوم مربوط به ردگیری مکانی است. در این روش کشورهای مختلف با ردیابی مسیر بیماران کرونایی در ۱۴ روز قبل از بستری شدن، تلاش می‌کنند تا مسیر یا شدت گسترش بیماری در کشور را محاسبه کنند. یکی از کاربردهای این روش آن است که امکان مدل‌سازی برای وضعیت آینده اپیدمی را دقیق‌تر می‌کند. همچنین امکان شناسایی مناطق آلوده به این ویروس یا درجه احتمال وجود بیماران را فراهم می‌آورد. از سوی دیگر می‌توان از این طریق به مردم مکان‌های پرخطر مانند سوپرمارکت‌ها یا پمپ بنزین را هشدار داد تا از طریق اطلاع‌رسانی بتوان از گسترش آن بین افراد و مناطق بیشتر جلوگیری شود.» براساس اظهارات او در این روش تنها میسر بیماران قطعی به این ویروس ردیابی می‌شود و نام و مشخصات فرد بیمار محرمانه می‌ماند و بی‌نام‌سازی می‌شوند. در ایران نیز به کمک این روش اولین بار نقشه انتشار کرونا از مبدا قم بر پایه اطلاعات تردد مبتلایان به دست آمد.
 
 
نقشه انتشار کرونا از مبدا قم که بر پایه اطلاعات تردد مبتلایان به دست آمده است.
 
در روش سومی که وزارت ارتباطات توانسته به کمک آن داده‌های در مورد مناطق آلوده به دست بیاورد کمک گرفتن از اطلاعات خوداظهارانه است. به عنوان نمونه سایت مرکز آموزش کرونا و اپلیکیشن «سامانه مقابله با کرونا» است یکی از منابع مدیریت بحران کرونا و البته شایع در کشورهای مختلف است.
 
ناظمی اعلام می‌کند که در این روش با کمک خوداظهاری افراد داده‌ها جمع‌آوری می‌شوند. او در این مورد گفت: «در اطلاعاتی که از این طریق به دست آمده توانستیم با داده‌کاوی اطلاعات نزدیک به ۳ ونیم میلیون نفر مشارکت‌کننده در این برنامه‌ها، نقشه میزان خطر احتمال به ابتلا کرونا در مناطق تهران را به دست بیاوریم که این نقشه نیز توسط  وزیر ارتباطات در توییتر  به اشتراک گذاشته‌ شد.» ناظمی با تاکید اینکه در استخراج داده‌های به اشتراک‌گذاری شده در این برنامه‌ها اطلاعات تمام ۳ونیم میلیون نفر مورد ارزیابی قرار نگرفته است؛ توضیح داد: «برای استخراج داده از این طریق یک پروتکل مشخص وجود دارد و آن اینکه تنها افرادی را که از طریق تست خودارزیابی ویروس کرونا (که مورد تایید ستاد مدیریت بحران تهران بوده است) تنها بخشی از افراد که دارای وضعیت بحرانی تشخیص داده شده‌اند مورد استفاده قرار گرفته است و آن هم با رعایت اصل ۴۵ سازمان بهداشت جهانی.»
 
 
نقشه‌ی میزان خطر احتمال ابتلا به ⁧کرونا⁩ در مناطق تهران که به کمک داده‌کاوی اطلاعات بیش از ۳ میلیون نفر از مشارکت‌کنندگان در اپلیکیشن ac19 به دست آمده است.
 
براساس اظهارات او نقشه منتشر شده از میزان خطر احتمال ابتلا به کرونا در مناطق تهران مربوط به ۹ درصدی است که احتمال بالایی از داشتن ویروس کرونا در آنها وجود داشته است.
آنطور که ناظمی می‌گوید دسته‌های دیگری از اطلاعات نیز وجود دارد که توسط سیاست‌گذار مورد استفاده قرار می‌گیرد و بخشی از آن‌ها نیز ممکن است به مرور و با تصمیم سیاست‌گذاران منتشر شود. او امیدوار است با توجه به قرار گرفتن رئیس جمهوری به عنوان رئیس ستاد ملی مبارزه با کرونا این داده‌ها نیز به زودی منتشر شود. حالا باید منتظر ماند و دید آیا رئیس جمهوری این قدرت را دارد تا با دستور به وزارت بهداشت اطلاعاتی دقیق و گسترده‌ دیگر در این زمینه را که می‌تواند جان شهروندان زیادی در کشور را نجات دهد را آزاد کند یا خیر؟