بیش از ۳ میلیون نفر برای دادهکاوی کرونا مشارکت کردند
وحشت عمومی از ابتلا به کرونا در حالی سراسر کشور را فرا گرفته که حتی وزارت ارتباطات هم در مورد عدم اطلاعرسانی دقیق و مدرن در این زمینه زبان به انتقاد گشوده. حالا هم این انتقاد با مجموعهای از اطلاعرسانیهای مستقل مبتنی بر دادهکاوی از بیماران احتمالی یا شناخته شده کرونا همراه شده که حاوی دادههایی هرچند تکراری ولی همچنان مهم است.
مسئولان وزارت ارتباطات در چند هفته اخیر چندین بار انتقاد کردهاند به دلیل ذهنهای سنتی مدیران کشور به راحتی به آنها اجازه دسترسی به دادههای دقیق و شفاف داده نمیشود تا از این طریق به کاهش خسارت شیوع این ویروس در کشور کمک کنند. حتی در این زمینه سازمان بهداشت جهانی نیز در توییتی این موضوع را به تصمیمگیران در ایران یادآور شده و نوشته که درست است که استراتژیها و اولویتهای ایران برای کنترل ویروس کرونا در جهت صحیح در حال تکامل است؛ اما ایران باید برای جمعآوری، تجزیه و تحلیل دادهها در این زمینه کارهای بیشتری انجام دهد.
در ابتدای هفته جاری دستورالعمل و مصوبات مربوط به ویروس کرونا به منظور دسترسی شفاف و بدون محدودیت همه شهروندان روی سامانه انتشار و دسترسی آزاد به اطلاعات قرار گرفت؛ اما یکی از کمبودهای اطلاعاتی این سامانه، دادههای مربوط با ویروس کروناست. وزارت بهداشت تا امروز و بعد از گذشته نزدیک به ۴ هفته از گسترش این ویروس در کشور حاضر به اشتراکگذاری دادههای مربوط به این ویروس روی این سامانه نشده است. ممانعت این وزارتخانه برای انتشار شفاف این دادهها حتی صدای انتقاد مدیران وزارت ارتباطات و فناوری اطلاعات را نیز بلند کرده است. برای نمونه امیر ناظمی، معاون وزیر ارتباطات و رئیس سازمان فناوری اطلاعات در چندین توییت نسبت به نگاههای سنتی مدیران در اشتراکگذاری دادهها در این زمینه انتقاد کرده بود. با این حال او اعلام میکند که با وجود این نگاههای سنتی که مانع اشتراکگذاری اطلاعات دقیق و شفاف میشوند، بانکهای داده مختلفی به کمک مردم در این زمینه شکل گرفته است.
با استفاده از همین پایگاه داده نیز در دو روز گذشته وزیر ارتباطات و فناوری اطلاعات در توییتهای مختلف میزان مناطق آلوده به این ویروس در تهران و بعد هم کل کشور را به نمایش گذاشت و اعلام کرد که با کمک اطلاعات مبتلایان به ویروس کرونا و تحلیل اطلاعات حملونقل و پرداخت حضوری توسط متخصصان دادهکاوی و استخراج مدل شیوع مشخص شده که سه مرکز مهم پخش این ویروس در کشور بیمارستانها، پمپ بنزینها و سوپرمارکتها بودهاند.
نقشهی که وزیر ارتباطات در توییتر خود به اشتراک گذاشته که میزان خطرپذیری مناطق مختلف کشور به ویروس کرونا را نشان میدهد. این اطلاعات خروجی گرفته شده از داده کاوی ۳.۵ میلیون مشارکت کننده در اپلیکیشن سامانه ضدکرونا به دست آمده است.
اما این اطلاعات یا دادهها چگونه به دست آمدهاند؟ امیر ناظمی، معاون وزیر ارتباطات و رئیس سازمان فناوری اطلاعات در گفتوگو با پیوست از به دست آمدن این دادهها از ۳ شیوه مختلف اشاره میکند.
او در توضیح نحوه جمعآوری این دادهها به پیوست گفت: «پیش از هر مسالهای لازم است توضیح داده شود که «مقررات سلامت بینالمللی (INTERNATIONAL HEALTH REGULATIONS) ویرایش سوم که توسط سازمان بهداشت جهانی (WHO) منتشر شده است در اصل ۴۵ به موضوع دادههای شخصی میپردازد. در حقیقت این اصل به این موضوع میپردازد که دادههای فرد بیمار که میتواند در سیاستگذاری سلامت مورد استفاده قرار گیرد، بنا به چه شرایطی قابل محاسبه است و سازمانهای دولتی با رعایت چه شرایطی میتوانند از آن استفاده کنند. همچنین سازمان بهداشت جهانی با شیوع کرونا COVID19 پروتکلی در خصوص چگونگی مراقبت بهداشتی منتشر کرد که نوع دادهها را مشخص میکرد و در همان پروتکل نیز به اصل ۴۵ مورد اشاره استناد میکند.» او ادامه داد: «بر اساس این اصل دادهها باید صرفا برای اهداف سلامت مشخص مورد بهرهبرداری قرار گیرد.»
به گفته او در مورد کرونا چندین نوع هدف برای استفاده از داده اهمیت دارد. او در توضیح این دو هدف گفت: «دو هدف اصلی عبارتند از یک، شناسایی مکانهای پرخطر: یعنی مکانهایی که افراد مبتلا در آن مکانها حضور داشتهاند. به همین دلیل نیاز به «ردیابی مکان» (Location Tracking) است. بر اساس این روش مکانهایی که بیماران در طول روزهای ابتلا خود در آنها حضور داشتهاند به دست میآید که ورودی سیاستگذار، مدلسازی انتشار شیوع بیماری و همچنین راهنمایی به شهروندان میشود. دومین هدف شناسایی افراد در معرض خطر سرایت است. افراد در معرض سرایت همان افرادی هستند که لازم است تا شناسایی ارتباط نزدیک (Close Contact Detection) در موردشان انجام شود. مثلا خانواده یک بیمار اولین کسانی هستند که باید ارتباط نزدیکشان شناسایی شود.»
آنطور که امیر ناظمی توضیح میدهد این دادهها بر اساس اصل ۴۵ باید دارای ویژگیهای زیر باشند:
ناشناس بودن (anonymous) داده حفط شود. یعنی داده یک فرد مشخص نباشد یا به طریقی نتوان فهمید که آن داده یا جابهجایی دقیقا متعلق به کیست.
دارای پردازشهایی فراتر از اهداف نباشد.
قابلیت بهاشتراکگذاری داشته باشد.
دلیل مشخص و منطقی برای محاسبه و جمعآوری آن وجود داشته باشد.
دادههای فردی محرمانه باشد و تنها دادههای تجمیعی قابلیت انتشار داشته باشد.
ناظمی تاکید میکند که بر اساس این منطق لازم بود تا دادهها برای سیاستگذاران فراهم شود؛ صرف نظر از این که سیاستگذاران از آن استفاده میکنند یا خیر !
به گفته ناظمی براساس رعایت همین پروتکلها هم مجموعههای دادهای زیادی با اجازه دسترسی تولید شده که نمونههایی از آنها در رسانهها نیز استفاده شده است. او در مورد اینکه این دادهها منتشر شده اخیر چگونه جمعآوری شدهاند به پیوست گفت:«دسته اول این دادهها با کمک دادههای بیماران به دست میآیند. در واقع یک مرکز تماس تلفنی خاص با خانواده این بیماران تماس و مجموعه اطلاعاتی را دریافت میکند تا با ردیابی آنها مشخص شود که این بیماران در طول بیماری خود کجاها رفته و با چه افرادی تماس داشتهاند. البته بانک اطلاعات مربوط به خانوار افراد برای شناسایی نخستین افراد دارای احتمال ابتلا از بانک داده خانوادهها به صورت اتوماتیک تهیه میشود. همچنین دادههایی مانند آدرس سکونت برای شناسایی پراکندگی بیماران در سطح شهر یا شهرها نیز استخراج میشود.»
او با اشاره به دسته دوم دادهها اعلام کرد: «دسته دوم مربوط به ردگیری مکانی است. در این روش کشورهای مختلف با ردیابی مسیر بیماران کرونایی در ۱۴ روز قبل از بستری شدن، تلاش میکنند تا مسیر یا شدت گسترش بیماری در کشور را محاسبه کنند. یکی از کاربردهای این روش آن است که امکان مدلسازی برای وضعیت آینده اپیدمی را دقیقتر میکند. همچنین امکان شناسایی مناطق آلوده به این ویروس یا درجه احتمال وجود بیماران را فراهم میآورد. از سوی دیگر میتوان از این طریق به مردم مکانهای پرخطر مانند سوپرمارکتها یا پمپ بنزین را هشدار داد تا از طریق اطلاعرسانی بتوان از گسترش آن بین افراد و مناطق بیشتر جلوگیری شود.» براساس اظهارات او در این روش تنها میسر بیماران قطعی به این ویروس ردیابی میشود و نام و مشخصات فرد بیمار محرمانه میماند و بینامسازی میشوند. در ایران نیز به کمک این روش اولین بار نقشه انتشار کرونا از مبدا قم بر پایه اطلاعات تردد مبتلایان به دست آمد.
نقشه انتشار کرونا از مبدا قم که بر پایه اطلاعات تردد مبتلایان به دست آمده است.
در روش سومی که وزارت ارتباطات توانسته به کمک آن دادههای در مورد مناطق آلوده به دست بیاورد کمک گرفتن از اطلاعات خوداظهارانه است. به عنوان نمونه سایت مرکز آموزش کرونا و اپلیکیشن «سامانه مقابله با کرونا» است یکی از منابع مدیریت بحران کرونا و البته شایع در کشورهای مختلف است.
ناظمی اعلام میکند که در این روش با کمک خوداظهاری افراد دادهها جمعآوری میشوند. او در این مورد گفت: «در اطلاعاتی که از این طریق به دست آمده توانستیم با دادهکاوی اطلاعات نزدیک به ۳ ونیم میلیون نفر مشارکتکننده در این برنامهها، نقشه میزان خطر احتمال به ابتلا کرونا در مناطق تهران را به دست بیاوریم که این نقشه نیز توسط وزیر ارتباطات در توییتر به اشتراک گذاشته شد.» ناظمی با تاکید اینکه در استخراج دادههای به اشتراکگذاری شده در این برنامهها اطلاعات تمام ۳ونیم میلیون نفر مورد ارزیابی قرار نگرفته است؛ توضیح داد: «برای استخراج داده از این طریق یک پروتکل مشخص وجود دارد و آن اینکه تنها افرادی را که از طریق تست خودارزیابی ویروس کرونا (که مورد تایید ستاد مدیریت بحران تهران بوده است) تنها بخشی از افراد که دارای وضعیت بحرانی تشخیص داده شدهاند مورد استفاده قرار گرفته است و آن هم با رعایت اصل ۴۵ سازمان بهداشت جهانی.»
نقشهی میزان خطر احتمال ابتلا به کرونا در مناطق تهران که به کمک دادهکاوی اطلاعات بیش از ۳ میلیون نفر از مشارکتکنندگان در اپلیکیشن ac19 به دست آمده است.
براساس اظهارات او نقشه منتشر شده از میزان خطر احتمال ابتلا به کرونا در مناطق تهران مربوط به ۹ درصدی است که احتمال بالایی از داشتن ویروس کرونا در آنها وجود داشته است.
آنطور که ناظمی میگوید دستههای دیگری از اطلاعات نیز وجود دارد که توسط سیاستگذار مورد استفاده قرار میگیرد و بخشی از آنها نیز ممکن است به مرور و با تصمیم سیاستگذاران منتشر شود. او امیدوار است با توجه به قرار گرفتن رئیس جمهوری به عنوان رئیس ستاد ملی مبارزه با کرونا این دادهها نیز به زودی منتشر شود. حالا باید منتظر ماند و دید آیا رئیس جمهوری این قدرت را دارد تا با دستور به وزارت بهداشت اطلاعاتی دقیق و گسترده دیگر در این زمینه را که میتواند جان شهروندان زیادی در کشور را نجات دهد را آزاد کند یا خیر؟