توسعه‌ و بهره‌برداری از سکوی پردازش زبان فارسی عامیانه در سامانه‌ی ذکاوت

 
سکوی پردازش زبان فارسی عامیانه (محاوره‌ای)، به عنوان یکی از دستاوردهای مهم پژوهشی-توسعه‌ای- کاربردی سامانه ذکاوت مورد بهره ‎برداری قرار گرفت.
به گزارش روابط عمومی پژوهشگاه ارتباطات و فناوری اطلاعات، همگام با طراحی و توسعه سامانه ذکاوت(ذائقه‌سنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره برداری قرار گرفت.
 
گفتنی است از آن‌جایی که متن‌های منتشرشده در پیام‌رسان/ شبکه‌های اجتماعی به صورت عامیانه می‌باشند و پردازش زبان فارسی یکی از ارکان پایه‌ای تحلیل محتوای متنی است، لذا بر اساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاوره‌ای) نیز توسط پروژه‌ "طراحی و ایجاد بستر تحلیل ترافیک و ذائقه سنجی کاربران فضای مجازی" توسعه داده شده و در سامانه ذکاوت، طی پروژه توسعه ذکاوت در فاز اول عملیاتی شده است.
 
به گفته لیلا ربیعی مجری پروژه های مذکور و مدیر گروه توسعه سرویس و مدیریت منابع هوش مصنوعی پژوهشگاه ICT، این سکو شامل ابزارهای تشخیص موجودیت‌های نامدار (NER)، نرمال‌ساز فارسی(Normalizer)، برچسب‌زن ادات سخن(POSTagger) و چانکر(chunker) می‌باشد، که به صورت API قابلیت ارائه خدمات را خواهد داشت. لازم به توضیح است که پیکره‌ای شامل ۵۰۰ هزار توکن فارسی از متون عامیانه شبکه‌های اجتماعی جهت توسعه‌ی ابزارهای برچسب‌زن ادات سخن و چانکر، توسط تیم زبان‌شناسی برچسب‌گذاری شده است.
 
لازم به ذکر است پژوهشگاه ارتباطات و فناوری اطلاعات در آزمایشگاه‌های مرکز توسعه و نوآوری هوش مصنوعی جهت ارائه خدمت به دانشجویان و محققان این حوزه اعلام آمادگی می‌نماید.