توسعه و بهرهبرداری از سکوی پردازش زبان فارسی عامیانه در سامانهی ذکاوت
سکوی پردازش زبان فارسی عامیانه (محاورهای)، به عنوان یکی از دستاوردهای مهم پژوهشی-توسعهای- کاربردی سامانه ذکاوت مورد بهره برداری قرار گرفت.
به گزارش روابط عمومی پژوهشگاه ارتباطات و فناوری اطلاعات، همگام با طراحی و توسعه سامانه ذکاوت(ذائقهسنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره برداری قرار گرفت.
گفتنی است از آنجایی که متنهای منتشرشده در پیامرسان/ شبکههای اجتماعی به صورت عامیانه میباشند و پردازش زبان فارسی یکی از ارکان پایهای تحلیل محتوای متنی است، لذا بر اساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاورهای) نیز توسط پروژه "طراحی و ایجاد بستر تحلیل ترافیک و ذائقه سنجی کاربران فضای مجازی" توسعه داده شده و در سامانه ذکاوت، طی پروژه توسعه ذکاوت در فاز اول عملیاتی شده است.
به گفته لیلا ربیعی مجری پروژه های مذکور و مدیر گروه توسعه سرویس و مدیریت منابع هوش مصنوعی پژوهشگاه ICT، این سکو شامل ابزارهای تشخیص موجودیتهای نامدار (NER)، نرمالساز فارسی(Normalizer)، برچسبزن ادات سخن(POSTagger) و چانکر(chunker) میباشد، که به صورت API قابلیت ارائه خدمات را خواهد داشت. لازم به توضیح است که پیکرهای شامل ۵۰۰ هزار توکن فارسی از متون عامیانه شبکههای اجتماعی جهت توسعهی ابزارهای برچسبزن ادات سخن و چانکر، توسط تیم زبانشناسی برچسبگذاری شده است.
لازم به ذکر است پژوهشگاه ارتباطات و فناوری اطلاعات در آزمایشگاههای مرکز توسعه و نوآوری هوش مصنوعی جهت ارائه خدمت به دانشجویان و محققان این حوزه اعلام آمادگی مینماید.