تکامل ذهنی کامپیوترها
در ماه سپتامبر ۲۰۱۹، موسسه هوش مصنوعی Allen از یک برنامه کامپیوتری تحت عنوان Aristo رونمایی کرد که میتوانست به بیش از ۹۰ درصد از پرسشهای مطرح شده در تستهای علمیپایه هشتم مقطع تحصیلی پاسخ درست بدهد.
اگرچه کسب نمره قبولی در آزمونی که متعلق به مقطع راهنمایی است، کار چندان سختی به نظر نمیرسد، اما برای کامپیوترها کار پیچیدهای است. نرمافزار Aristo قادر است با کمک فناوری پردازش زبان طبیعی (NLP) پاسخ درست را از میان میلیونها سند پیدا کند. این فناوری شاخهای از علوم کامپیوتری و هوش مصنوعی است که به کامپیوترها این امکان را میدهد تا از متون فاقد ساختار و پیکربندی، معنا استخراج کنند.اگرچه تا تحقق رویای آدمییعنی امکان مکالمه بدون عیبونقص ماشینها با انسانها فاصله زیادی داریم، اما پردازش زبان طبیعی (NLP) طی سالهای اخیر و به لطف پیشرفت محسوسی که تجربه کرده، بهعنوان یکی از عناصر مهم در بسیاری از اپلیکیشنها و برنامههایی که ما انسانها روزانه با آنها سروکار داریم، تبدیل شده است. از جمله این ابزارها میتوان به دستیارهای دیجیتالی، ترجمه ماشینی، سرچوب، ایمیلها و... اشاره کرد.الگوبرداری و پیاده کردن قابلیتهای پردازش زبانی مغز انسان، کار بسیار سخت و پیچیدهای برای هوش مصنوعی است. تصور کنید که یک دستگاه مجهز به هوش مصنوعی بخواهد به سوالات مختلف مربوط به وضعیت آب و هوایی پاسخ دهد. در اینجا ممکن است این سوال به شیوههای مختلفی پرسیده شود که برخی از آنها عبارتند از:
هوا امروز چطور است؟ آیا فردا بارانی خواهد بود؟ چه زمانی باران بند میآید؟ آیا هوای امروز شیکاگو، آفتابی است؟
چه روزهایی در هفته آینده، آفتابی است؟
زبان اغلب با خود معانی پنهانی را نیز منتقل میکند که به دانش عمومیدر مورد جهان و نحوه ارتباط میان اشیا دلالت دارد. بنابراین، درک بسیاری از این جملات و کلمات، صرفا به دانستن معانی کلمات خلاصه نمیشود و باید به فراتر از اینها توجه شود. به این سوالات توجه کنید: آیا هوا برای بازی فوتبال فردا مناسب خواهد بود؟ آیا در آشپزخانه برف میبارد؟هر کسی که جمله نخست را بشنود، متوجه خواهد شد که شما دارید صراحتا میپرسید که آیا فردا، هوا آفتابی خواهد بود یا اینکه باران خواهد بارید. اما در مورد سوال دوم، همه میدانند که هرگز در آشپزخانه، برف نمیبارد. اما رمزنگاری جملاتی این چنینی، نیازمند یک دانش زمینهای است. بنابراین هوش مصنوعی به راحتی قادر به تشخیص آن نخواهد بود و این مساله همواره بهعنوان چالشی پیش روی محققان بوده است.در رویکردهای کلاسیک نسبت به پردازش زبان طبیعی از سیستمهای هوش مصنوعی نمادین استفاده میشد، جایی که در آن مهندسان نرمافزار بهطور مشخص، قوانینی را برای استخراج معنای زبان مشخص میکنند. این فرآیند، کاربرد محدودی داشت و چندان قابل اتکا نبود. به این معنی که توسعهدهندگان باید همه روشهایی را که ممکن است یک فرد، سوال مربوط به وضعیت هوا را از دستگاه بپرسد، بنویسند، سپس پاسخ مناسبی را برای هر یک از این سوالات در نظر بگیرند.
فناوری پردازش زبان طبیعی
این سیستم تنها در شرایطی مفید واقع میشود که رفتار کاربر از محدوده مشخصی فراتر نرود. به محض اینکه سیستم، سوال جدید و متفاوتی را نسبت به آنچه پیشتر برای آن تعریف شده بود، دریافت میکرد، عملا چیزی برای پاسخ نداشت.محدودیت سیستمهای مبتنی بر قانون و کدگذاری، در پردازش متون بلند که نیازمند دانش متنی است، بیشتر به چشم میآید. این مساله بهطور خاص در ترجمه مشهود است؛ جایی که در آن سیستم باید یک متن طولانی را از زبان به زبانی دیگر برگرداند که این امر نیازمند اطلاعاتی درخصوص زبان مبدا و مقصد و همچنین تاریخ و فرهنگ دو زبان است.طی چند سال اخیر، شاهد انقلابی در فناوری یادگیری عمیق بودیم. این فناوری نوعی تکنیک هوش مصنوعی است که بهطور ویژه در مدیریت اطلاعات ساختارنیافته مانند تصاویر، صدا و متن بهکار گرفته میشود. مهندسان نرمافزار بهجای تعریف دستی الگوریتمهای یادگیری عمیق، این فناوری را از طریق فراهم کردن مثالها و نمونههای متنوع، به اصطلاح تعلیم میدهند.
برای نمونه، مهندسان برای تعلیم الگوریتمیبهمنظور پاسخ به سوالات مرتبط با آب و هوا، نمونهها و مثالهای متعددی از نحوه پرسیدن سوالات درخصوص وضعیت آب و هوا و پاسخ مناسب این سوالات را برای این الگوریتم فراهم میکنند. این الگوریتم یک مدل آماری ایجاد میکند و میتواند به اصطلاح، نقشه جملات جدیدی را ایجاد کند که تاکنون وجود نداشتهاند.یادگیری ماشینی، نهتنها نیاز به هر گونه مهندسی رفتارها بهصورت دستی را از میان برمیدارد، بلکه کمک میکند تا بتوان کارهای پیچیدهتر پردازش زبان طبیعی مانند ترجمه را به شیوه بهتری انجام داد.در سال ۲۰۱۶، گوگل بعد از سوئیچ کردن به فناوری یادگیری عمیق، متوجه پیشرفت قابلتوجهی در سرویس ترجمه (Translate) خود شد. امروزه بسیاری از کاربردها و عملکردهای پردازش زبان طبیعی مبتنی بر یادگیری عمیق هستند.
کاربردهای فناوری پردازش زبان طبیعی
ردپای پردازش زبان طبیعی را میتوان در بسیاری از حوزهها مشاهده کرد. از طرفی، پیشرفتها در برخی عرصهها، زمینه را برای ظهور کاربردهای جدید هموار میکند. درادامه به برخی از این موارد اشاره خواهیم کرد.دستیارهای دیجیتالی: الکسا، سیری و کورتانا از پردازش زبان طبیعی بهمنظور جملهبندی و تهیه نقشهای از جملات استفاده میکنند. به لطف پیشرفتهای اخیر در زمینه پردازش زبان طبیعی، کاربران میتوانند حتی با زبان غیررسمیو عامیانه نیز با دستیارهای دیجیتالی صحبت کنند. این دستیارهای دیجیتال میتوانند به دستورات متفاوت و متنوعی از قبیل تنظیم زنگ هشدار، پخش موزیک و روشن یا خاموش کردن لامپها به خوبی پاسخ دهند و آنها را اجرا کنند.گوگل داپلکس (Duplex) نمونه بارزی از پیشرفتها در زمینه پردازش زبان طبیعی است؛ این قابلیت، میتواند با افراد مختلف تماس تلفنی برقرار کرده و برای نمونه، اتاقی را در هتل برای شخص موردنظر رزرو کند. همچنین قادر است صحبتها و گفتوگوهای ردوبدل شده میان افراد را تحت نظر بگیرد و از دل آنها، دادههایی را برای استفاده در آینده استخراج کند.
روباتهای چت: پیشرفتها در زمینه فناوری پردازش زبان طبیعی (NLP) طی سالهای اخیر، منجر به ظهور روباتهای چت شد. با این روباتها میتوان از طریق رابط چت در محیطهای مختلف از قبیل شبکههای اجتماعی ارتباط برقرار کرد. امروزه روباتهای چت در بخشهای مختلفی از قبیل خدمات درمانی، بانکداری، خدمات مشتریان و همینطور اخبار مشاهده میشوند. ارتباط با روباتهای چت تقریبا همانند ارتباط با انسانهاست.جستوجو در وب: در حال حاضر، موتورهای جستوجو از فناوریهایی همچون جاسازی کلمات (Word Embedding) بهره میبرند که نوعی هوش مصنوعی است و بهدنبال کلمات کلیدی و عبارتهایی میگردد که به کلمه جستوجوشده مرتبط هستند.گوگل اخیرا به استفاده از مدلی با عنوان BERT بهمنظور ارتقای نتایج جستوجوی کاربران، در موتور سرچ خود روی آورده است. فناوری هوش مصنوعی Aristo نیز از نوعی BERT برای پیدا کردن پاسخ سوالات علمی بهره میگیرد.ایمیل: بسیاری از سرویسهای ارائهدهنده خدمات ایمیل از پردازش زبان طبیعی برای تشخیص و فیلتر کردن هرزنامهها استفاده میکنند. ویژگیهایی همانند تکمیل خودکار یا نوشتن هوشمند در ایمیل نیز از پردازش زبان طبیعی بهره میبرند که این مساله بیشتر در گوشیهای هوشمند مشاهده میشود.شبکههای اجتماعی: پلتفرمهای شبکههای اجتماعی نیز از پردازش زبان طبیعی در زمینههای مختلف استفاده میکنند. از جمله این موارد میتوان به شناسایی پستهای حاوی کلمات و جملات نامناسب و خشونتآمیز، ارزیابی احساسات نهفته در پستهای کاربران و علامتگذاری پستهایی با مضمون خودکشی و... اشاره کرد.
محدودیتهای پیش رو
بهرغم انعطافپذیری که فناوری پردازش زبان طبیعی (NLP) برای پردازش زبان طبیعی به ارمغان آورد، هوش مصنوعی در این برهه از زمان، هنوز فاصله زیادی تا درک زبان مکالمات همانند آنچه انسانها انجام میدهند، دارد.مدلهای یادگیری عمیق دقت خود را مدیون حجم زیادی از اطلاعاتی هستند که به وسیله آنها تعلیم داده شدند. هرچه مثالها و مواردی که بهعنوان هوش مصنوعی تعریف میشود، بیشتر باشد به همان میزان احتمال ارائه پاسخ درستتر بیشتر میشود.با این اوصاف، یادگیری عمیق قادر به تشخیص و تمییز معانی کلمات و جملات نیست و صرفا بر اساس الگو و نقشهای که در اختیار دارد کلمات را در کنار هم قرار میدهد. در واقع، مدلهای زبانی مبتنی بر یادگیری عمیق، همچنان با مشکلاتی مواجهند که پیش از این در پردازندههای مبتنی بر قانون و کُد وجود داشت.مدلهای زبانی یادگیری عمیق زمانی که درگیر کارهایی میشوند که نیازمند دانش عمومی درباره مردم وچیزهای مختلف است، اشتباهات پیشپاافتادهای را مرتکب میشوند. به همین دلیل است که بسیاری از شرکتها هنوز هم استفاده از هزاران انسان را بهمنظور هدایت الگوریتمهای هوش مصنوعی به مسیر درست، ترجیح میدهند.اگر بخواهیم عادلانه قضاوت کنیم، باید بگوییم تا زمانی که نتوانیم کدهای هوش مصنوعی همتراز با آنچه در ذهن انسان پردازش میشود، پیاده کنیم هرگز نمیتوان به پردازش زبان طبیعی بهطور کامل اطمینان کرد. اما هرچه به جلو میرویم و به پیشرفتهای بیشتر نائل میشویم، این فاصله میان انسان و کامپیوتر بیش از پیش برداشته خواهد شد.