تکامل ذهنی کامپیوترها

در ماه سپتامبر ۲۰۱۹، موسسه هوش مصنوعی Allen از یک برنامه کامپیوتری تحت عنوان Aristo رونمایی کرد که می‌توانست به بیش از ۹۰ درصد از پرسش‌های مطرح شده در تست‌های علمی‌پایه هشتم مقطع تحصیلی پاسخ درست بدهد.
 
 
 
 
اگرچه کسب نمره قبولی در آزمونی که متعلق به مقطع راهنمایی است، کار چندان سختی به نظر نمی‌رسد، اما برای کامپیوترها کار پیچیده‌ای است. نرم‌افزار Aristo قادر است با کمک فناوری پردازش زبان طبیعی (NLP) پاسخ درست را از میان میلیون‌ها سند پیدا کند. این فناوری شاخه‌ای از علوم کامپیوتری و هوش مصنوعی است که به کامپیوترها این امکان را می‌دهد تا از متون فاقد ساختار و پیکربندی، معنا استخراج کنند.اگرچه تا تحقق رویای آدمی‌یعنی امکان مکالمه بدون عیب‌ونقص ماشین‌ها با انسان‌ها فاصله زیادی داریم، اما پردازش زبان طبیعی (NLP) طی سال‌های اخیر و به لطف پیشرفت محسوسی که تجربه کرده، به‌عنوان یکی از عناصر مهم در بسیاری از اپلیکیشن‌ها و برنامه‌هایی که ما انسان‌ها روزانه با آنها سروکار داریم، تبدیل شده است. از جمله این ابزارها می‌توان به دستیارهای دیجیتالی، ترجمه ماشینی، سرچ‌وب، ایمیل‌ها و... اشاره کرد.الگوبرداری و پیاده کردن قابلیت‌های پردازش زبانی مغز انسان، کار بسیار سخت و پیچیده‌ای برای هوش مصنوعی است. تصور کنید که یک دستگاه مجهز به هوش مصنوعی بخواهد به سوالات مختلف مربوط به وضعیت آب و هوایی پاسخ دهد. در اینجا ممکن است این سوال به شیوه‌های مختلفی پرسیده شود که برخی از آنها عبارتند از:
 
هوا امروز چطور است؟ آیا فردا بارانی خواهد بود؟ چه زمانی باران بند می‌آید؟ آیا هوای امروز شیکاگو، آفتابی است؟
 
چه روزهایی در هفته آینده، آفتابی است؟
زبان اغلب با خود معانی پنهانی را نیز منتقل می‌کند که به دانش عمومی‌در مورد جهان و نحوه ارتباط میان اشیا دلالت دارد. بنابراین، درک بسیاری از این جملات و کلمات، صرفا به دانستن معانی کلمات خلاصه نمی‌شود و باید به فراتر از اینها توجه شود. به این سوالات توجه کنید: آیا هوا برای بازی فوتبال فردا مناسب خواهد بود؟ آیا در آشپزخانه برف می‌بارد؟هر کسی که جمله نخست را بشنود، متوجه خواهد شد که شما دارید صراحتا می‌پرسید که آیا فردا، هوا آفتابی خواهد بود یا اینکه باران خواهد بارید. اما در مورد سوال دوم، همه می‌دانند که هرگز در آشپزخانه، برف نمی‌بارد. اما رمزنگاری جملاتی این چنینی، نیازمند یک دانش زمینه‌ای است. بنابراین هوش مصنوعی به راحتی قادر به تشخیص آن نخواهد بود و این مساله همواره به‌عنوان چالشی پیش روی محققان بوده است.در رویکردهای کلاسیک نسبت به پردازش زبان طبیعی از سیستم‌های هوش مصنوعی نمادین استفاده می‌شد، جایی که در آن مهندسان نرم‌افزار به‌طور مشخص، قوانینی را برای استخراج معنای زبان مشخص می‌کنند. این فرآیند، کاربرد محدودی داشت و چندان قابل اتکا نبود. به این معنی که توسعه‌دهندگان باید همه روش‌هایی را که ممکن است یک فرد، سوال مربوط به وضعیت هوا را از دستگاه بپرسد، بنویسند، سپس پاسخ مناسبی را برای هر یک از این سوالات در نظر بگیرند.
 
 فناوری پردازش زبان طبیعی
این سیستم تنها در شرایطی مفید واقع می‌شود که رفتار کاربر از محدوده مشخصی فراتر نرود. به محض اینکه سیستم، سوال جدید و متفاوتی را نسبت به آنچه پیشتر برای آن تعریف شده بود، دریافت می‌کرد، عملا چیزی برای پاسخ نداشت.محدودیت سیستم‌های مبتنی بر قانون و کدگذاری، در پردازش متون بلند که نیازمند دانش متنی است، بیشتر به چشم می‌آید. این مساله به‌طور خاص در ترجمه مشهود است؛ جایی که در آن سیستم باید یک متن طولانی را از زبان به زبانی دیگر برگرداند که این امر نیازمند اطلاعاتی درخصوص زبان مبدا و مقصد و همچنین تاریخ و فرهنگ دو زبان است.طی چند سال اخیر، شاهد انقلابی در فناوری یادگیری عمیق بودیم. این فناوری نوعی تکنیک هوش مصنوعی است که به‌طور ویژه در مدیریت اطلاعات ساختارنیافته مانند تصاویر، صدا و متن به‌کار گرفته می‌شود. مهندسان نرم‌افزار به‌جای تعریف دستی الگوریتم‌های یادگیری عمیق، این فناوری را از طریق فراهم کردن مثال‌ها و نمونه‌های متنوع، به اصطلاح تعلیم می‌دهند.
 
برای نمونه، مهندسان برای تعلیم الگوریتمی‌به‌منظور پاسخ به سوالات مرتبط با آب و هوا، نمونه‌ها و مثال‌های متعددی از نحوه پرسیدن سوالات درخصوص وضعیت آب و هوا و پاسخ مناسب این سوالات را برای این الگوریتم فراهم می‌کنند. این الگوریتم یک مدل آماری ایجاد می‌کند و می‌تواند به اصطلاح، نقشه جملات جدیدی را ایجاد کند که تاکنون وجود نداشته‌اند.یادگیری ماشینی، نه‌تنها نیاز به هر گونه مهندسی رفتارها به‌صورت دستی را از میان برمی‌دارد، بلکه کمک می‌کند تا بتوان کارهای پیچیده‌تر پردازش زبان طبیعی مانند ترجمه را به شیوه بهتری انجام داد.در سال ۲۰۱۶، گوگل بعد از سوئیچ کردن به فناوری یادگیری عمیق، متوجه پیشرفت قابل‌توجهی در سرویس ترجمه (Translate) خود شد. امروزه بسیاری از کاربردها و عملکردهای پردازش زبان طبیعی مبتنی بر یادگیری عمیق هستند.
 
 کاربردهای فناوری پردازش زبان طبیعی
ردپای پردازش زبان طبیعی را می‌توان در بسیاری از حوزه‌ها مشاهده کرد. از طرفی، پیشرفت‌ها در برخی عرصه‌ها، زمینه‌ را برای ظهور کاربردهای جدید هموار می‌کند. درادامه به برخی از این موارد اشاره خواهیم کرد.دستیارهای دیجیتالی: الکسا، سیری و کورتانا از پردازش زبان طبیعی به‌منظور جمله‌بندی و تهیه نقشه‌ای از جملات استفاده می‌کنند. به لطف پیشرفت‌های اخیر در زمینه پردازش زبان طبیعی، کاربران می‌توانند حتی با زبان غیررسمی‌و عامیانه نیز با دستیارهای دیجیتالی صحبت کنند. این دستیارهای دیجیتال می‌توانند به دستورات متفاوت و متنوعی از قبیل تنظیم زنگ هشدار، پخش موزیک و روشن یا خاموش کردن لامپ‌ها به خوبی پاسخ دهند و آنها را اجرا کنند.گوگل داپلکس (Duplex) نمونه بارزی از پیشرفت‌ها در زمینه پردازش زبان طبیعی است؛ این قابلیت، می‌تواند با افراد مختلف تماس تلفنی برقرار کرده و برای نمونه، اتاقی را در هتل برای شخص موردنظر رزرو کند. همچنین قادر است صحبت‌ها و گفت‌وگوهای ردوبدل شده میان افراد را تحت نظر بگیرد و از دل آنها، داده‌هایی را برای استفاده در آینده استخراج کند.
 
روبات‌های چت: پیشرفت‌ها در زمینه فناوری پردازش زبان طبیعی (NLP) طی سال‌های اخیر، منجر به ظهور روبات‌های چت شد. با این روبات‌ها می‌توان از طریق رابط چت در محیط‌های مختلف از قبیل شبکه‌های اجتماعی ارتباط برقرار کرد. امروزه روبات‌های چت در بخش‌های مختلفی از قبیل خدمات درمانی، بانکداری، خدمات مشتریان و همین‌طور اخبار مشاهده می‌شوند. ارتباط با روبات‌های چت تقریبا همانند ارتباط با انسان‌هاست.جست‌وجو در وب: در حال حاضر، موتورهای جست‌وجو از فناوری‌هایی همچون جاسازی کلمات (Word Embedding) بهره می‌برند که نوعی هوش مصنوعی است و به‌دنبال کلمات کلیدی و عبارت‌هایی می‌گردد که به کلمه جست‌وجوشده مرتبط هستند.گوگل اخیرا به استفاده از مدلی با عنوان BERT به‌منظور ارتقای نتایج جست‌وجوی کاربران، در موتور سرچ خود روی آورده است. فناوری هوش مصنوعی Aristo نیز از نوعی BERT برای پیدا کردن پاسخ سوالات علمی بهره می‌گیرد.ایمیل: بسیاری از سرویس‌های ارائه‌دهنده خدمات ایمیل از پردازش زبان طبیعی برای تشخیص و فیلتر کردن هرزنامه‌ها استفاده می‌کنند. ویژگی‌هایی همانند تکمیل خودکار یا نوشتن هوشمند در ایمیل نیز از پردازش زبان طبیعی بهره می‌برند که این مساله بیشتر در گوشی‌های هوشمند مشاهده می‌شود.شبکه‌های اجتماعی: پلت‌فرم‌های شبکه‌های اجتماعی نیز از پردازش زبان طبیعی در زمینه‌های مختلف استفاده می‌کنند. از جمله این موارد می‌توان به شناسایی پست‌های حاوی کلمات و جملات نامناسب و خشونت‌آمیز، ارزیابی احساسات نهفته در پست‌های کاربران و علامت‌گذاری پست‌هایی با مضمون خودکشی و... اشاره کرد.
 
 محدودیت‌های پیش رو
به‌رغم انعطاف‌پذیری که فناوری پردازش زبان طبیعی (NLP) برای پردازش زبان طبیعی به ارمغان آورد، هوش مصنوعی در این برهه از زمان، هنوز فاصله زیادی تا درک زبان مکالمات همانند آنچه انسان‌ها انجام می‌دهند، دارد.مدل‌های یادگیری عمیق دقت خود را مدیون حجم زیادی از اطلاعاتی هستند که به وسیله آنها تعلیم داده شدند. هرچه مثال‌ها و مواردی که به‌عنوان هوش مصنوعی تعریف می‌شود، بیشتر باشد به همان میزان احتمال ارائه پاسخ درست‌تر بیشتر می‌شود.با این اوصاف، یادگیری عمیق قادر به تشخیص و تمییز معانی کلمات و جملات نیست و صرفا بر اساس الگو و نقشه‌ای که در اختیار دارد کلمات را در کنار هم قرار می‌دهد. در واقع، مدل‌های زبانی مبتنی بر یادگیری عمیق، همچنان با مشکلاتی مواجهند که پیش از این در پردازنده‌های مبتنی بر قانون و کُد وجود داشت.مدل‌های زبانی یادگیری عمیق زمانی که درگیر کارهایی می‌شوند که نیازمند دانش عمومی‌ درباره مردم وچیزهای مختلف است، اشتباهات پیش‌پاافتاده‌‌ای را مرتکب می‌شوند. به همین دلیل است که بسیاری از شرکت‌ها هنوز هم استفاده از هزاران انسان را به‌منظور هدایت الگوریتم‌های هوش مصنوعی به مسیر درست، ترجیح می‌دهند.اگر بخواهیم عادلانه قضاوت کنیم، باید بگوییم تا زمانی که نتوانیم کدهای هوش مصنوعی هم‌تراز با آنچه در ذهن انسان پردازش می‌شود، پیاده کنیم هرگز نمی‌توان به پردازش زبان طبیعی به‌طور کامل اطمینان کرد. اما هرچه به جلو می‌رویم و به پیشرفت‌های بیشتر نائل می‌شویم، این فاصله میان انسان و کامپیوتر بیش از پیش برداشته خواهد شد.