هوش مصنوعی جدید فیسبوک بدون نیاز به رونویسی گفتار را تشخیص میدهد
تشخیص گفتار یکی از فاکتورهای کلیدی هوش مصنوعی در طرح و برنامههای شرکتهای بزرگ دنیای فناوری است. فیسبوک امروز اعلام کرده که به دستاوردی مهم در زمینه آموزش این سیستمها در یادگیری زبانهای جدید دست یافته است. این شرکت مدعی است روشی برای ساخت ابزارهای تشخیص گفتار ابداع کرده که به دادههای رونویسیشده نیازی ندارد.
به گفته فیسبوک، سیستم جدید آنها میتواند شکل فعلی این فناوری را که به ورودیهای متن-به-گفتار متکی است، متحول کند. زمانبرترین پروسه در شرایط موجود گوش دادن به صحبتها و تبدیل آنها به نوشتار است. این فرآیند باید برای هر زبان تکرار شود. ولی سیستم جدید فیسبوک بهطور مستقیم از خود گفتارهای صوتی تعلیم میبیند و بدون نیاز به نوشتار سعی میکند متوجه حرفها شود.
مدل جدید فیسبوک اساسا مبتنی بر یک چرخه بازخوردی میان «شبکههای زایای دشمنگونه» (GAN) کار میکند که از یک «زایا» و یک «تفکیککننده» تشکیل شده است. زایا نمونههایی از الگوهای گفتاری را ارائه میکند که ممکن است کاملا بیمعنا به نظر برسند. ولی در ادامه این دادهها به تفکیککننده ارائه میشوند تا شبیه نوعی مترجم عمل کند.
در عین حال، فیسبوک متون اضافهای را که توسط انسانها نوشته شده به سیستم میدهد تا در استخراج تفاوتهای میان نتایج کامپیوتری و واقعی به زایا کمک کند. این فرآیند این قدر ادامه پیدا میکند تا خروجی زایا شبیه متن واقعی شود.
فیسبوک میگوید این راهکار به آنها اجازه داده تا بدون هیچ گونه داده حاشیهنویسیشده بتوانند سیستمی برای تشخیص گفتار بسازند. این شرکت همین حالا آزمایش مدل جدید خود را که با نام Wav2vec-U شناخته میشود روی زبانهای سواحلی، قرقیزی و تاتار کریمهای آغاز کرده است. این زبانها تاکنون ابزار باکیفیتی برای تشخیص گفتار نداشتهاند.
آزمایشهای فیسبوک از کاهش ۶۳ درصدی خطاها خبر داده. این شرکت میگوید دستاورد آنها میتواند تشخیص گفتار را برای زبانها و لهجههای بیشتری در سراسر دنیا ممکن کند. بیش از ۷۶ درصد از ۲.۸۵ میلیارد کاربر ماهانه فیسبوک در خارج از آمریکا و اروپا هستند. بنابراین دستیابی به قابلیت ترجمه خودکار برای ایجاد ارتباط موثرتر میان تمامی مردم دنیا امری ضروری به حساب میآید.