هوش مصنوعی جدید فیسبوک بدون نیاز به رونویسی گفتار را تشخیص می‌دهد

 
تشخیص گفتار یکی از فاکتورهای کلیدی هوش مصنوعی در طرح و برنامه‌های شرکت‌های بزرگ دنیای فناوری است. فیسبوک امروز اعلام کرده که به دستاوردی مهم در زمینه آموزش این سیستم‌ها در یادگیری زبان‌های جدید دست یافته است. این شرکت مدعی است روشی برای ساخت ابزارهای تشخیص گفتار ابداع کرده که به داده‌های رونویسی‌شده نیازی ندارد.
 
به گفته فیسبوک، سیستم جدید آن‌ها می‌تواند شکل فعلی این فناوری را که به ورودی‌های متن-به-گفتار متکی است، متحول کند. زمانبرترین پروسه در شرایط موجود گوش دادن به صحبت‌ها و تبدیل آن‌ها به نوشتار است. این فرآیند باید برای هر زبان تکرار شود. ولی سیستم جدید فیسبوک به‌طور مستقیم از خود گفتارهای صوتی تعلیم می‌بیند و بدون نیاز به نوشتار سعی می‌کند متوجه حرف‌ها شود.
 
مدل جدید فیسبوک اساسا مبتنی بر یک چرخه بازخوردی میان «شبکه‌های زایای دشمن‌گونه» (GAN) کار می‌کند که از یک «زایا» و یک «تفکیک‌کننده» تشکیل شده است. زایا نمونه‌هایی از الگوهای گفتاری را ارائه می‌کند که ممکن است کاملا بی‌معنا به نظر برسند. ولی در ادامه این داده‌ها به تفکیک‌کننده ارائه می‌شوند تا شبیه نوعی مترجم عمل کند.
 
در عین حال، فیسبوک متون اضافه‌ای را که توسط انسان‌ها نوشته شده به سیستم می‌دهد تا در استخراج تفاوت‌های میان نتایج کامپیوتری و واقعی به زایا کمک کند. این فرآیند این قدر ادامه پیدا می‌کند تا خروجی زایا شبیه متن واقعی شود.
 
فیسبوک می‌گوید این راهکار به آن‌ها اجازه داده تا بدون هیچ گونه داده‌ حاشیه‌نویسی‌شده بتوانند سیستمی برای تشخیص گفتار بسازند. این شرکت همین حالا آزمایش مدل جدید خود را که با نام Wav2vec-U شناخته می‌شود روی زبان‌های سواحلی، قرقیزی و تاتار کریمه‌ای آغاز کرده است. این زبان‌ها تاکنون ابزار باکیفیتی برای تشخیص گفتار نداشته‌اند.
 
آزمایش‌های فیسبوک از کاهش ۶۳ درصدی خطاها خبر داده. این شرکت می‌گوید دستاورد آن‌ها می‌تواند تشخیص گفتار را برای زبان‌ها و لهجه‌های بیشتری در سراسر دنیا ممکن کند. بیش از ۷۶ درصد از ۲.۸۵ میلیارد کاربر ماهانه فیسبوک در خارج از آمریکا و اروپا هستند. بنابراین دستیابی به قابلیت ترجمه خودکار برای ایجاد ارتباط موثرتر میان تمامی مردم دنیا امری ضروری به حساب می‌آید.

یادگیری ماشینی در میان زباله‌ها!

 
یک استارتاپ انگلیسی، یک مدل رایانه‌ای مبتنی بر یادگیری ماشینی ابداع کرده تا روش‌های مدیریت پسماند و تفکیک زباله را بهبود ببخشد.
 
 به نقل از تک‌کرانچ، یک استارتاپ انگلیسی موسوم به "گری‌پاروت" (Greyparrot) قصد دارد مدیریت پسماند را بهبود ببخشد. این شرکت، از بینش رایانه‌ای استفاده کرده تا مدیریت پسماند را به صورت کارآمدتر و در مراحل متفاوتی انجام دهد.
 
گری‌پاروت، فناوری یادگیری ماشینی را با تصاویری از انواع متفاوت زباله به کار گرفته تا یک مدل رایانه‌ای را برای تشخیص شیشه، کاغذ، مقوا، روزنامه، قوطی‌ها و پلاستیک‌های گوناگون آموزش دهد. این شرکت، از یک دوربین ساده استفاده می‌کند که با رایانه ادغام شده و می‌تواند نوع زباله را در کسری از ثانیه شناسایی کند.
 
 
این نوع از فناوری می‌تواند در موارد گوناگونی به کار برود، اما به نظر می‌رسد نقش آن در کارخانه‌های مدیریت پسماند، بسیار امیدوارکننده است. کارخانه‌های مدیریت پسماند معمولا برای طبقه‌بندی زباله‌ها، ماشین‌های بسیاری را به کار می‌برند که زباله‌های کوچک و بزرگ، فلزات و زباله‌ها را از هم تفکیک می‌کنند؛ اما بسیاری از این ماشین‌ها در مراحل پایانی فرآیند تفکیک، به نیروی انسانی نیاز دارند.
 
از آنجا که با چنین روش‌هایی نمی‌توان زباله‌ها را با دقت صد در صد جدا کرد، انسان‌ها مجبور هستند که تا حد امکان به زباله‌ها نزدیک شوند. کارخانه‌های مدیریت پسماند معمولا برای انتقال زباله‌ها، لوله‌های بزرگی را به کار می‌برند؛ اما این لوله‌ها در بسیاری از موارد، از ایمنی کافی برخوردار نیستند.
 
گری‌پاروت تلاش می‌کند با فناوری جدید خود، گامی در بهبود این فرآیند بردارد. این مدل مبتنی بر یادگیری ماشینی می‌تواند زباله‌ها را ارزیابی کند و اجسامی را که می‌توانند به بروز مشکل منجر شوند، تشخیص دهد. در کنار این مدل، از یک ربات نیز استفاده می‌شود تا زباله‌های غیر ایمن را به صورت خودکار تفکیک کند.
 
 
استارتاپ گری‌پاروت در حال حاضر، فناوری جدید خود را در انگلستان و کره جنوبی آزمایش می‌کند و قصد دارد در آینده استفاده از آن را گسترش دهد.