شفقنا – شرکت متا به تازگی یک مدل هوش مصنوعی منتشر کرده است که میتواند گفتارها را از ۱۰۱ زبان مختلف ترجمه کند.
به گزارش سرویس ترجمه شفقنا،
براساس گزارش پایگاه خبری تکنولوژی رویو (Technology Review)، این مدل گامی به سوی ترجمهی همزمان و بیدرنگ است؛ جایی که کلمات به محض خروج از دهان گوینده ترجمه میشوند.
این گزارش افزود، معمولاً مدلهای ترجمه برای گفتار از یک رویکرد چند مرحلهای استفاده میکنند. ابتدا گفتار را به متن تبدیل میکنند. سپس آن متن را به متن به زبان دیگری ترجمه میکنند. در نهایت، متن ترجمه شده به یک گفتار به زبان جدید تبدیل میشود.
این روش ناکارآمد است و در هر مرحله، خطاها و ترجمههای اشتباه میتوانند رخ دهد. اما مدل جدید متا که SeamlessM4T، نام دارد ترجمهی مستقیمتر از گفتار به یک زبان به گفتار به زبان دیگر را امکانپذیر میکند.
مجله نیچر در گزارشی به بررسی این ابزار ترجمه جدید پرداخته است.
«سیملس» میتواند متن را با دقتی ۲۳ درصد بیشتر از بهترین مدلهای موجود ترجمه کند و اگرچه مدل دیگر به نام «گوگل آئودی پالم»، از نظر فنی میتواند زبانهای بیشتری را ترجمه کند ( ۱۱۳ زبان در مقابل ۱۰۱ زبان برای سیملس) آئودی پالم فقط میتواند به انگلیسی ترجمه کند. اما سملس میتواند به 36 زبان دیگر دنیا ترجمه کند.
به گزارش نیچر، کلید این کار فرآیندی به نام «دادهکاوی موازی» است که مواردی را پیدا میکند که صدا در یک ویدیو یا صدا با زیرنویس به زبان دیگری از دادههایی که داخل فضای وب است مطابقت دارد. این مدل یاد گرفته که این صداها را به یک زبان با قسمتهای متنی منطبق به زبان دیگر مرتبط کند. این موضوع گنجینه جدیدی از نمونههای ترجمه را برای مدل آنها باز کرد.
چتان جایسوال، استاد علوم کامپیوتر در دانشگاه کوینیپیاک میگوید: متا با داشتن گسترهای از چیزهای مختلفی که پشتیبانی میکند، مانند تبدیل متن به گفتار، گفتار به متن، حتی تشخیص خودکار گفتار، کار بزرگی انجام داده است. تعداد زبانهایی که آنها پشتیبانی میکنند، یک دستاورد فوقالعاده است.
محققان در این مقاله میگویند، مترجمان انسانی هنوز بخش حیاتی فرآیند ترجمه هستند، زیرا میتوانند مسائل فرهنگی بسیار متنوع را درک کنند و مطمئن شوند که هنگام انتقال از یک زبان به زبان دیگر معنی حفظ شود.
لین بوکر، محقق کانادایی در زمینه ترجمه، فناوریها و جامعه در دانشگاه لاوال در کبک میگوید که این مرحله مهم است. او میگوید: زبانها بازتاب فرهنگها هستند و فرهنگها روشهای خاص خود را برای دانستن چیزها دارند.
او افزود، وقتی صحبت از کاربردهایی مانند پزشکی یا حقوق میشود، ترجمههای ماشینی باید کاملاً توسط یک انسان بررسی مجدد شوند. در غیر این صورت ممکن است سوءتفاهمهایی رخ دهد. به عنوان مثال، هنگامی که از ترجمهی گوگل برای ترجمه اطلاعات بهداشت عمومی در مورد واکسن کووید-۱۹ از دپارتمان بهداشت ویرجینیا در ژانویه ۲۰۲۱ استفاده شد، عبارت «اجباری نیست» را در انگلیسی به «ضروری نیست» در اسپانیایی ترجمه کرد و کل معنی پیام را تغییر داد.
این گزارش در ادامه میگوید، مدلهای هوش مصنوعی در برخی از زبانها نسبت به سایر زبانها نمونههای بسیار بیشتری برای آموزش دارند. این بدان معناست که مدلهای فعلی گفتار به گفتار ممکن است بتوانند زبانی مانند یونانی را به انگلیسی ترجمه کنند، جایی که ممکن است نمونههای زیادی وجود داشته باشد، اما نمیتوانند از زبان سواحیلی به زبان یونانی ترجمه کنند.
تیم پشت سیملس با آموزش مدل بر روی میلیونها ساعت صدای گفتاری به زبانهای مختلف، قصد دارد این مشکل را حل کند. این پیشآموزش به آن اجازه داد تا الگوهای کلی زبان را تشخیص دهد و پردازش زبانهای کمتر رایج را آسانتر کند.
جایسوال در ادامه میگوید، این سیستم، منبع باز است و محققان امیدوارند که این امر دیگران را به توسعه قابلیتهای فعلی آن تشویق کند. اما برخی در مورد میزان مفید بودن آن در مقایسه با مدلهای موجود تردید دارند.
وی افزود، مدل ترجمه گوگل به اندازهی سیملس منبع باز نیست، اما بسیار سریعتر و پاسخگوتر است و هزینهای هم ندارد.
این خبر را اینجا ببینید.
source