مدل جدید هوش مصنوعی با قابلیت ترجمه گفتاری ۱۰۰ زبان

شفقنا – شرکت متا به تازگی یک مدل هوش مصنوعی منتشر کرده است که می‌تواند گفتارها را از ۱۰۱ زبان مختلف ترجمه کند.

به گزارش سرویس ترجمه شفقنا،

براساس گزارش پایگاه خبری تکنولوژی رویو (Technology Review)، این مدل گامی به سوی ترجمه‌ی همزمان و بی‌درنگ است؛ جایی که کلمات به محض خروج از دهان گوینده ترجمه می‌شوند.

این گزارش افزود، معمولاً مدل‌های ترجمه برای گفتار از یک رویکرد چند مرحله‌ای استفاده می‌کنند. ابتدا گفتار را به متن تبدیل می‌کنند. سپس آن متن را به متن به زبان دیگری ترجمه می‌کنند. در نهایت، متن ترجمه شده به یک گفتار به زبان جدید تبدیل می‌شود.

این روش ناکارآمد است و در هر مرحله، خطاها و ترجمه‌های اشتباه می‌توانند رخ دهد. اما مدل جدید متا که SeamlessM4T، نام دارد ترجمه‌ی مستقیم‌تر از گفتار به یک زبان به گفتار به زبان دیگر را امکان‌پذیر می‌کند.

مجله نیچر در گزارشی به بررسی این ابزار ترجمه جدید پرداخته است.

«سیم‌لس» می‌تواند متن را با دقتی ۲۳ درصد بیشتر از بهترین مدل‌های موجود ترجمه کند و اگرچه مدل دیگر به نام «گوگل آئودی پالم»، از نظر فنی می‌تواند زبان‌های بیشتری را ترجمه کند ( ۱۱۳ زبان در مقابل ۱۰۱ زبان برای سیم‌لس) آئودی پالم فقط می‌تواند به انگلیسی ترجمه کند. اما سم‌لس می‌تواند به 36 زبان دیگر دنیا ترجمه کند.

به گزارش نیچر، کلید این کار فرآیندی به نام «داده‌کاوی موازی» است که مواردی را پیدا می‌کند که صدا در یک ویدیو یا صدا با زیرنویس به زبان دیگری از داده‌هایی که داخل فضای وب است مطابقت دارد. این مدل یاد گرفته که این صداها را به یک زبان با قسمت‌های متنی منطبق به زبان دیگر مرتبط کند. این موضوع گنجینه جدیدی از نمونه‌های ترجمه را برای مدل آنها باز کرد.

چتان جایسوال، استاد علوم کامپیوتر در دانشگاه کوینیپیاک می‌گوید: متا با داشتن گستره‌ای از چیزهای مختلفی که پشتیبانی می‌کند، مانند تبدیل متن به گفتار، گفتار به متن، حتی تشخیص خودکار گفتار، کار بزرگی انجام داده است. تعداد زبان‌هایی که آن‌ها پشتیبانی می‌کنند، یک دستاورد فوق‌العاده است.

محققان در این مقاله می‌گویند، مترجمان انسانی هنوز بخش حیاتی فرآیند ترجمه هستند، زیرا می‌توانند مسائل فرهنگی بسیار متنوع را درک کنند و مطمئن شوند که هنگام انتقال از یک زبان به زبان دیگر معنی حفظ شود.
لین بوکر، محقق کانادایی در زمینه‌ ترجمه، فناوری‌ها و جامعه در دانشگاه لاوال در کبک می‌گوید که این مرحله مهم است. او می‌گوید: زبان‌ها بازتاب فرهنگ‌ها هستند و فرهنگ‌ها روش‌های خاص خود را برای دانستن چیزها دارند.

او افزود، وقتی صحبت از کاربردهایی مانند پزشکی یا حقوق می‌شود، ترجمه‌های ماشینی باید کاملاً توسط یک انسان بررسی مجدد شوند. در غیر این صورت ممکن است سوءتفاهم‌هایی رخ دهد. به عنوان مثال، هنگامی که از ترجمه‌ی گوگل برای ترجمه‌ اطلاعات بهداشت عمومی در مورد واکسن کووید-۱۹ از دپارتمان بهداشت ویرجینیا در ژانویه ۲۰۲۱ استفاده شد، عبارت «اجباری نیست» را در انگلیسی به «ضروری نیست» در اسپانیایی ترجمه کرد و کل معنی پیام را تغییر داد.

این گزارش در ادامه می‌گوید، مدل‌های هوش مصنوعی در برخی از زبان‌ها نسبت به سایر زبان‌ها نمونه‌های بسیار بیشتری برای آموزش دارند. این بدان معناست که مدل‌های فعلی گفتار به گفتار ممکن است بتوانند زبانی مانند یونانی را به انگلیسی ترجمه کنند، جایی که ممکن است نمونه‌های زیادی وجود داشته باشد، اما نمی‌توانند از زبان سواحیلی به زبان یونانی ترجمه کنند.

تیم پشت سیم‌لس با آموزش مدل بر روی میلیون‌ها ساعت صدای گفتاری به زبان‌های مختلف، قصد دارد این مشکل را حل کند. این پیش‌آموزش به آن اجازه داد تا الگوهای کلی زبان را تشخیص دهد و پردازش زبان‌های کمتر رایج را آسان‌تر کند.

جایسوال در ادامه می‌گوید، این سیستم، منبع باز است و محققان امیدوارند که این امر دیگران را به توسعه‌ قابلیت‌های فعلی آن تشویق کند. اما برخی در مورد میزان مفید بودن آن در مقایسه با مدلهای موجود تردید دارند.
وی افزود، مدل ترجمه‌ گوگل به اندازه‌ی سیم‌لس منبع باز نیست، اما بسیار سریع‌تر و پاسخگوتر است و هزینه‌ای هم ندارد.

این خبر را اینجا ببینید.

source

توسطecokhabari.com

توسط ecokhabari.com

پست های مرتبط

جمع آوری کارت‌های سوخت آزاد تکذیب شد

شکایت خانواده قربانیان از ChatGPT / آیا این هوش مصنوعی مانند یک راهنمای خودکشی عمل می‌کند؟

پزشک قانونی چه آزمایش‌هایی در پرونده پژمان جمشیدی گرفته است؟

You missed

جمع آوری کارت‌های سوخت آزاد تکذیب شد

شکایت خانواده قربانیان از ChatGPT / آیا این هوش مصنوعی مانند یک راهنمای خودکشی عمل می‌کند؟

پزشک قانونی چه آزمایش‌هایی در پرونده پژمان جمشیدی گرفته است؟

فیلم/ تمرینات بوکس وحید هاشمیان فضای مجازی را ترکاند