Wp Header Logo 4185.png

شفقنا – تصور کنید در حال ساختن یک مدل هوش مصنوعی قدرتمند هستید و ساعت‌ها و هزینه‌های زیادی را صرف آموزش آن می‌کنید، اما بدون اینکه متوجه شوید، خطایی کوچک و پنهان در پس‌زمینه در حال کار است. این خطاهای «خاموش» عملکرد مدل را به‌آرامی کاهش می‌دهند و منابع باارزش شما را هدر می‌دهند. اکنون، پژوهشگران، یک ابزار منبع‌باز جدید به نام «ترین‌چک» توسعه داده‌اند که دقیقاً برای شناسایی این خطاهای دشوار طراحی شده است.

به گزارش سرویس ترجمه شفقنا، «ترین‌چک» که در دانشگاه میشیگان توسعه یافته است، رویکردی نوین برای شناسایی این خطاهای پنهان ارائه داده است. رایان هوانگ، استاد علوم کامپیوتر و مهندسی در دانشگاه میشیگان و نویسنده ارشد این مطالعه می‌گوید: با توسعه ترین‌چک، هدف ما این است که توسعه‌دهندگان را به ابزارهای بهتری برای رفع خطاهای خاموش مجهز کنیم و در نهایت، سیستم‌های هوش مصنوعی قوی‌تری را ممکن سازیم.

روش‌های فعلی برای نظارت بر آموزش یادگیری عمیق، به سیگنال‌های سطح بالا مانند «Loss» (میزان خطای پیش‌بینی‌های مدل نسبت به پاسخ صحیح)، «Accuracy» (درصد پاسخ‌های صحیح) و «Gradient Norms» (میزان تغییر پارامترهای مدل در هر گام آموزشی) متکی هستند. مشکل اینجاست که این معیارها «پر سر و صدا» هستند؛ به طور طبیعی در طول آموزش نوسان می‌کنند و همین امر تمایز بین تغییرات عادی و یک مشکل واقعی را بسیار دشوار می‌سازد.

به عنوان مثال، در آموزش مدل BLOOM-176B LLM شرکت هاگینگ‌فیس، یک خطای خاموش به دلیل عدم ایجاد تغییرات آشکار در Loss یا Accuracy نادیده گرفته شد. این باگ باعث شد مدل‌های نهایی آموزش‌دیده غیرقابل استفاده شوند، در نتیجه ماه‌ها محاسبات پرهزینه به هدر رفت.

رویکرد جدید ترین‌چک بر «ثبات آموزشی» تکیه دارد؛ این‌ها قوانینی هستند که باید در طول فرآیند آموزش ثابت بمانند. این چارچوب به طور مداوم مواردی که باید ثبات داشته باشند را پایش می‌کند، بلافاصله در مورد انحرافات به توسعه‌دهندگان هشدار می‌دهد و اطلاعات اشکال‌زدایی دقیقی را برای کمک به یافتن ریشه مشکل ارائه می‌دهد. این یک گام بزرگ رو به جلو نسبت به روش‌های سطح بالا قبلی است که حتی اگر مشکلی شناسایی می‌شد، نمی‌توانستند علت اصلی آن را پیدا کنند.

تیم تحقیقاتی ترین‌چک را روی ۲۰ خطای خاموش واقعی آزمایش کرد و عملکرد آن را با چهار روش تشخیص موجود مقایسه نمود. ترین‌چک با موفقیت ۱۸ مورد از ۲۰ خطای خاموش را شناسایی کرد، در حالی که با روش‌های قبلی تنها دو مورد را شناسایی کردند. تشخیص‌ها نشان داد که از ۱۸ خطای شناسایی شده توسط ترین‌چک، گزارش‌های نقض در ۱۰ مورد ریشه دقیق مشکل را پیدا کرده و در ۸ مورد دیگر نزدیک به ریشه مشکل را بومی‌سازی کرده‌اند.

نتایج قوی نشان می‌دهد که ترین‌چک می‌تواند در چارچوب‌های مختلف یادگیری ماشین ادغام شود و ابزاری فعال را برای جلوگیری از خطاها در اختیار توسعه‌دهندگان قرار دهد. با ارائه تشخیص زودهنگام خطاهای خاموش، این ابزار هدر رفت منابع را به حداقل می‌رساند و دقت و پایداری مدل را افزایش می‌دهد.

این خبر را اینجا ببینید.

source

ecokhabari.com

توسط ecokhabari.com