📅 جمعه ۰۲ آبان ۱۴۰۴ | ۱۷:۲۴📂 برگزیده ها🆔 کد خبر: 5063✍️ خبرنگار: سیده مبینا محسنی تکیه🖨 چاپ

هوش مصنوعی | کشف نقطه سوئیچ یادگیری مدل‌های ترنسفورمر

همان‌طور که در مغز انسان، نحوه یادگیری هنوز تا حد زیادی یک راز باقی مانده است، ساختار زیربنایی یادگیری در مدل‌های ترنسفورمر هوش مصنوعی نیز پیچیده و ناشناخته است. پژوهشگران SISSA Medialab در ایتالیا اخیراً نقطه سوئیچ یادگیری این مدل‌ها را شناسایی کرده‌اند و یافته‌های خود را در مجله Journal of Statistical Mechanics: Theory and Experiment منتشر کرده‌اند. این مطالعه جزئیات عملکرد داخلی شبکه‌های عصبی مصنوعی را به‌طور دقیق تشریح می‌کند و نشان می‌دهد لحظه‌ای وجود دارد که مدل‌های زبانی بزرگ (LLM) از تحلیل موقعیت کلمات به درک معنایی منتقل می‌شوند.

لحظه حیاتی درک معنایی مدل‌های زبان بزرگ

هوگو کوی، پژوهشگر پسادکتری در مرکز علوم ریاضی و کاربردها (CMSA) دانشگاه هاروارد، همراه با همکارانش فریا بهرنس، فلورنت کرزاکالا و لنکا زدبورووا از EPFL توضیح داده‌اند که مطالعات تجربی پیشین نشان داده‌اند ظهور مکانیزم‌های الگوریتمی در مدل‌های زبانی به بهبود کیفی قابلیت‌های آن‌ها منجر می‌شود، اما چگونگی شکل‌گیری این مکانیزم‌ها همچنان مبهم بود. تیم SISSA با بررسی عملکرد داخلی LLMها لحظه‌ای را کشف کرد که هوش مصنوعی واقعاً معنای جملات را درک می‌کند، نه صرفاً موقعیت کلمات را دنبال می‌کند.

اهمیت درک AI مولد در زندگی روزمره

درک عملکرد AI مولد (Generative AI یا genAI) اهمیت بالایی دارد، زیرا استفاده از آن در محل کار و زندگی شخصی به سرعت در حال افزایش است. این فناوری با یادگیری عمیق قادر است محتوای تصویری، صوتی، ویدئویی و متنی تولید کند. نمونه‌هایی از genAI شامل اتوانکودرهای واریانسی (VAEها)، شبکه‌های مولد رقابتی (GANها)، مدل‌های انتشار (Diffusion Models) و ترنسفورمرها هستند. طبق گزارش فوریه ۲۰۲۵ National Bureau of Economic Research، ۳۹٪ از پاسخ‌دهندگان از AI مولد برای فعالیت‌های کاری یا غیرکاری استفاده می‌کنند و پرکاربردترین آن‌ها ChatGPT از OpenAI، Gemini از گوگل و GPT-based Microsoft Copilot هستند.

مدل‌های ترنسفورمر فناوری اصلی برای LLMها مانند ChatGPT، Gemini، Claude از Anthropic و Llama از Meta هستند. معماری ترنسفورمر نخستین بار در سال ۲۰۱۷ با مقاله «Attention is All You Need» معرفی شد. ویژگی متمایز این مدل‌ها، مکانیزم توجه خودکار است که امکان تمرکز بیشتر بر داده‌های مرتبط‌تر را فراهم می‌کند و باعث آموزش سریع‌تر و دقت بالاتر مدل می‌شود.

پژوهشگران برای تحلیل نقطه سوئیچ یادگیری از مفاهیم فیزیکی الهام گرفته‌اند، به‌ویژه مدل ایزینگ که فرو مغناطیس را توصیف می‌کند. در مدل ایزینگ، گذار فازی زمانی رخ می‌دهد که سیستم از حالت منظم به بی‌نظم منتقل شود، مشابه نقطه‌ای که در LLMها از وابستگی به موقعیت کلمات به درک معنایی رخ می‌دهد. تحقیقات نشان داد که این گذار فازی در LLMها کاملاً ناگهانی است. زیر نقطه سوئیچ، شبکه عصبی به موقعیت کلمات وابسته است، اما با عبور از نقطه سوئیچ، به‌طور آنی معنای جمله را درک می‌کند. فوریت این سوئیچ مشابه روشن کردن یک لامپ و لحظه «یورکا» آرشمیدس در کشف حجم است.

این یافته‌ها نشان می‌دهند که برای دستیابی به درک معنایی، LLMها باید گذار فازی مشخصی را تجربه کنند و از وابستگی به موقعیت کلمات به درک معنا عبور کنند. این کشف می‌تواند مسیر توسعه AI قابل توضیح و مقاوم‌تر در آینده را هموار کند و نقش مهمی در بهبود قابلیت‌های مدل‌های زبان بزرگ داشته باشد.

سیده مبینا محسنی تکیه

خبرنگار

اشتراگ گذاری

▼

مطالب مرتبط

▼

دانشکده روانشناسی کمبریج

دانشکده روان‌شناسی دانشگاه کمبریج یکی از قدیمی‌ترین و معتبرترین مراکز پژوهشی و آموزشی در اروپا و جهان در حوزه روان‌شناسی به شمار می‌آید. این دانشکده با هدف پیشبرد علم روان‌شناسی و تربیت پژوهشگران و متخصصان برجسته تأسیس شده و نقش…

۱۴۰۵/۰۳/۱۸ ۲۱:۳۷

خبر مهم اول

از ذهن تا خلاقیت: راز سیگنال‌های درونی و معنای پشت آن‌ها

مغز ما از نمادها مانند آهنگ‌ها و عبارات به‌عنوان میان‌برهای احساسی استفاده می‌کند. استعاره‌ها و الگوها ممکن است بازتابی از حل مسئله درونی ما باشند، نه نشانه‌ای از ماوراء طبیعی. توجه به این سیگنال‌ها می‌تواند به شما کمک کند آزادانه‌تر…

۱۴۰۵/۰۳/۱۸ ۲۰:۰۹

از ذهن تا خلاقیت: راز سیگنال‌های درونی و معنای پشت آن‌ها

تیتر اول

بحران فرهنگ سیاسی آمریکا و ضرورت تغییر

فرهنگ سیاسی آمریکا امروز دچار بحران و شکست است. خشونت‌های سیاسی اخیر، از جمله قتل فعال محافظه‌کار چارلی کرک و پیامدهای آن، نشانه‌های واضحی از عمق بحران و ناکارآمدی سیاست در آمریکا هستند. مردم در تمام طیف‌های سیاسی خواستار تغییر…

۱۴۰۵/۰۳/۱۸ ۱۹:۲۰

خبر مهم اول

زندگی در ابهام و پذیرش ناشناخته‌ها

زندگی در شرایط عدم قطعیت می‌تواند فرصت‌های ناشناخته و امکانات تازه‌ای پیش روی ما بگذارد. رشد و شکوفایی انسانی به معنای کاوش در ناشناخته‌ها و پذیرفتن کمبود دانش است. این تجربه به ما اجازه می‌دهد که یادگیری را نه فقط…

۱۴۰۵/۰۳/۱۸ ۱۹:۱۴

خبر مهم اول

چه چیزی میل ما به نمادهای جایگاه اجتماعی را تقویت می‌کند؟

فرهنگ ما با باورهای متناقض درباره قبیله‌گرایی و استثناگرایی فردی ساخته شده است. قبیله‌گرایی پیش‌تر بر اساس خانواده شکل می‌گرفت، اما طی هزار سال گذشته به سمت ثروت و وضعیت اجتماعی حرکت کرده است. گروه‌های ممتاز جدید هر روز شکل…

۱۴۰۵/۰۳/۱۸ ۱۹:۰۱