📅 جمعه ۰۲ آبان ۱۴۰۴ | ۱۷:۲۴📂 برگزیده ها🆔 کد خبر: 5063✍️ خبرنگار: سیده مبینا محسنی تکیه سیده مبینا محسنی تکیه🖨 چاپ

هوش مصنوعی | کشف نقطه سوئیچ یادگیری مدل‌های ترنسفورمر

مدل ترنسفورمر AI و لحظه سوئیچ یادگیری معنایی

همان‌طور که در مغز انسان، نحوه یادگیری هنوز تا حد زیادی یک راز باقی مانده است، ساختار زیربنایی یادگیری در مدل‌های ترنسفورمر هوش مصنوعی نیز پیچیده و ناشناخته است. پژوهشگران SISSA Medialab در ایتالیا اخیراً نقطه سوئیچ یادگیری این مدل‌ها را شناسایی کرده‌اند و یافته‌های خود را در مجله Journal of Statistical Mechanics: Theory and Experiment منتشر کرده‌اند. این مطالعه جزئیات عملکرد داخلی شبکه‌های عصبی مصنوعی را به‌طور دقیق تشریح می‌کند و نشان می‌دهد لحظه‌ای وجود دارد که مدل‌های زبانی بزرگ (LLM) از تحلیل موقعیت کلمات به درک معنایی منتقل می‌شوند.

لحظه حیاتی درک معنایی مدل‌های زبان بزرگ

هوگو کوی، پژوهشگر پسادکتری در مرکز علوم ریاضی و کاربردها (CMSA) دانشگاه هاروارد، همراه با همکارانش فریا بهرنس، فلورنت کرزاکالا و لنکا زدبورووا از EPFL توضیح داده‌اند که مطالعات تجربی پیشین نشان داده‌اند ظهور مکانیزم‌های الگوریتمی در مدل‌های زبانی به بهبود کیفی قابلیت‌های آن‌ها منجر می‌شود، اما چگونگی شکل‌گیری این مکانیزم‌ها همچنان مبهم بود. تیم SISSA با بررسی عملکرد داخلی LLMها لحظه‌ای را کشف کرد که هوش مصنوعی واقعاً معنای جملات را درک می‌کند، نه صرفاً موقعیت کلمات را دنبال می‌کند.

اهمیت درک AI مولد در زندگی روزمره

درک عملکرد AI مولد (Generative AI یا genAI) اهمیت بالایی دارد، زیرا استفاده از آن در محل کار و زندگی شخصی به سرعت در حال افزایش است. این فناوری با یادگیری عمیق قادر است محتوای تصویری، صوتی، ویدئویی و متنی تولید کند. نمونه‌هایی از genAI شامل اتوانکودرهای واریانسی (VAEها)، شبکه‌های مولد رقابتی (GANها)، مدل‌های انتشار (Diffusion Models) و ترنسفورمرها هستند. طبق گزارش فوریه ۲۰۲۵ National Bureau of Economic Research، ۳۹٪ از پاسخ‌دهندگان از AI مولد برای فعالیت‌های کاری یا غیرکاری استفاده می‌کنند و پرکاربردترین آن‌ها ChatGPT از OpenAI، Gemini از گوگل و GPT-based Microsoft Copilot هستند.

مدل‌های ترنسفورمر فناوری اصلی برای LLMها مانند ChatGPT، Gemini، Claude از Anthropic و Llama از Meta هستند. معماری ترنسفورمر نخستین بار در سال ۲۰۱۷ با مقاله «Attention is All You Need» معرفی شد. ویژگی متمایز این مدل‌ها، مکانیزم توجه خودکار است که امکان تمرکز بیشتر بر داده‌های مرتبط‌تر را فراهم می‌کند و باعث آموزش سریع‌تر و دقت بالاتر مدل می‌شود.

پژوهشگران برای تحلیل نقطه سوئیچ یادگیری از مفاهیم فیزیکی الهام گرفته‌اند، به‌ویژه مدل ایزینگ که فرو مغناطیس را توصیف می‌کند. در مدل ایزینگ، گذار فازی زمانی رخ می‌دهد که سیستم از حالت منظم به بی‌نظم منتقل شود، مشابه نقطه‌ای که در LLMها از وابستگی به موقعیت کلمات به درک معنایی رخ می‌دهد. تحقیقات نشان داد که این گذار فازی در LLMها کاملاً ناگهانی است. زیر نقطه سوئیچ، شبکه عصبی به موقعیت کلمات وابسته است، اما با عبور از نقطه سوئیچ، به‌طور آنی معنای جمله را درک می‌کند. فوریت این سوئیچ مشابه روشن کردن یک لامپ و لحظه «یورکا» آرشمیدس در کشف حجم است.

این یافته‌ها نشان می‌دهند که برای دستیابی به درک معنایی، LLMها باید گذار فازی مشخصی را تجربه کنند و از وابستگی به موقعیت کلمات به درک معنا عبور کنند. این کشف می‌تواند مسیر توسعه AI قابل توضیح و مقاوم‌تر در آینده را هموار کند و نقش مهمی در بهبود قابلیت‌های مدل‌های زبان بزرگ داشته باشد.

اشتراگ گذاری

X
Facebook
LinkedIn
Telegram
WhatsApp
Email
Pinterest

مطالب مرتبط

من کی هستم؟ سفر شجاعانه به کشف خود واقعی

سؤال یگانه و مهم‌ترین سؤالی که در زندگی خود خواهیم پرسید، این است: «من کی هستم؟» به‌طور کلی، ما آموزش نمی‌بینیم که چگونه به این سؤال پاسخ دهیم و معمولاً حتی آن را مطرح نمی‌کنیم، مگر اینکه به نقطه‌ای برسیم…
  ۱۴۰۴/۱۱/۲۲ ۱۹:۴۵

چالش هم‌والدی پس از طلاق و مرزهای حریم خصوصی کودک

نیاز کودک به حریم خصوصی باید با مسئولیت والدین برای هم‌والدیِ شفاف متعادل شود. این تعادل به‌ویژه در هم‌والدی پس از طلاق اهمیت دوچندان پیدا می‌کند؛ جایی که هر تصمیم درباره جریان اطلاعات می‌تواند بر اعتماد، اتحاد والدین و احساس…
  ۱۴۰۴/۱۱/۲۲ ۱۹:۲۳

آینده هفته کاری | آیا هوش مصنوعی ما را به سه‌روز کار در هفته می‌رساند؟

هفته کاری آن‌قدر در زندگی ما نهادینه شده که گویی بخشی از نظم طبیعی جهان است. بسیاری از ما هفته کاری پنج‌روزه را همان‌قدر بدیهی می‌دانیم که طلوع خورشید را. اما واقعیت این است که هفته کاری یک اختراع انسانی…
  ۱۴۰۴/۱۱/۲۲ ۱۹:۱۸

نظریه خودتعیین‌گری | چگونه انگیزش درونی، زندگی تکراری را به مسیر رشد تبدیل می‌کند؟

نظریه خودتعیین‌گری در روان‌شناسی توضیح می‌دهد چه چیزی واقعاً انسان‌ها را برمی‌انگیزد و چرا گاهی با وجود انجام همه وظایف‌، احساس رضایت نمی‌کنیم. وقتی روزهایتان با کارهای تکراری اما ضروری پر می‌شود، به‌راحتی ممکن است تصویر کلی زندگی را از…
  ۱۴۰۴/۱۱/۲۲ ۱۹:۱۳

چرخش چهار دهه‌ای روان‌شناسی | از روان‌کاوی تا عصب‌روان‌شناسی

عنوان فارسی: نگاهی نو به روندهای علم روان‌شناسی در چهار دهه اخیر عنوان انگلیسی: A New Perspective on Trends in Psychology نویسنده: Andrea Zagaria ، Luigi Lombardi سال انتشار: ۲۰۲۴ موضوع: تحلیل روندهای نظری در روان‌شناسی، مقایسه مکاتب اصلی روان‌شناسی…
  ۱۴۰۴/۱۱/۲۱ ۲۱:۱۹

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیشنهاد سردبیر/آموزش روانشناسی

  • برگزیده‌ها
  • پربازدیدها
  • آخرین اخبار
از ذهن تا خلاقیت: راز سیگنال‌های درونی و معنای پشت آن‌ها عشوه‌گری و صداقت در رابطه؛ نقش‌بازی یا احساس واقعی؟ مدیریت سرمایه در فارکس و روانشناسی معامله‌گری روانشناسی پول: از ذهن تا ثروت روانشناسی مالی: شناخت ذهن و احساس در تصمیم‌گیری‌های اقتصادی دیدن اوتیسم به عنوان تفاوت، نه نقص مزایا و معایب بازی‌های اینترنتی برای کودکان | توصیه‌های والدین اضطراب در نوجوانان: علل، علائم و راهکارهای مقابله فرآیند مشاوره و اهمیت درک احساسات افسردگی گاهی الهام‌بخش است، گاهی مانع سامانه تلفنی؛ مسیر کمک فوری در بحران‌های اجتماعی آنچه انیشتین را نابغه کرد، بهره هوشی او نبود مشکل نوظهور «روان‌پریشی هوش مصنوعی» روانشناسی پشت تفکر «ما در برابر آنها» | روانشناسی چیست؟ معضل همزاد هوش مصنوعی چگونه زمان را متوقف کنیم ایمنی روان‌شناختی در محیط کار؛ افسانه‌ها و واقعیت‌ها آیا شما هم به لبوبو ( Labubu ) علاقه دارید؟ چه زمانی راز خود را به معشوقتان می‌گویید؟ قابل‌اعتماد بودن در محیط کار: نقطه قوت یا مانع پیشرفت؟ دوستی نوجوانی: رشد عاطفی و تاب‌آوری در همسالان دانشکده روان‌شناسی UCLA: مرکز برتر آموزش و پژوهش روان‌شناسی دانشکده روان‌شناسی دانشگاه ییل: مرکز برجسته آموزش و پژوهش روان‌شناسی دانشکده روان‌شناسی UC Berkeley: پیشرو در آموزش و پژوهش روان‌شناسی تأثیر گرمای شدید بر روان انسان: خواب، خلق و عملکرد مغز APA: انجمن روان‌شناسی آمریکا و استانداردهای علمی و اخلاقی زندگی بدون الکل: انتخاب هوشیارانه در هنجارهای اجتماعی دو کلمه کوچک می‌توانند تفاوت بزرگی در یک رابطه ایجاد کنند اثرات آتش‌بازی بر مغز و سلامت: علم پشت ذرات معلق راه های کاهش استرس استرس در افراد بزرگسال رئیس سازمان نظام روان‌شناسی: «ستاد امنیت روان و آرام‌بخشی» راه اندازی شد معرفی کتاب چگونه کارهای خسته‌کننده، طاقت‌فرسا، دشوار، اما ضروری را انجام دهیم: هنر تحمل سختی‌ها و انجام کارهایی که از آنها متنفرید (کتاب ۱۹ زندگی منظم) نسخه کیندل معرفی کتاب «روانشناسی تاریک پرده‌برداری شد» ارتباط بین افسردگی و عزت نفس چرا ممکن است نخواهید به یک تست شخصیت اعتماد کنید استرس و اثرات آن بر دهان و دندان چرا نابرابری اجتماعی باعث افزایش خشونت در جامعه می شود؟ ضرورت توجه به فناوری‌های ارتباط از راه دور برای توانبخشی دکتر آزادارمکی: سن بالای ازدواج، آسیب نیست اندازه‌گیری سرعت پیری و پیش‌بینی زوال عقل با فناوریهای نوین تدوین برنامه «حمایت روانی و اجتماعی» از زنان در شرایط بحران ضروری است رئیس انجمن مددکاران اجتماعی : فقدان سیاستگذاری در حوزه کنترل  و کاهش آسیب‌های اجتماعی مشهود است ضرورت آموزش تاب آوری برای خانواده ها بایدها و نبایدهای مواجهه کودکان با بحران راهنمای حفظ سلامت روان در شرایط جنگی/ نشانه‌های شدید روانی جدی گرفته شود من کی هستم؟ سفر شجاعانه به کشف خود واقعی چالش هم‌والدی پس از طلاق و مرزهای حریم خصوصی کودک آینده هفته کاری | آیا هوش مصنوعی ما را به سه‌روز کار در هفته می‌رساند؟ نظریه خودتعیین‌گری | چگونه انگیزش درونی، زندگی تکراری را به مسیر رشد تبدیل می‌کند؟ چرخش چهار دهه‌ای روان‌شناسی | از روان‌کاوی تا عصب‌روان‌شناسی معرفی فیلم(۸۰) | ناتوانی معرفی کتاب(۸۰) | روان‌شناسی نفوذ بازتاب خطر در معاملات | راز پنهان رفتار معامله‌گران در سود و زیان دردهای پنهان و درس‌هایی که دنده شکسته به ما می‌آموزد وقتی انسان‌ها هنوز نمی‌بینند | ظهور ۱.۵ میلیون عامل هوش مصنوعی

دسته‌بندی‌ها

پیمایش به بالا