برخی معماریهای الهامگرفته از ساختار مغز میتوانند حتی پیش از آموزش با هرگونه داده، الگوهای فعالیتی تولید کنند که بهطور چشمگیری با واکنشهای مغز انسان و نخستیها همخوان است. این یافته نقش «طراحی معماری» را در یادگیری هوش مصنوعی پررنگتر کرده و فرضیه دیرینهٔ تکیه انحصاری مدلها بر دادههای عظیم را زیر سؤال میبرد. تینا […]
برخی معماریهای الهامگرفته از ساختار مغز میتوانند حتی پیش از آموزش با هرگونه داده، الگوهای فعالیتی تولید کنند که بهطور چشمگیری با واکنشهای مغز انسان و نخستیها همخوان است. این یافته نقش «طراحی معماری» را در یادگیری هوش مصنوعی پررنگتر کرده و فرضیه دیرینهٔ تکیه انحصاری مدلها بر دادههای عظیم را زیر سؤال میبرد.
تینا مزدکی_پژوهش اخیر دانشمندان نشان میدهد طراحی معماری مدل ممکن است بسیار مهمتر از فرایندهای سنگین یادگیری عمیقی باشد که معمولاً ماهها زمان میبرند، انرژی عظیمی مصرف میکنند و هزینههایی در حد میلیاردها دلار دارند.
میک بانر، نویسنده اصلی پژوهش و استادیار علوم شناختی دانشگاه جانز هاپکینز، میگوید: «مسیر فعلی هوش مصنوعی این است که حجم عظیمی از داده را به مدلها تزریق کنیم و منابع محاسباتی در مقیاس یک شهر کوچک بسازیم. چنین کاری صدها میلیارد دلار هزینه دارد. در حالیکه انسانها برای یادگیری بینایی به داده بسیار کمی نیاز دارند. احتمالاً تکامل این معماری را بیدلیل انتخاب نکرده است. یافتههای ما نشان میدهد معماریهایی که شبیهتر به مغزند، نقطه شروع بسیار بهتری برای سیستمهای هوش مصنوعی فراهم میکنند.»
بررسی معماریهای هوش مصنوعی در برابر فعالیت مغز
در این پژوهش، سه دسته اصلی از طراحی شبکهها که معمولاً مبنای ساخت مدلهای مدرن هستند، بررسی شد:
- معماریهای ترنسفورمر
- شبکههای کاملاً متصل (Fully Connected)
- شبکههای عصبی کانولوشنی (CNN)
محققان با ایجاد تغییرات متعدد در این سه معماری، دهها شبکه عصبی مصنوعی جدید ساختند. سپس به این شبکههایی هیچگونه آموزشی ندیده بودند تصاویر مختلف، شامل اشیا، انسانها و حیوانات نشان دادند و پاسخ آنها را با فعالیت مغزی انسان و نخستیسانان در مواجهه با همان تصاویر مقایسه کردند.
نتایج نشان داد که افزایش تعداد نورونها در ترنسفورمرها و شبکههای تماممتصل تأثیر چندانی ایجاد نمیکند. اما در مورد شبکههای کانولوشنی، تغییرات معماری باعث شد الگوهای فعالیت به شکل قابلتوجهی شبیهتر به مغز انسان شود.

معماری مهمتر از آن چیزی است که تصور میشد
طبق یافتهها، شبکههای کانولوشنی بدون هیچ آموزش قبلی و تنها بر پایه معماری توانستند الگویی شبیه مدلهای رایج آموزشدیده با میلیونها یا میلیاردها تصویر تولید کنند. این نتیجه بهطور جدی این فرض را زیر سؤال میبرد که یادگیری از داده عظیم، تنها راه رسیدن به هوش مصنوعی مشابه مغز است.
بانر میگوید: «اگر آموزش روی دادههای گسترده واقعاً عامل اصلی باشد، نباید هیچ راهی وجود داشته باشد که تنها با تغییر معماری به سیستمهایی نزدیک به مغز برسیم. این یعنی با شروع از یک معماری درست و شاید اضافهکردن بینشهای بیشتر از زیستشناسی میتوانیم سرعت یادگیری در سیستمهای هوش مصنوعی را بهطور چشمگیری افزایش دهیم.»
گام بعدی تیم تحقیقاتی، توسعه الگوریتمهای یادگیری ساده و الهامگرفته از زیستشناسی است که ممکن است منجر به یک چارچوب یادگیری عمیق جدید شود.
منبع: scitechdaily
۲۲۷۳۲۳
کد مطلب ۲۱۵۲۸۹۳
- خرید ارزان بلیط هواپیما از ۹۰۰ ایرلاین رزرو ارزان ۱.۵ میلیون هتل در سراسر دنیا خرید آنلاین بلیط قطار با بهترین قیمت انواع تورهای مسافرتی، برای هر نوع سلیقه اخذ ویزای آنلاین ۵۰ کشور در کوتاهترین زمان صدور فوری انواع بیمه مسافرتی داخلی و خارجی
-
نحوه توسعه مدلهای هوش مصنوعی میلیارد دلاری زیر سوال رفت
-
۶ توصیه برای استفاده بهتر از «ChatGPT»

































