پژوهشگاه فرهنگ و هنر
پژوهشکده فناوری های پیشرفته و هوش مصنوعی
Advanced Technologies & Artificial Intelligence
Research Institute

نوع جدیدی از مدل یادگیری نسبت به هوش مصنوعی معمولی از داده های بسیار کمتری استفاده می کند و به محققان با منابع محدود امکان می دهد تا در این امر مشارکت کنند.
جی پی تی -۳ مدلی از زبان هوش مصنوعی قادر به درک متن است با پاسخ به سوالات و تولید نمونه های جدید نوشتاری ، توجه رسانه های بین المللی را به خود جلب کرده است. این سیستم های هوش مصنوعی با اهداف عمومی منتشر شده است ، توانایی چشمگیری در تقلید نوشتن انسانی دارد ، اما اندازه عظیم آن نیز به همان اندازه قابل توجه است. برای ساخت آن ، محققان 175 میلیارد پارامتر (نوعی واحد محاسباتی) و بیش از 45 ترابایت متن را از Common Crawl ، Reddit ، Wikipedia و منابع دیگر جمع آوری کردند ، سپس آن را در روندی آموزش دادند که صدها واحد پردازش را برای هزاران ساعت پردازش می کند.
جی پی -۳روند گسترده تری را در هوش مصنوعی نشان می دهد. یادگیری عمیق ، که در سالهای اخیر به تکنیک غالب برای ایجاد هوش مصنوعی جدید تبدیل شده است ، از حجم عظیم داده و قدرت محاسباتی برای تأمین مدلهای پیچیده و دقیق استفاده می کند. این منابع برای محققان شرکتهای بزرگ و دانشگاههای متقاضی بیشتر در دسترس است. یکی از این پیشرفت های اخیر (یادگیری LO-shot) نام دارد که توسط ایلیا سوچولوتسکی و ماتیاس شونلاو از دانشگاه واترلو توسعه یافته است. اصل یادگیری LO-shot این است که باید یک هوش مصنوعی بتواند در مورد اشیا موجود در جهان بدون اینکه به عنوان مثال از هر یک از آنها تغذیه کند ، اطلاعات کسب کند. این یک مانع بزرگ برای سیستم های هوش مصنوعی معاصر بوده است ، که برای یادگیری تشخیص اشیا معمولاً به هزاران مثال نیاز دارد. از طرف دیگر ، انسانها معمولاً می توانند از نمونه های موجود جدا شوند تا بتوانند موارد جدیدی را که قبلاً دیده نشده اند را تشخیص دهند. به عنوان مثال ، وقتی به کودکی اشکال مختلف نشان داده شود ، کودک می تواند به راحتی بین نمونه ها تفاوت قائل شود و روابط بین آنچه را که نشان داده شده و اشکال جدید را تشخیص دهد.
ابتدا این نوع یادگیری را از طریق فرایندی به نام تقطیر نرم انجام می دهد.. یک پایگاه داده تصویری که توسط انستیتوی ملی استاندارد و فناوری تحت عنوان MNIST نگهداری می شود و شامل 60،000 نمونه ارقام نوشته شده از 0 تا 9 است ، به 5 تصویر تقسیم شد که ویژگی های تعداد مختلف را با هم مخلوط می کرد. پس از نشان دادن فقط این پنج مثال ، سیستم دانشگاه واترلو توانست 92 درصد از تصاویر باقیمانده را به طور دقیق در پایگاه داده طبقه بندی کند.ه از لحاظ تئوریک ، تکنیک های LO-shot به هوش مصنوعی اجازه می دهد تا به طور بالقوه یادگیری تشخیص هزاران اشیا را با توجه به یک مجموعه داده کوچک حتی از دو مثال ، بیاموزد. این یک پیشرفت عالی در سیستم های یادگیری عمیق سنتی است ، که در آن تقاضا برای داده ها با نیاز به تمیز بیشتر اشیا افزایش می یابد. در حال حاضر ، مجموعه های کوچک داده LO-shot باید به دقت مهندسی شوند تا ویژگی های طبقات مختلف اشیا پالایش شود. اما سوچولوتسکی با بررسی روابط بین اشیایی که قبلاً در مجموعه داده های کوچک موجود گرفته شده اند ، در صدد توسعه بیشتر این کار است.
به چندین دلیل اجازه دادن به هوش مصنوعی برای یادگیری با داده های بسیار کمتر مهم است. اول اینکه ، با مجبور کردن سیستم برای تعمیم دادن به طبقه بندی هایی که ندیده است ، فرآیند واقعی یادگیری را بهتر محصور می کند. با ایجاد انتزاعاتی که روابط بین اشیا را به دست می آورد ، احتمال تبعیض را کاهش می دهد. در حال حاضر ، سیستم های یادگیری عمیق طعمه تبعیض ناشی از ویژگی های نامرتبط در داده هایی می شوند که برای آموزش استفاده می کنند. یک نمونه مشهور از این مشکل این است که هوش مصنوعی سگها را در هنگام نمایش تصاویر در یک محیط برفی ، به عنوان گرگ طبقه بندی می کند - زیرا بیشتر تصاویر گرگها را در نزدیکی برف نشان می دهد. کاهش نیاز به داده باعث می شود که این سیستم ها کمتر در معرض این نوع تبعیض باشند.
در مرحله بعدی ، هرچه داده های گسترده تری برای استفاده فرد مورد نیاز باشد ، انگیزه کمتری برای نظارت بر افراد برای ساخت الگوریتم های بهتر وجود دارد. به عنوان مثال ، روش های تقطیر نرم در حال حاضر بر روی تحقیقات هوش مصنوعی پزشکی تأثیر گذاشته است ، که با استفاده از اطلاعات حساس سلامتی ، مدل های آن را آموزش می دهد. محققان از پالایش نرم در تصاویر اشعه ایکس تشخیصی بر اساس مجموعه ای از داده کوچک و با حفظ حریم خصوصی استفاده کردند.
سرانجام ، اجازه دادن به هوش مصنوعی برای یادگیری با داده های کمتر ، به همگانی سازی حوزه هوش مصنوعی کمک می کند. با هوش مصنوعی کوچکتر ، آکادمی می تواند مرتبط باقی بماند و از خطر بهم خوردگی اساتید توسط این صنعت جلوگیری کند. نه تنها یادگیری LO-shot با کاهش هزینه های آموزش و کاهش نیاز به داده ها ، موانع ورود را کاهش می دهد ، بلکه همچنین انعطاف پذیری بیشتری برای ایجاد مجموعه داده های جدید و آزمایش رویکردهای جدید برای کاربران فراهم می آورد. با کاهش زمان صرف شده برای مهندسی داده ها و معماری ، محققانی که به دنبال استفاده از هوش مصنوعی هستند می توانند زمان بیشتری را با تمرکز بر مشکلات عملی که برای حل آنها تلاش می کنند صرف کنند.
محقق :حامد نقویان
