۱ هفته پیش
مدل های زبانی بزرگ به کمک ربات ها می آیند راهبرد معاصر
![](https://rahbordemoaser.ir/files/fa/news/1403/3/27/739578_464.jpg)
به گزارش راهبرد معاصر؛ ممکن است روزی بخواهید ربات خانگی شما لباسهای کثیف را به طبقه پایین خانه ببرد و آنها را در ماشین لباسشویی بگذارد. ربات باید دستورالعملهای شما را با مشاهدات بصری خود ترکیب کند تا مراحل تکمیل این کار را تشخیص دهد.
به نقل از ساینس دیلی، شاید یک روش جدید بتواند مسیری را برای ربات تنها با استفاده از ورودیهای مبتنی بر زبان برنامهریزی کند. اگرچه این روش نمیتواند بهتر از روشهای مبتنی بر بینش رایانهای عمل کند، اما میتواند در تنظیماتی که فاقد دادههای بصری برای آموزش دادن ربات هستند، سودمند باشد.
برای یک عامل هوش مصنوعی، حرف زدن درباره این کار آسانتر از انجام دادن آن است. روشهای کنونی اغلب از چندین مدل یادگیری ماشینی برای برخورد با بخشهای گوناگون کار استفاده میکنند که به تلاش و تخصص انسانی زیادی نیاز دارند. این روشها که از بازنماییهای بصری به منظور تصمیمگیری مستقیم برای جهتیابی استفاده میکنند، حجم زیادی از دادههای بصری را برای آموزش میخواهند که اغلب به سختی به دست میآیند.
پژوهشگران دانشگاه «امآیتی» (MIT) و «آزمایشگاه هوش مصنوعی واتسون امآیتی-آیبیام» (MIT-IBM Watson AI Lab) برای غلبه بر این چالشها، یک روش جهتیابی ابداع کردند که نمایشهای بصری را به بخشهای زبانی تبدیل میکند. سپس این بخشها به یک مدل زبانی بزرگ وارد میشوند که همه بخشهای وظیفه جهتیابی چندمرحلهای را انجام میدهد.
روش آنها به جای رمزگذاری ویژگیهای بصری، از تصاویر محیط اطراف ربات بهعنوان نمایشهای بصری استفاده میکنند که از نظر محاسباتی فشرده است و زیرنویسهای متنی ارائه میدهد که نقطهنظر ربات را توصیف میکنند. یک مدل زبانی بزرگ از این توصیفها، برای پیشبینی اقداماتی استفاده میکند که یک ربات باید برای انجام دادن دستورالعملهای مبتنی بر زبان کاربر انجام دهد.
از آنجا که روش این گروه پژوهشی از بازنماییهای صرفا مبتنی بر زبان استفاده میکند، آنها میتوانند یک مدل زبانی بزرگ را برای تولید موثر حجم زیادی از دادههای آموزش مصنوعی به کار بگیرند.
اگرچه این روش نسبت به روشهایی که از ویژگیهای بصری استفاده میکنند، عملکرد بهتری ندارد، اما در موقعیتهایی که فاقد دادههای بصری کافی برای آموزش هستند، به خوبی عمل میکند. پژوهشگران دریافتند که ترکیب ورودیهای مبتنی بر زبان با سیگنالهای بصری، به عملکرد بهتر در جهتیابی کمک میکند.
«بوون پن» (Bowen Pan) پژوهشگر ارشد این پروژه گفت: روش ما با استفاده صرف از زبان به عنوان نمایش ادراکی، سادهتر عمل میکند. از آنجا که همه ورودیها را میتوان به صورت زبان رمزگذاری کرد، میتوانیم یک مسیر قابل درک را برای انسان ایجاد کنیم./ ایسنا
#اخبار منبع: راهبرد معاصر
بیشتر...
تبلیغات
تبلیغات
مطالب مرتبط
نیویورک تایمز در گزارشی به تشریح نکات توافق احتمالی و نزدیک ایران و آمریکا پرداخته است. مقامات اسرائیلی نیز گفتهاند در آستانه اعلام این توافق قرار داریم. از نظر کارشناسان، این توافق برای جلوگیری از یک اقدام نظامی است.
2 ساعت پیش
قیمت دلار طی هفته گذشته تحرکات محدودی در بازار آزاد داشت و در نهایت با بازدهی صفر نخستین هفته زمستان را پشت سر گذاشت! دلار در مرکز مبادله ارز و طلای ایران نیز با افت کمتر از ۱۰ تومانی همراه شد و با نوسانات کاهشی، هفته نخست دیماه را به پایان رساند.
2 ساعت پیش
مدیرعامل صندوق تامین خسارتهای بدنی گفت: استفاده از سهمیه سوخت ۵ هزار و ۷۵۸ تاکسی و ۹ هزار و ۱۱۵ وانت بار فاقد بیمهنامه شخص ثالث محدود میشود.
2 ساعت پیش
صنعت خودرو یکی از مهم ترین صنایع است. تجربه چند دهه گذشته نشان داده در سال هایی که اقتصاد ایران درگیر تحریم های خارجی نبوده و خودروسازان از حداکثر ظرفیت تولیدشان بهره برده اند، چیزی بین ۳ تا ۴ درصد تولید ناخالص داخلی کشور از طریق این صنعت به دست آمده است.
2 ساعت پیش
وزارت امور خارجه طالبان هیات اعزامی به دوحه را اعلام کرد.
2 ساعت پیش
رامسین کبریتی متولد ۲۶ اردیبهشت ماه ۱۳۴۸ در شهر تهران می باشد برادر نسرین شهزک معروف به سپیده بازیگر قبل از انقلاب است.
2 ساعت پیش
تصویری در فضای مجازی از ترلان پروانه با یک اندام بسیار چاق تر از قبل منتشر شد که سوژه شد.
2 ساعت پیش
تصویری جالب و دیده نشده از بهاره کیان افشار بازیگر مطرح ایرانی با چهره ای بدون آرایش در فضای مجازی منتشر شد.
2 ساعت پیش
تصاویری از بازسازی نمای غدیر، به جا مانده از مراسم شب گذشته جشن ده کیلومتری عید غدیر را مشاهده میکنید.
1 ساعت پیش
بیشتر...