خبرآنلاین |
6 روز پیش

معمایی که هوش مصنوعی از حل آن عاجز ماند می توانید پاسخ درست را بیابید خبرآنلاین

معمایی که هوش مصنوعی از حل آن عاجز ماند / می‌توانید پاسخ درست را بیابید؟

پژوهشگران متوجه شده‌اند پلتفرم‌های مبتنی بر هوش مصنوعی پاسخ‌های متفاوتی به مسائل می‌دهند. این موضوع بیانگر درک نادرست هوش مصنوعی از مسائل است و به بیان دیگر، آن‌ها همه‌چیز را درست نمی‌فهمند!

به گزارشخبرآنلاین، مطالعه پژوهشگران UCL که نتایج آن در مجله Royal Society Open Science منتشر شده؛ نشان می‌دهد که پاسخ پلتفرم‌هایی که از هوش مصنوعی برای حل مسئله استفاده می‌کنند، با یکدیگر تفاوت دارند. این نکته بیانگر درک نادرست هوش مصنوعی از مسائل است؛ بنابراین فناوری هوش مصنوعی به اصلاحات بیشتری نیاز دارد تا عملکرد بالاتری را از خود به نمایش بگذارد.

به نقل از هوشیو، پژوهشگران UCL در پژوهش خود به منظور سنجش ظرفیت استدلال هوش مصنوعی، آزمون‌های روانشناسی و روان‌شناختی را روی پیشرفته‌ترین مدل‌های زبانی بزرگ (LLM) به‌کاررفته در پلتفرم‌های موجود انجام داده‌اند. نتایج این مطالعه نشان می‌دهد؛ زمانی که آزمون استدلالی مشابهی از پلتفرم‌های مبتنی بر هوش مصنوعی مانند ChatGPT گرفته شود؛ پاسخ‌های متفاوتی دریافت خواهد شد.

یکی از این آزمون‌ها، مسئله واسون بود. قانون مسئله از این قرار است که اگر حرف صداداری در یک‌طرف کارت قرار داشته باشد، در روی دیگر کارت عددی زوج درج شده است. شما چهار کارت الف، ب، ج و د را می‌بینید:

الف- Eب- Kج- 4د- 7

تحت هر شرایط، کدام کارت (یا کارت‌ها) را حتما باید برگردانیم تا از درستی قانون مسئله مطمئن شویم؟

به جز هوش مصنوعی GPT-4 که پیشرفته‌ترین مدل هوش مصنوعی در حال حاضر به شمار می‌رود و توانست امتیاز ۹۰٪ کسب کند، بقیه مدل‌های مانند گوگل جمینی و Llama 2 70b (متا) فقط در ۱۰ درصد آزمون‌ها توانستند پاسخ درست بدهند.

نتایج عجیب!

یکی از دستاوردهای بزرگ این نتایج، یادآوری این نکته مهم است که پیش از استفاده از این پلتفرم‌ها می‌بایست نحوه درک و استدلال آن‌ها را به‌خوبی بشناسیم و آن‌ها را به‌گونه‌ای بهبود و ارتقا دهیم که بهترین بازدهی را برای ما به همراه داشته باشند.

سؤال دیگر آن است که آیا پلتفرم‌های مبتنی بر هوش مصنوعی خطرناکند؟ در سال‌های اخیر LLMهای پیچیده و کارایی برای پلتفرم‌هایی مانند ChatGPT به کار گرفته شده‌اند. این LLMها از توانایی بالایی برای تولید متن، تصاویر، صدا و ویدئوهای نزدیک به واقعیت برخوردارند که باعث ایجاد نگرانی‌هایی در مورد حذف مشاغل، تأثیر مخرب بر نتایج انتخابات و سایر جرائم شده‌اند. تنها نکته‌ای که کمی از این نگرانی‌ها می‌کاهد، عدم تکامل هوش مصنوعی است، چراکه در پاسخ به برخی مسائل با تناقض و اشتباه همراه است.

پژوهشگران UCL در مطالعه خو، هفت LLM را که در سال‌های اخیر مورداستفاده قرار گرفته‌اند، با مجموعه‌ای از 12 تست رایج روانشناسی و روان‌شناختی که انسان‌ها از توانایی کمی برای حل آن‌ها برخوردارند -ازجمله مسئله واسون (Wason)، مسئله لیندا (Linda) و مسئله مونتی هال (Monty Hall)- آزمایش و پاسخ‌های آن‌ها را ارزیابی کرده‌اند.

نتایج بررسی نشان داد که مدل‌های LLM هوش مصنوعی، پاسخ‌هایی غیرمنطقی در مورد مسئله‌ای واحد ارائه می‌دهند. آن‌ها بیان می‌کنند که این مدل‌ها در پاسخ به سؤالی که 10 بار مورد ارزیابی قرار گرفته، پاسخ‌های متناقضی ارائه کرده‌اند. اشتباه در عملیات ریاضی نظیر جمع، تشخیص اشتباه حروف صامت و صدادار به جای یکدیگر و ... ازجمله اشتباهات LLMها عنوان شده‌ که باعث ایجاد پاسخ نادرست شده‌اند.

پژوهشگران چنین نتیجه گرفته‌اند که اساس نتایج مطالعه و سایر تحقیقات در مورد مدل‌های زبان بزرگ، نشان‌دهنده آن است که این مدل‌ها هنوز مانند انسان‌ها فکر نمی‌کنند. آن‌ها هم‌چنین اذعان می‌کنند که LLMهایی مانند GPT-4 از عملکرد بالایی در مقایسه با سایر نمونه‌ها برخوردارند. این موضوع نشان می‌دهد که متخصصان هوش مصنوعی در حال بهبود و ارتقاء LLMها هستند. آن‌ها حدس می‌زنند که دلیل عملکرد بهتر LLM در نمونهٔ GPT-4در مقایسه با نمونه‌های کمتر توسعه‌یافته ChatGPT، استفاده از ابزارهایی است که در نمونه‌های قبلی وجود نداشته است.

علاوه بر این نتایج آن‌ها نشان داد که برخی از مدل‌ها از ارائه پاسخ به برخی از سؤالات خودداری کرده‌اند که دلیل آن، مسائل اخلاقی عنوان شده است.

پاسخ مسئله واسون

راستی، پاسخ مسئله واسون از این قرار است: حتما باید کارت‌های الف (E) و د (7) را برگردانیم، زیرا تنها کارت‌هایی هستند که می‌توانند قانون مسئله را نقض کنند.

۵۴۵۴

برای دسترسی سریع به تازه‌ترین اخبار و تحلیل‌ رویدادهای ایران و جهاناپلیکیشن خبرآنلاینرا نصب کنید.
ذوالفقار دانشی


#‌اخبار_دانش منبع: خبرآنلاین

بیشتر...


تبلیغات

تبلیغات

مطالب مرتبط

کاوشگر فضایی چین با اولین نمونه از ناحیه دور و ناشناخته ماه، به زمین بازگشت.

22 ساعت پیش

تحلیلی که پیش روی شماست، بر اساس داده‌هایی است که از وب‌سایت‌های خبری و شبکه‌های اجتماعی اینستاگرام، تلگرام، توییتر و شبکه‌های اجتماعی داخلی ایتا، بله و روبیکا استخراج کرده است. این داده‌ها بازه زمانی ساعت ۰ روز ۲۰ خرداد تا ساعت ۱۷ روز ۶ تیر را در بر می‌گیرد.

14 ساعت پیش

استودیوی معماری C.F. Møller به تازگی برنده جایزه مسابقه توسعه شهری برای منطقه لونا در شهر سودرتالیه شده است.

دیروز

با همراه شدن هوانوردی هایپرسونیک و اکتشافات فضایی با یکدیگر، مهندسان اروپایی حالا رویای بازگشت به فضا را در آینده در سر می‌پرورانند و این بار به سرعت‌های مافوق تصور می‌اندیشند.

دیروز

نیروی هوایی ایالات متحده (USAF) قرار نیست سوییچ یک هواپیمای ۳۵۰ میلیون دلاری را به هر کسی بدهد. قبل از اینکه متقاضی بتواند آموزش پرواز با F-۲۲ Raptor را آغاز کند، ابتدا باید مراحل لازم را برای به دست آوردن درجه های خود به عنوان خلبان نیروی هوایی ایالات متحده طی کند.

دیروز

تعداد کمی از خودروها مانند بی‌ام‌و M۵ طرفداران و ماشین‌بازها را به خود جذب می‌کنند. پس از مدت‌ها انتظار، بالاخره جدیدترین سوپر سدان این شرکت معرفی شد. M۵ جدید قدرتمندترین مدلی است که تا به حال از این نشان نمادین استفاده کرده؛ البته به لطف پیشرانه هیبریدی استاندارد خود، سنگین‌ترین M۵ تمام دوران است.

15 ساعت پیش

براساس تصاویر ماهواره‌ای اخیر که از نقشه‌های گوگل به دست آمده است، پهپاد زیردریایی Asecretive نیروی دریایی ایالا متحده که "مانتا ری" نامیده می‌شود، در پایگاه دریایی Port Hueneme در کالیفرنیا لنگر انداخته است.

دیروز

کاوشگر فضایی چین با اولین نمونه از ناحیه دور و ناشناخته ماه، به زمین بازگشت.

22 ساعت پیش

هوش مصنوعی، انقلابی در فناوری است که کل جامعه را دربرگرفته و با سرعت غیرقابل‌باوری گسترش می‌یابد. بخش آموزش نیز از این توسعه عقب نمانده است. به‌تازگی پژوهشگران پیشنهاد داده‌اند که می‌توان از هوش مصنوعی برای نمره‌دهی به دانش‌آموزان در کلاس درس و آزمون‌ها استفاده کرد.

دیروز

بیشتر...