خبرگزاری ایسنا | 5 ساعت پیش

علی بابا از خانواده هوش مصنوعی استدلالی خود رونمایی کرد ایسنا

شرکت چینی «علی‌بابا» روز دوشنبه از خانواده‌ مدل‌های هوش مصنوعی «کوئن ۳» رونمایی کرد که ادعا می‌کند عملکرد آن با عملکرد بهترین مدل‌های کنونی «گوگل» و «اوپن‌ای‌آی» مطابقت دارد و حتی در برخی موارد از آنها بهتر است.

به گزارش ایسنا،بیشتر مدل‌ها تحت مجوز پلتفرم توسعه هوش مصنوعی «هاگینگ فیس»(Hugging Face) و «گیت‌هاب»(GitHub) برای دانلود در دسترس هستند یا به زودی در دسترس خواهند بود. اندازه آنها از ۰.۶ میلیارد پارامتر تا ۲۳۵ میلیارد پارامتر متغیر است. پارامترها تقریبا با مهارت‌های حل مسئله یک مدل مطابقت دارند و مدل‌های دارای پارامترهای بیشتر معمولا عملکرد بهتری نسبت به مدل‌هایی با پارامترهای کمتر دارند.

به نقل از تک کرانچ،ظهور مدل‌های چینی مانند «کوئن»(Qwen) شرکت «علی‌بابا»(Alibaba)، فشار را روی شرکت‌های آمریکایی مانند «اوپن‌ای‌آی»(OpenAI) برای ارائه فناوری‌های توانمندتر هوش مصنوعی افزایش داده است. این امر سیاست‌گذاران را نیز به سوی اعمال محدودیت‌هایی با هدف محدود کردن توانایی شرکت‌های هوش مصنوعی چین در دستیابی به تراشه‌های لازم برای آموزش مدل‌ها سوق داده است.

به گفته‌ علی‌بابا، مدل‌های کوئن ۳ مدل‌های ترکیبی هستند؛ به این معنا که می‌توانند با صرف زمان و استدلال از پس مسائل پیچیده برآیند یا به درخواست‌های ساده‌تر به سرعت پاسخ دهند. استدلال، مدل‌ها را قادر می‌سازد تا به طور مؤثر خودشان را بررسی کنند که کار مشابه مدل‌هایی مانند «o3» شرکت اوپن‌ای‌آی اما با تاخیر بیشتر است.

گروه سازنده کوئن در یک پست وبلاگ نوشتند: ما حالت‌های تفکر و عدم تفکر را به طور یکپارچه ادغام کرده‌ایم و انعطاف‌پذیری لازم را برای کنترل تفکر به کاربران ارائه می‌دهیم. این طراحی به کاربران امکان می‌دهد تا قدرت تفکر را با سهولت بیشتری به کار بگیرند. برخی از مدل‌ها نیز روش یادگیری ماشینی «ترکیبی از متخصصان»(MoE) را در پیش می‌گیرند که می‌تواند برای پاسخ دادن به پرسش‌ها از نظر محاسباتی کارآمدتر باشد. روش ترکیبی از متخصصان، وظایف را به زیرمجموعه‌هایی تقسیم می‌کند و آنها را به مدل‌های کوچک‌تر و تخصصی‌تر واگذار می‌کند.

به گفته علی‌بابا، مدل‌های کوئن ۳ از ۱۱۹ زبان پشتیبانی می‌کنند و روی یک مجموعه داده‌ متشکل از حدود ۳۶ تریلیون توکن آموزش دیده‌اند. توکن‌ها بیت‌های خام داده‌ هستند که توسط یک مدل پردازش می‌شوند. یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است. علی‌بابا می‌گوید که کوئن ۳ روی ترکیبی از کتاب‌های درسی، جفت‌های پرسش-پاسخ، کدها، داده‌های تولیدشده توسط هوش مصنوعی و موارد دیگر آموزش دیده است.

علی‌بابا می‌گوید این پیشرفت‌ همراه با سایر پیشرفت‌ها، قابلیت‌های کوئن ۳ را در مقایسه با کوئن ۲ مدل پیشین آن به میزان قابل توجهی افزایش داده‌ است. هیچ کدام از مدل‌های کوئن ۳ از مدل‌های برتر اخیر مانند o3 و o4-mini شرکت اوپن‌ای‌آی بالاتر نیستند، اما عملکرد قوی دارند.

در «Codeforces» که پلتفرمی برای مسابقات برنامه‌نویسی است، بزرگترین مدل کوئن ۳ موسوم به «Qwen-3-235B-A22B» به راحتی مدل‌های o۳-mini شرکت اوپن‌ای‌آی و «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) گوگل را شکست داد. همچنین، Qwen-3-235B-A22B در جدیدترین نسخه «AIME» که یک معیار ریاضی چالش‌برانگیز است و «BFCL» که آزمایشی برای ارزیابی توانایی یک مدل در استدلال مسائل است، از o3-mini پیشی گرفت.

مدل Qwen-3-235B-A22B هنوز به صورت عمومی در دسترس نیست.

انتهای پیام



#‌اخبار

بیشتر...


تبلیغات

تبلیغات
مطالب مرتبط

در شرایطی که اعلام شده دیدار ایران-کره‌شمالی در مشهد برگزار می‌شود اما سرپرست اداره کل ورزش و جوانان خراسان رضوی می‌گوید به صورت رسمی چیزی به آنها گفته نشده است.

نیم ساعت پیش

با حضور خادمان رضوی پرچم بزرگ حرم رضوی بر بام شهر بیرجند، فرهنگسرای شهر به اهتزاز درآمد.

نیم ساعت پیش

فرمانده نیروی دریایی سپاه پاسداران انقلاب اسلامی با بیان اینکه نا‌امنی در تنگه راهبردی هرمز ابعاد و تأثیرات بین‌المللی در اقتصاد دارد، گفت: حضور بیگانگان در خلیج فارس مخل امنیت خواهد بود.

نیم ساعت پیش

با آغاز دهه کرامت پرچم حرم مطهر حضرت امام رضا (ع) در محوطه مرکزی شهرداری تبریز به اهتزاز درآمد.

نیم ساعت پیش

مدیرکل میراث فرهنگی گردشگری و صنایع دستی استان فارس از کشف یک کتیبه ساسانی به زبان پهلوی در شهر آباده خبر داد.

نیم ساعت پیش

فرمانده انتظامی استان کرمانشاه با هشدار به مخلان نظم و امنیت عمومی و اراذل و اوباش در استان، گفت: این افراد بدانند دست از پا خطا کنند به سختی تنبیه شده و مجازات سنگینی در انتظارشان خواهد بود.

نیم ساعت پیش

پس از آنکه بانک مرکزی، برای ساماندهی رمزارزها در کشور اقدام به مسدود کردن درگاه پرداخت صرافی‌های رمز ارزی که مستندات و مدارک لازم را ارائه ندادند، کرد، این بانک تا تاریخ ۲۰ اردیبهشت ماه به صرافی‌هایی که تا امروز اقدام به ارائه مدارک برای رفع انسداد درگاه پرداخت خود نکرده‌اند، اولتیماتوم داد.

نیم ساعت پیش

معاون هماهنگ کننده فرماندهی نیروی انتظامی استان فارس، گفت: همیاران ترافیک، پایه‌گذار فرهنگ به شکل عملی هستند.

نیم ساعت پیش

رئیس گروه دوستی پارلمانی ایران و عربستان با بیان اینکه دیپلماسی پارلمانی پشتیبان دیپلماسی بین دولت‌هاست، گفت: موانع همکاری‌های اقتصادی بین دو کشور باید برطرف شود تا همکاری‌های اقتصادی بین دو کشور در میدان عمل دیده شود.

نیم ساعت پیش

بیشتر...