دیپ سیک با میلیارد دلار توسعه یافته، نه میلیون دلار ایسنا
تحقیقات یک شرکت تحقیقاتی مستقل نشان میدهد که هزینه آموزش هوش مصنوعی چینی «دیپسیک»(DeepSeek) به جای ۶ میلیون دلار اعلامی، ۱.۳ میلیارد دلار بوده است.
به گزارش ایسنا،یکی از جالب توجهترین ادعاهایی که به تازگی مطرح شده، این است که هوش مصنوعی چینی DeepSeek V3 تنها با حدود ۶ میلیون دلار، آموزش دیده است.
اکنون یک شرکت تحقیقاتی مستقل به نام سمیآنالایزیس(SemiAnalysis) در آخرین گزارش خود، «دیپسیک» را زیر ذرهبین برده است.
این شرکت تحقیقاتی، برخی از روایتهای رایج در مورد هزینههای صرف شده برای توسعه «دیپسیک» را به چالش میکشد و آنها را با فناوریهای رقیب در بازار مقایسه میکند.
یکی از برجستهترین ادعاهایی که در جریان است، این است که مدل هوش مصنوعی DeepSeek V3 حدود ۶ میلیون دلار هزینه آموزش را متحمل شده است. با این حال، گزارش این شرکت تحقیقاتی این رقم را تحلیل و بیان میکند که چندین عامل مهم در نظر گرفته نشده است.
افسانه ۶ میلیون دلاری «دیپسیک»
برآورد ۶ میلیون دلاری در درجه اول، هزینههای پیشآموزشی پردازندههای گرافیکی(GPU) را در نظر میگیرد و از سرمایهگذاریهای قابل توجه در تحقیق و توسعه، زیرساختها و سایر هزینههای ضروری که به شرکت تحمیل میشود، غفلت میکند.
این گزارش نشان میدهد که کل هزینه سرور دیپسیک(CapEx) بالغ بر ۱.۳ میلیارد دلار است که اغلب این تعهد مالی به سمت راهاندازی و حفظ خوشههای GPU گسترده آن که ستون فقرات قدرت محاسباتی آن هستند، هدایت میشود.
گزارش شده است که «دیپسیک» به حدود ۵۰ هزار پردازنده گرافیکی هاپر(Hopper) دسترسی دارد که منجر به برخی تصورات غلط شده است.
شرکت SemiAnalysis روشن میکند که این معادل داشتن ۵۰ هزار تراشه H100 نیست، بلکه در عوض، ترکیبی از مدلها از جمله تراشههای H800، H100 و به خصوص H20 است که توسط شرکت انویدیا(NVIDIA) در واکنش به محدودیتهای صادراتی ایالات متحده تولید میشوند.
این درک دقیق از موجودی سخت افزاری چینیها بر تصمیمات استراتژیک در منبعیابی و بهرهوری عملیاتی در «دیپسیک» تاکید میکند.
یکی از جنبههای قابل توجه این گزارش، بازتاب آن بر ساختار سازمانی «دیپسیک» است. برخلاف برخی از آزمایشگاههای بزرگتر هوش مصنوعی، «دیپسیک» مراکز داده خود را، خودش راهاندازی و مدیریت میکند و از یک مدل ساده استفاده میکند که به چابکی و کارایی آن کمک میکند. همانطور که چشم انداز هوش مصنوعی به طور فزایندهای به صورت رقابتی رشد میکند، این توانایی برای انطباق سریع، به یک دارایی حیاتی تبدیل میشود.
قابلیت استدلال بهتر
از نظر عملکرد، تجزیه و تحلیل جدید نشان میدهد که مدل DeepSeek R1قابلیتهای استدلال قابل مقایسه با مدل o1 شرکت اوپنایآی(OpenAI) را نشان میدهد. با این حال، از برچسب زدن به «دیپسیک» به عنوان پیشتاز بلامنازع در تمام معیارهای عملکردی خودداری میکند.
در حالی که استراتژی هزینه و قیمتگذاری «دیپسیک»، توجهات و تحسینهای بسیاری را به خود جلب کرده است، یک نکته مهم وجود دارد و آن اینکه هوش مصنوعی جمینای Flash 2.0 گوگل که از نظر قابلیت مشابه با «دیپسیک» است، زمانی که از طریق سرویسهای API به آن دسترسی داشته باشید، مقرون به صرفهتر است. این امر، «دیپسیک» را در چهارراهی قرار میدهد که تعادل عملکرد و هزینه، کلید موفقیت آینده آن است.
فناوری «توجه نهفته چند سر»(MLA) «دیپسیک»، یک نوآوری پیشگامانه است که در این گزارش به آن اشاره شده است.
این رویکرد پیشرفته به طور قابل توجهی هزینههای استنباط هوش مصنوعی را به میزان قابل توجهی، یعنی تا ۹۳.۳ درصد از طریق کاهش استفاده از حافظه پنهان(KV) کاهش میدهد که نشان دهنده یک جهش بزرگ به سمت راه حلهای مقرون به صرفه در حوزه هوش مصنوعی است.
کارشناسان میگویند نوآوریهایی که از «دیپسیک» پدیدار شدهاند، احتمالاً به سرعت توسط آزمایشگاههای هوش مصنوعی غربی که مشتاق به ماندن در این رقابت هستند، پذیرفته میشوند.
در حالی که خوشبینی در مورد بهبودهای بالقوه و دستاوردهای کارایی «دیپسیک» وجود دارد، شرکت تحقیقاتی SemiAnalysis در مورد چالشهای خارجی آن نیز هشدار میدهد.
این گزارش حدس میزند که هزینههای عملیاتی میتواند تا پایان سال پنج برابر دیگر کاهش یابد که ناشی از توانایی «دیپسیک» برای انطباق سریع در مقایسه با همتایان بزرگتر و بوروکراتیکتر خود است.
با این وجود، عملیات مقیاسپذیری در میان تشدید کنترلهای صادراتی ایالات متحده، مانع مهمی است که «دیپسیک» باید با دقت از آن عبور کند.
در پایان، شرکت SemiAnalysis تصویر پیچیدهای از جایگاه فعلی «دیپسیک» در قلمرو هوش مصنوعی ترسیم میکند.
افشای ساختار هزینه، استفاده از GPU و قابلیتهای نوآورانه، «دیپسیک» را به عنوان یک بازیکن قدرتمند معرفی میکند.
همانطور که این شرکت چینی به تکامل خود ادامه میدهد، صنعت هوش مصنوعی از نزدیک، آن را تماشا میکند و مشتاق است ببیند چگونه به چالشها و فرصتهای در حال ظهور در یک چشم انداز همیشه در حال تغییر واکنش نشان میدهد.
انتهای پیام
#اخبار
بیشتر...
تبلیغات
در این مطلب، 10 پرتاب برتر از رقابت های بسکتبال در گذشته را با هم مرور میکنیم.
با افزودن این مواد غذایی به رژیم غذایی، میتوان همزمان از سلامت قلب و روده پشتیبانی کرد. ترکیب این مواد در وعدههای روزانه، علاوه بر بهبود سلامت عمومی، میتواند خطر ابتلا به بیماریهای قلبی و مشکلات گوارشی را کاهش دهد.
تالاب بینالمللی هامون که زمانی یکی از بزرگترین تالابهای منطقه و منبع اصلی معیشت هزاران خانواده بود، امروز بهدلیل عدم ورود آب هیرمند به بیابانی خشک تبدیل شده است.
در حالیکه اطلاعات وزارت دادگستری اوکراین نسبت 2.8 برابری مرگومیر به میزان تولد نوزادان را ثبت کرده، تعداد مردان اوکراینی پناهنده در اروپا از یک میلیون نفر فراتر رفته و اوکراینیها در صدر فهرست ورود غیرقانونی به کشورهای اروپایی قرار دارند.
رضا قیطاسی قویترین مرد ایران با حضور در تسنیم درباره مسائل مختلف صحبت کرد؛ از رد پیشنهاد کشورهای خارجی تا هادی چوپان و البته رقابت پرسپولیس و تراکتور.
اولین همایش ملی چشماندازی علوم ورزشی برگزار میشود.
بخشی از نوشتههای حبیب احمدزاده در خصوص «سوال تاریخی» عباس میرزای قاجار را مشاهده میکنید.
در فیلم، تویوتا سنچری(برخی ها در فارسی سنچوری می نویسند) جی50 یعنی نسل دوم این خودرو را مشاهده می کنید که از سال 1997 تا 2017 تولید شد. این تحفه ژاپنی مجهز به پیشرانه 12 سیلندر با 276 اسب بخار خروجی در نسخه بازار ژاپن و 295 اسب بخار خروجی در نسخه صادراتی بود./خاص ترین محصول تویوتا که شاید در بسیاری از بازارهای بین المللی ناشناخته ترین محصول این کمپانی ژاپنی هم باشد؛ سِنچوری(سِنچری) نام دارد! این خودرو از سال 1967 تا کنون روی خط تولید قرار دارد.
استفاده بهینه از داراییهای ثابت مشهود و نامشهود بانکها، نقدسازی داراییهای منجمد و بهرهگیری از ظرفیت بانکداری الکترونیک، منجر به افزایش سهم تسهیلات مسکن خواهد شد.
بیشتر...