زمان عرضه دیپ سیک ۲ لو رفت؛ توسط خودش!

در جریان یک گفتگو با دیپ سیک، این هوش مصنوعی زمان انتشار نسخه دوم خود را لو داد.
فرارو- شرکت DeepSeek در حال آمادهسازی برای عرضه مدل زبانی بزرگ نسل بعدی خود با نام DeepSeek-R2 است که طبق برنامه، بین ۱۵ تا ۳۰ آگوست ۲۰۲۵ معرفی خواهد شد.
به گزارش فرارو به نقل از گیزموچاینا، این بازه زمانی در جریان گفتوگویی با مدل هوش مصنوعی خود DeepSeek آشکار شد و نشان میدهد که عرضه این مدل تنها چند روز پس از معرفی ChatGPT-5 انجام خواهد شد.
انتظار میرود DeepSeek-R2 جهشی قابل توجه در معماری داشته باشد و از ساختار پیشرفتهتر Mixture of Experts (MoE) بهره ببرد. همچنین یک شبکه گیتینگ هوشمندتر برای مدیریت بهتر بارهای پردازشی سنگین در مرحله استنتاج در آن ادغام خواهد شد. منابع آگاه میگویند این مدل میتواند تا ۱.۲ تریلیون پارامتر مقیاس پیدا کند، که تقریباً دو برابر DeepSeek-R1 با ۶۷۱ میلیارد پارامتر است. با این حال، همچنان از ChatGPT-4/5 با بیش از ۱.۸ تریلیون پارامتر کوچکتر خواهد بود.
گامی به سوی خودکفایی هوش مصنوعی در چین
در راستای استراتژی دستیابی به خودکفایی در حوزه هوش مصنوعی، این مدل به طور کامل بر روی تراشههای Ascend 910B هواوی آموزش داده شده است. خوشه پردازشی هواوی با توان ۵۱۲ PFLOPS در دقت FP16 و بهرهوری ۸۲ درصد، reportedly معادل ۹۱ درصد توان خوشه A100 انویدیا را ارائه میدهد. تحلیلگران این اقدام را گامی مهم در کاهش وابستگی چین به سختافزار هوش مصنوعی ساخت آمریکا میدانند.
گزارشها حاکی از آن است که هزینه آموزش DeepSeek-R2 به لطف استفاده از سختافزار داخلی و تکنیکهای بهینهسازی، ۹۷ درصد کمتر از GPT-4 بوده است. پیشبینی میشود DeepSeek دسترسی API این مدل را با قیمتهای پایینتر عرضه کند، اقدامی که میتواند مدلهای قیمتگذاری رایج تحت سلطه OpenAI و Anthropic را تحت فشار قرار دهد.
انتظار برای DeepSeek-R2 موجب افزایش حرکت در سهام فناوری چین شده است. سهام شرکت سازنده تراشه هوش مصنوعی Cambricon با رشد ۲۰ درصدی، ارزش بازار خود را به بیش از ۳۵۵ میلیارد یوان (حدود ۴۹.۷ میلیارد دلار) رساند.
در خبرهای مرتبط، هواوی چارچوب جدیدی برای استنتاج هوش مصنوعی با نام Unified Cache Manager (UCM) معرفی کرده است. این چارچوب برای تسریع فرایند استنتاج طراحی شده و مدیریت دادههای KV Cache را در لایههای حافظه مانند HBM، DRAM و SSD بهینه میکند. هواوی در آزمایش با China UnionPay گزارش داد که این فناوری میتواند تأخیر را تا ۹۰ درصد کاهش دهد و توان عملیاتی را ۲۲ برابر افزایش دهد. این شرکت قصد دارد UCM را در ماه سپتامبر به صورت متنباز منتشر کند.
در مجموع، عرضه DeepSeek-R2 و معرفی چارچوب UCM هواوی، نشانهای از تغییر بزرگ در جاهطلبیهای هوش مصنوعی چین است؛ تغییراتی که مسیر ساخت و اجرای سیستمهای هوش مصنوعی قدرتمند بدون اتکا به تراشهها یا ابزارهای نرمافزاری غربی را هموار میکنند.