ترنج موبایل
کد خبر: ۸۹۴۴۰۸

زمان عرضه دیپ سیک ۲ لو رفت؛ توسط خودش!

زمان عرضه دیپ سیک 2 لو رفت؛ توسط خودش!

در جریان یک گفتگو با دیپ سیک، این هوش مصنوعی زمان انتشار نسخه دوم خود را لو داد.

تبلیغات
تبلیغات

فرارو- شرکت DeepSeek در حال آماده‌سازی برای عرضه مدل زبانی بزرگ نسل بعدی خود با نام DeepSeek-R2 است که طبق برنامه، بین ۱۵ تا ۳۰ آگوست ۲۰۲۵ معرفی خواهد شد.

به گزارش فرارو به نقل از گیزموچاینا، این بازه زمانی در جریان گفت‌وگویی با مدل هوش مصنوعی خود DeepSeek آشکار شد و نشان می‌دهد که عرضه این مدل تنها چند روز پس از معرفی ChatGPT-5 انجام خواهد شد.

انتظار می‌رود DeepSeek-R2 جهشی قابل توجه در معماری داشته باشد و از ساختار پیشرفته‌تر Mixture of Experts (MoE) بهره ببرد. همچنین یک شبکه گیتینگ هوشمندتر برای مدیریت بهتر بارهای پردازشی سنگین در مرحله استنتاج در آن ادغام خواهد شد. منابع آگاه می‌گویند این مدل می‌تواند تا ۱.۲ تریلیون پارامتر مقیاس پیدا کند، که تقریباً دو برابر DeepSeek-R1 با ۶۷۱ میلیارد پارامتر است. با این حال، همچنان از ChatGPT-4/5 با بیش از ۱.۸ تریلیون پارامتر کوچک‌تر خواهد بود.

گامی به سوی خودکفایی هوش مصنوعی در چین

در راستای استراتژی دستیابی به خودکفایی در حوزه هوش مصنوعی، این مدل به طور کامل بر روی تراشه‌های Ascend 910B هواوی آموزش داده شده است. خوشه پردازشی هواوی با توان ۵۱۲ PFLOPS در دقت FP16 و بهره‌وری ۸۲ درصد، reportedly معادل ۹۱ درصد توان خوشه A100 انویدیا را ارائه می‌دهد. تحلیلگران این اقدام را گامی مهم در کاهش وابستگی چین به سخت‌افزار هوش مصنوعی ساخت آمریکا می‌دانند.

گزارش‌ها حاکی از آن است که هزینه آموزش DeepSeek-R2 به لطف استفاده از سخت‌افزار داخلی و تکنیک‌های بهینه‌سازی، ۹۷ درصد کمتر از GPT-4 بوده است. پیش‌بینی می‌شود DeepSeek دسترسی API این مدل را با قیمت‌های پایین‌تر عرضه کند، اقدامی که می‌تواند مدل‌های قیمت‌گذاری رایج تحت سلطه OpenAI و Anthropic را تحت فشار قرار دهد.

انتظار برای DeepSeek-R2 موجب افزایش حرکت در سهام فناوری چین شده است. سهام شرکت سازنده تراشه هوش مصنوعی Cambricon با رشد ۲۰ درصدی، ارزش بازار خود را به بیش از ۳۵۵ میلیارد یوان (حدود ۴۹.۷ میلیارد دلار) رساند.

در خبرهای مرتبط، هواوی چارچوب جدیدی برای استنتاج هوش مصنوعی با نام Unified Cache Manager (UCM) معرفی کرده است. این چارچوب برای تسریع فرایند استنتاج طراحی شده و مدیریت داده‌های KV Cache را در لایه‌های حافظه مانند HBM، DRAM و SSD بهینه می‌کند. هواوی در آزمایش با China UnionPay گزارش داد که این فناوری می‌تواند تأخیر را تا ۹۰ درصد کاهش دهد و توان عملیاتی را ۲۲ برابر افزایش دهد. این شرکت قصد دارد UCM را در ماه سپتامبر به صورت متن‌باز منتشر کند.

در مجموع، عرضه DeepSeek-R2 و معرفی چارچوب UCM هواوی، نشانه‌ای از تغییر بزرگ در جاه‌طلبی‌های هوش مصنوعی چین است؛ تغییراتی که مسیر ساخت و اجرای سیستم‌های هوش مصنوعی قدرتمند بدون اتکا به تراشه‌ها یا ابزارهای نرم‌افزاری غربی را هموار می‌کنند.

 

تبلیغات
تبلیغات
ارسال نظرات
تبلیغات
تبلیغات
خط داغ
تبلیغات
تبلیغات