شرکت چینی DeepSeek که پیشتر با ارائهی مدلهای هوش مصنوعی کارآمد و مقرونبهصرفه، بازار جهانی را تحت تأثیر قرار داده بود، اکنون با رونمایی از نسل جدید خود، DeepSeek V3.2 و V3.2-Speciale، معادلات رقابت را بر هم زده است.
طبق ادعاهای این شرکت، این مدلها در بنچمارکهای کلیدی استدلال و ریاضیات، توانایی ایستادن در برابر غولهای آمریکایی مانند GPT-5 و Gemini 3.0 Pro را دارند.
1. عملکرد خیرهکننده در بنچمارکهای تخصصی
- نسخه ویژه مدل جدید، یعنی DeepSeek V3.2-Speciale، نقطهی اوج دستاوردهای این شرکت محسوب میشود.
- دادههای منتشرشده توسط دیپسیک نشان میدهد که این نسخه قدرتمندتر، نه تنها از مدل پیشرفته GPT-5 High شرکت OpenAI سبقت گرفته، بلکه به عملکردی کاملاً همتراز با Gemini 3.0 Pro گوگل دست یافته است.
اوج قدرت این مدل در حوزههایی مانند حل مسائل پیچیده ریاضی و برنامهنویسی نمایان شده است. DeepSeek مدعی است که این مدل موفق به کسب مدال طلا در المپیاد جهانی ریاضی ۲۰۲۵ (IMO) و المپیاد جهانی انفورماتیک (IOI) شده است، که نشاندهنده توانایی استثنایی آن در استدلال منطقی است.

2. معرفی دو نسخه اصلی DeepSeek V3.2
مهندسان دیپسیک برای پوشش دادن طیف وسیعی از نیازها، دو نسخه متفاوت از این معماری را عرضه کردهاند:
- DeepSeek V3.2 (نسخه استاندارد): این نسخه بر پایه کارایی بالا و بهینهسازی سرعت طراحی شده و هماکنون از طریق وبسایت و اپلیکیشن DeepSeek در دسترس عموم قرار گرفته است.
- این مدل برای رقابت مستقیم با نسخههای پایه مدلهایی مانند GPT-5 طراحی شده است.
- DeepSeek V3.2-Speciale (نسخه ویژه): این نسخه با ۶۸۵ میلیارد پارامتر، برای مواجهه با سختترین چالشهای محاسباتی توسعه یافته و محدودیتهای طول پاسخدهی در آن برداشته شده است.
- دسترسی به این مدل در حال حاضر تنها از طریق API و نیازمند زیرساختهای سرور قدرتمند است.
3. سه نوآوری کلیدی پشت قدرت DeepSeek
تیم تحقیقاتی دیپسیک برای دستیابی به این سطح از هوش مصنوعی، سه نوآوری اصلی را در معماری مدل خود پیادهسازی کردهاند:
- توجه پراکنده (DSA): این معماری نوین، پیچیدگیهای محاسباتی را هنگام پردازش متنهای بسیار طولانی به شدت کاهش میدهد، بدون آنکه افت محسوسی در دقت مدل رخ دهد. نتیجه این فرآیند، پردازش سریعتر با نیاز به سختافزار کمتر است.
- یادگیری تقویتی مقیاسپذیر: محققان DeepSeek با افزایش بودجه محاسباتی در مرحله پسآموزش (Post-training)، به مدل اجازه دادهاند تا از طریق آزمون و خطا، تواناییهای استدلالی خود را به شکل چشمگیری تقویت کند.
- تولید داده مصنوعی پیشرفته: این شرکت با ساخت بیش از ۸۵ هزار پرامپت پیچیده و ۱۸۰۰ محیط شبیهسازی شده، ایجنتهای هوش مصنوعی را برای اجرای موفقیتآمیز وظایف عملی در دنیای واقعی آموزش دادهاند.
4. چرا سرمایهگذاران غربی نگرانند؟
دلیل اصلی نگرانی در میان سرمایهگذاران غربی، نسبت کارایی به هزینه (Performance-to-Cost Ratio) مدلهای دیپسیک است. این شرکت چینی با اقدامات خود، این روایت سنتی شرکتهایی مانند OpenAI و گوگل مبنی بر اینکه “هوش مصنوعی پیشرفته نیازمند میلیاردها دلار سرمایهگذاری است” را به چالش کشیده است. مدلهای متنباز و مقرونبهصرفه DeepSeek نشان میدهند که مسیر رسیدن به هوش مصنوعی سطح بالا (AGI) میتواند از مسیرهای نوآورانه و کمهزینهتری نیز دنبال شود.

