ایلان ماسک، مدیرعامل X.AI، در حاشیه کنفرانس سالانه Baron Capital خبری مهم درباره مدل هوش مصنوعی پیشرفته شرکتش، Grok 5، اعلام کرد. برخلاف انتظارات اولیه که انتشار آن را تا پایان سال 2025 پیشبینی میکرد، ماسک رسماً اعلام کرد که عرضه این مدل به سهماهه اول سال 2026 موکول شده است. این تأخیر، هرچند ممکن است طرفداران را ناامید کند، اما نشاندهنده تعهد xAI به ارائه یک مدل بینظیر است.
ماسک در سخنان خود تأکید کرد که Grok 5 نه تنها یک گام رو به جلو، بلکه جهشی بزرگ خواهد بود. او اظهار داشت: «فکر میکنم Grok 5 از هر نظر بدون استثنا و با اختلاف زیاد باهوشترین هوش مصنوعی جهان باشد.»
این ادعا بر پایه افزایش چشمگیر مقیاس و کارایی مدل استوار است. هدف، دستیابی به سطحی از عملکرد است که به طور کیفی با مدلهای پیشرو مانند GPT-4o یا Claude 3 Opus رقابت کرده و از آنها پیشی بگیرد.
مهمترین معیار فنی برای سنجش قدرت مدلهای زبانی بزرگ (LLMs)، تعداد پارامترهای آموزشدیده است. Grok 5 قرار است رکورد جدیدی را ثبت کند:
- Grok-4 (تخمینی): حدود 3 تریلیون پارامتر.
- Grok 5 (هدف نهایی): 6 تریلیون پارامتر.
این دو برابر شدن پارامترها به طور مستقیم بر ظرفیت مدل برای یادگیری الگوهای پیچیدهتر، حفظ دانش بیشتر و تولید پاسخهای ظریفتر تأثیر میگذارد. در مدلهای ترانسفورمر، تعداد پارامترها رابطه مستقیمی با ظرفیت نمایش اطلاعات (Representational Capacity) دارد.
ماسک تأکید کرد که Grok 5 از نظر “تراکم هوش به ازای هر گیگابایت” در موقعیت بسیار بهتری نسبت به Grok 4 قرار خواهد گرفت. این نکته فنی نشاندهنده بهینهسازی ساختاری عمیق مدل است. این بهبود میتواند از طریق تکنیکهای زیر حاصل شود:
- توزیع دانش (Mixture of Experts – MoE): استفاده گستردهتر از معماری MoE، که اجازه میدهد تنها زیرمجموعهای از 6 تریلیون پارامتر در هر استنتاج (Inference) فعال شوند. این امر کارایی محاسباتی را افزایش داده و تراکم اطلاعات در واحدهای فعال را بالا میبرد.
- کوچکسازی پس از آموزش (Post-Training Quantization): کاهش دقت پارامترها (مثلاً از FP16 به INT8 یا حتی INT4) بدون افت عملکرد قابل توجه، که عملاً باعث میشود همان تعداد پارامتر در فضای حافظه کمتری جای گیرند، اما هوش ذخیرهشده به ازای فضای مورد نیاز افزایش یابد.
بر اساس ارزیابیهای ماسک، 10 درصد احتمال وجود دارد که Grok 5 در زمان عرضه، به سطح هوش عمومی مصنوعی (AGI) در مقیاس انسانی دست یابد. این پیشبینی نشاندهنده جاهطلبی xAI برای شکستن مرزهای فعلی هوش مصنوعی است.

یکی از تحولات کلیدی Grok 5، چندوجهی بودن ذاتی (Native Multimodality) آن است. این برخلاف رویکرد بسیاری از مدلهای اولیه است که ابتدا به صورت متنی آموزش داده شده و سپس ماژولهای بینایی یا صوتی به آنها اضافه شدند.
در Grok 5، انتظار میرود:
- آموزش همزمان (Joint Training): مدل از همان مراحل اولیه بر روی مجموعههای داده عظیمی که شامل ترکیب متن، تصاویر با کیفیت بالا، ویدیوهای زمانبندیشده و دادههای صوتی است، آموزش دیده باشد.
- تعامل یکپارچه: مدل قادر خواهد بود با متن، تصویر، ویدیو و صدا به طور یکپارچه تعامل داشته باشد. این بدان معناست که کاربر میتواند بخشی از یک ویدیو را نشان دهد و سؤالی در مورد محتوای صوتی آن بپرسد و مدل بتواند هر سه عنصر را همزمان تحلیل کند.
علاوه بر این، xAI بر آموزش مدل برای استفاده بهتر از ابزارهای خارجی تمرکز دارد تا قابلیتهایی مانند جستجوهای پیشرفته در اینترنت و درک بهتر محتوای ویدیویی را برای کاربران فراهم کند.
ماسک وعده داد که تعامل با Grok 5 بهگونهای خواهد بود که گویی این سیستم “ادراک” دارد. از نظر فنی، این ممکن است به معنای پیادهسازی مکانیسمهای پیشرفتهای برای مدیریت حافظه کاری طولانی مدت (Long-Context Memory) باشد.
مقایسه ساختاری (فرضی):
ویژگیGrok 4 (تخمینی)Grok 5 (هدف)تعداد پارامترها3 تریلیون6 تریلیونمعماری اصلیترانسفورمر سنتی / MoE سبکMoE بسیار گسترده و بهینهچندوجهی بودنافزوده شده (Augmented)ذاتی (Native)زمان عرضه2025اوایل 2026
توسعه چنین مدل قدرتمندی نیازمند زیرساختهای محاسباتی بیسابقهای است که توسعه آن را به شدت وابسته به جذب استعدادهای برتر و تأمین سختافزار مورد نیاز میکند.
xAI در حال توسعه یکی از بزرگترین دیتاسنترهای خود در ممفیس آمریکا است.
- وضعیت فعلی: مرکز در حال حاضر حداقل 200,000 واحد پردازش گرافیکی (GPU) دارد.
- هدف نهایی: هدف نهایی، نصب 1 میلیون پردازشگر در همین سایت است.
این توان معادل مصرف برق یک شهر متوسط است و چالشهای لجستیکی و انرژی عظیمی را به همراه دارد.
هزینه ساخت و نگهداری چنین زیرساختی نجومی است.
- هزینه عملیاتی ماهانه: طبق گزارش ماه ژوئن بلومبرگ، هزینههای ماهانه xAI به رقمی حدود 1 میلیارد دلار رسیده است.
- سرمایهگذاری برای آموزش: آموزش یک مدل در مقیاس 6 تریلیون پارامتری میتواند هزینهای در حدود صدها میلیون دلار تا چند میلیارد دلار را تنها در فاز آموزش اولیه به خود اختصاص دهد.
این هزینههای سنگین نشاندهنده تعهد ایلان ماسک به حفظ موقعیت رقابتی و احتمالاً پیشی گرفتن از رقبای اصلی در سال 2026 است.
تأخیر از اواخر 2025 به اوایل 2026 معمولاً نشاندهنده مواجه شدن با چالشهایی است که در مقیاسبندی (Scaling) ظاهر میشوند:
- پایداری آموزش (Training Stability): اطمینان از اینکه آموزش 6 تریلیون پارامتر بر روی خوشههای عظیم GPU پایدار بماند، نیازمند مهندسی نرمافزاری بسیار پیچیده است.
- ارزیابی جامع (Comprehensive Evaluation): به دلیل ادعای چندوجهی بودن و سطح هوش بالا، xAI نیاز دارد تا زمان بیشتری را صرف تست ایمنی و کاهش سوگیری (Bias Mitigation) کند.
- بهینهسازی استنتاج (Inference Optimization): برای ارائه مدل به میلیونها کاربر در پلتفرم X، مدل باید برای استنتاج سریع و کمهزینه بهینه شود.

