در تازهترین بررسی جهانی از عملکرد چتباتهای هوش مصنوعی، نتایج شگفتانگیزی منتشر شده است. بر اساس مطالعهای از شرکت Prolific با معیار نوینی بهنام Humaine، هفت مدل هوش مصنوعی توانستهاند جایگاهی بالاتر از ChatGPT در تجربه کاربری، درک طبیعی و تعامل مؤثر کسب کنند.
1. تحول در دنیای چتباتها و معیارهای ارزیابی
تا چندی پیش، برتری در حوزه چتباتها بیشتر با تعداد کاربران و توان فنی سنجیده میشد. اما روش جدید Humaine بر جنبههای انسانی تعامل تمرکز دارد؛ از جمله «درک سؤال کاربر»، «وضوح پاسخها» و «تجربه طبیعی گفتوگو».
شرکتکنندگان در این مطالعه، در گفتوگوهای چندمرحلهای با دو مدل مختلف شرکت کردند و در پایان، چتباتی را که تجربه بهتری ایجاد کرده بود انتخاب نمودند.
2. فهرست ۷ چتبات هوش مصنوعی برتر در مطالعه Humaine
2.1. Google Gemini 2.5 Pro – هوشمندترین و روانترین گفتوگو
مدل Gemini 2.5 Pro از گوگل، صدرنشین مطلق لیست شد. کاربران عملکرد آن را از نظر وضوح، دقت زبانی و سازگاری با نیازهای مختلف ممتاز ارزیابی کردند.
این مدل در مارس ۲۰۲۵ معرفی شد و در زمینه حل مسائل پیچیده و استدلال تطبیقی پیشتاز است.
ویژگیهای برتر:
- درک عمیق و دقیق پرسشها
- پاسخهای طبیعی با لحن انسانی
- عملکرد عالی در چندزبانگی
2.2. DeepSeek v3 – نماینده قدرتمند چین
مدل DeepSeek v3 از کشور چین در جایگاه دوم قرار گرفت. کاربران از سبک گفتوگوی محترمانه و دقیق این چتبات تمجید کردند.
این نسخه با هزینه توسعه کمتر ولی خروجی قابل رقابت، توانسته توجه زیادی را در صنعت هوش مصنوعی به خود جلب کند.
2.3. Mistral Magistral Medium – شگفتی فرانسوی
شرکت فرانسوی Mistral AI با مدل Magistral Medium در رتبه سوم ایستاد. این چتبات در سازگاری با سبک مکالمه کاربر و پاسخدهی خلاق، بسیار مؤثر عمل کرد. با این حال، در حوزه «اعتماد و ایمنی» هنوز جای پیشرفت دارد.
2.4. Grok 4 (xAI)
ساخته شرکت xAI (تحت نظر ایلان ماسک) با نام Grok 4 در رتبه چهارم قرار گرفت. این مدل در حفظ گفتوگوهای بلندمدت و لحن طنزآمیز، محبوبیت خاصی میان کاربران یافته است.
2.5. Grok 3 (xAI)
نسخه قبلی گراک نیز همچنان جایگاه خود را در میان برترینها حفظ کرده است. عملکرد باثبات، امنیت بالا و پاسخهای سریع از نقاط قوت آن است.
2.6. Google Gemini 2.5 Flash
مدل سبکتر و سریعتر خانواده Gemini است. با سرعت پاسخگویی بسیار بالا، برای کاربرانی که تعامل فوری میخواهند، گزینهای ایدهآل محسوب میشود.
2.7. DeepSeek R1
مدل دوم از شرکت DeepSeek که توازن بسیار خوبی میان هزینه و عملکرد دارد. در حوزه «پاسخهای اخلاقمحور و دقیق» نمرات بسیار مثبتی گرفته است.
3. چرا ChatGPT در رتبه هشتم قرار گرفت؟
با وجود محبوبیت جهانی و بیش از ۸۰۰ میلیون کاربر فعال در هفته، ChatGPT در مطالعه Humaine به رتبه هشتم سقوط کرد.
دلیل اصلی این جایگاه، تأکید معیارهای Humaine بر تعامل انسانی است؛ جایی که مدلهای جدیدتر توانستهاند ارتباط عاطفیتر، سازگارتر و طبیعیتری برقرار کنند.
البته چت جیپیتی همچنان در آزمونهای فنی مانند ریاضیات، برنامهنویسی و تحلیل متنی از رقبا جلوتر است و در شاخه «پویاترین مدل» جایزه مخصوص خود را از آنِ OpenAI کرد.
4. جمعبندی نهایی
دنیای چتباتهای هوش مصنوعی بهسرعت در حال تغییر است.
مطالعه Humaine نشان داد که عصر رقابت صرفاً بر مبنای قدرت محاسباتی به پایان رسیده و «تجربه کاربر» اکنون مهمترین شاخص سنجش کیفیت است.
درحالیکه گوگل، دیپسیک و میسترال در زمینههای خلاقیت و تعامل انسانی پیشتاز شدهاند، ChatGPT همچنان نماد پایداری و نوآوری در هوش مصنوعی باقی مانده است.

