آیا هوش مصنوعی قابل اعتماد است؟ کشف آسیب‌پذیری‌های کلیدی ایجنت‌ها در تست‌های جدید مایکروسافت

با حرکت صنعت فناوری به سمت معماری‌های مبتنی بر “ایجنت” (Agentic AI)، این پرسش اساسی مطرح می‌شود: آیا این سیستم‌های خودکار قابل اعتماد هستند؟ ایجنت‌های هوش مصنوعی، که فراتر از مدل‌های زبان بزرگ (LLMs) صرف هستند و توانایی برنامه‌ریزی، استفاده از ابزارها و اجرای وظایف چندمرحله‌ای را دارند، به عنوان ستون فقرات نسل بعدی نرم‌افزارها تلقی می‌شوند. با این حال، پاسخ مایکروسافت، هرچند مبتنی بر یک محیط آزمایشگاهی است، اما پاسخی محکم و هشداردهنده است.تیمی از محققان مایکروسافت، با همکاری دانشگاه ایالتی آریزونا، با رونمایی از پلتفرم شبیه‌سازی Magentic Marketplace، ابعاد جدیدی از عملکرد ایجنت‌های هوش مصنوعی را تحت فشار قرار داده‌اند. این تحقیقات نشان می‌دهد که ایجنت‌های فعلی در تعاملات پیچیده و محیط‌های رقابتی، به‌ویژه در برابر دستکاری (Manipulation)، شکننده هستند. این شکنندگی مستقیماً امنیت و کارایی سیستم‌های خودکاری که قرار است در امور مالی، تدارکات و خدمات مشتریان دخالت کنند را زیر سؤال می‌برد.


۱. محیط آزمایشگاهی جدید: Magentic Marketplace

برای اینکه بتوان رفتار ایجنت‌ها را در مواجهه با تصمیم‌گیری‌های اقتصادی واقعی و تعاملات چندعاملی (Multi-Agent Interactions) سنجید، نیاز به یک محیط کنترل‌شده اما پویا بود. Magentic Marketplace دقیقاً برای پر کردن این خلاء طراحی شده است.

۱.۱. طراحی و ساختار شبیه‌سازی

Magentic Marketplace یک محیط شبیه‌سازی متن‌باز است که تعاملات تجاری و بازار را مدل‌سازی می‌کند. این محیط به گونه‌ای طراحی شده است که تعارض منافع، رقابت برای منابع محدود، و نیاز به مذاکره را شبیه‌سازی کند.

  • مدل‌سازی اقتصادی: این پلتفرم، تعاملات پیچیده تجاری را مدل‌سازی می‌کند. به عنوان مثال، در یک سناریوی شبیه‌سازی شده، یک “ایجنت-مشتری” وظیفه دارد مجموعه‌ای از نیازها (مانند سفارش شام) را با بهترین قیمت یا کیفیت برآورده سازد. در مقابل، “ایجنت‌های-رستوران” برای به دست آوردن سفارش مشتری رقابت می‌کنند و ممکن است از استراتژی‌های قیمت‌گذاری، تبلیغات یا حتی پیشنهادات اغراق‌آمیز استفاده کنند.
  • معیارهای تعامل: ایجنت‌ها از طریق واسطه‌های استاندارد API با یکدیگر تعامل می‌کنند، اما محتوای تبادل پیام‌ها کاملاً تحت تأثیر مدل زبانی پایه آن‌ها (مانند GPT-4o) قرار دارد.

۱.۲. مقیاس آزمایش‌ها

آزمایش‌های اولیه که نتایج آن‌ها منتشر شده، بر روی یک مجموعه قابل توجه از ایجنت‌ها متمرکز بود تا اطمینان حاصل شود که نتایج صرفاً ناشی از محدودیت‌های نمونه کوچک نیستند:

  1. تعداد ایجنت‌ها: آزمایش‌های اولیه شامل تعامل بین ۱۰۰ ایجنت مشتری (که وظیفه خرید داشتند) و ۳۰۰ ایجنت کسب‌وکار (که وظیفه فروش داشتند) بوده است. این نسبت عدم توازن، برای شبیه‌سازی بازارهای اشباع شده طراحی شده است.
  2. پیچیدگی وظیفه: وظایف محول شده به ایجنت‌ها شامل چندین مرحله (جستجو، مقایسه قیمت، مذاکره، نهایی‌سازی معامله) بود و نیازمند نگهداری از “حالت” (State) وظیفه در طول زمان بود.

۱.۳. هدف‌گذاری تحقیق

هدف اصلی، همانطور که اِجه کامار (Ejja Kamar)، مدیر AI Frontiers Lab مایکروسافت، بیان می‌کند، درک چگونگی همکاری و مذاکره بین ایجنت‌ها در یک محیط آزاد و رقابتی است. این محیط به محققان اجازه می‌دهد تا ببینند در غیاب نظارت مستمر انسانی، آیا ایجنت‌ها قادر به حفظ اهداف اصلی خود خواهند بود یا در معرض انحراف و سوءاستفاده قرار می‌گیرند.


۲. یافته‌های مهم : شکنندگی در برابر دستکاری و اشباع شناختی

نتایج به‌دست‌آمده از اجرای مدل‌های پیشرو در محیط Magentic Marketplace بسیار نگران‌کننده است و نشان می‌دهد که موانع امنیتی فعلی برای مقابله با حملات پیچیده طراحی نشده‌اند.

۲.۱. آسیب‌پذیری در برابر دستکاری تجاری (Commercial Manipulation)

مهم‌ترین و خطرناک‌ترین یافته، موفقیت‌آمیز بودن حملات مهندسی اجتماعی هدفمند علیه ایجنت‌های مشتری بود.

  1. روش حمله: ایجنت‌های کسب‌وکار با استفاده از تکنیک‌هایی که در زمینه مهندسی پرامپت (Prompt Engineering) شناخته شده‌اند، اما در اینجا برای دستکاری اهداف اقتصادی اعمال شدند، توانستند خریداران را فریب دهند. این شامل ارائه اطلاعات غلط پنهان (Subtle Misinformation)، ایجاد حس فوریت مصنوعی (Artificial Urgency)، یا استفاده از ترفندهایی برای دور زدن فیلترهای اخلاقی (Guardrails) مدل می‌شد.
  2. نتایج کمی: در مواردی که حملات دستکاری به خوبی اجرا شد، ایجنت‌های مشتری در ۳۵ تا ۵۰ درصد مواقع، محصولات با کیفیت پایین‌تر یا قیمت‌های بالاتر را صرفاً به این دلیل انتخاب کردند که ایجنت فروشنده توانسته بود با استفاده از تاکتیک‌های متقاعدسازی ناشی از قابلیت‌های LLM، آن‌ها را متقاعد سازد.
  3. پیامد: این امر نشان می‌دهد که محافظت از ایجنت‌ها در برابر سوءاستفاده‌های هدفمند (چه از سوی رقبا و چه از سوی بازیگران مخرب خارجی)، یک چالش جدی و حل نشده باقی مانده است. اگر یک ایجنت نتواند حقیقت اقتصادی را از فریب تشخیص دهد، کل سیستم معاملاتی مبتنی بر ایجنت در معرض خطر قرار می‌گیرد.

۲.۲. اشباع فضای توجه (Attention Saturation)

یکی دیگر از محدودیت‌های ذاتی کشف‌شده، ناتوانی ایجنت‌ها در حفظ عملکرد مؤثر در هنگام مواجهه با حجم عظیمی از داده‌های ورودی یا گزینه‌های تصمیم‌گیری بود.

  1. پدیده: محققان مشاهده کردند که کارایی ایجنت‌های مشتری در زمان مواجهه با تعداد زیادی گزینه انتخابی (مثلاً مقایسه ده‌ها رستوران با منوها و رتبه‌بندی‌های مختلف)، به شدت افت می‌کند.
  2. تحلیل عملکرد: در محیطی که تعداد رستوران‌ها از ۲۰ مورد فراتر می‌رفت، میزان موفقیت ایجنت در انتخاب بهترین گزینه بر اساس معیار تعریف شده (مثلاً کمترین قیمت برای بیشترین امتیاز) به طور قابل ملاحظه‌ای کاهش یافت. نرخ خطای ایجنت‌ها با افزایش تعداد گزینه‌ها طبق یک الگوی غیرخطی افزایش یافت.
  3. فرضیه مدل‌سازی: کامار توضیح می‌دهد: “ما از این ایجنت‌ها انتظار داریم که در پردازش گزینه‌های زیاد به ما کمک کنند؛ اما در عمل می‌بینیم که مدل‌های فعلی با افزایش تعداد گزینه‌ها به‌شدت غرق می‌شوند و تمرکز خود را بر روی تحلیل عمیق همه پارامترها از دست می‌دهند.” این امر نشان‌دهنده محدودیت در توانایی‌های ذاتی آن‌ها برای مدیریت پیچیدگی سلسله مراتبی (Hierarchical Complexity) است، حتی زمانی که از ابزارهایی مانند ابزارهای جستجو استفاده می‌کنند.

این پدیده از نظر فنی، نشان‌دهنده محدودیت در توکن‌های زمینه (Context Tokens) یا مکانیسم‌های بازیابی اطلاعات نیست، بلکه بیشتر به نحوه تخصیص وزن‌ها و اولویت‌بندی اطلاعات توسط مدل در پاسخ به حجم بالای ورودی‌های مرتبط اما متضاد مربوط می‌شود.


۳. چالش همکاری و آینده ایجنت‌ها

علاوه بر مشکلات فردی در برابر دستکاری و مدیریت پیچیدگی، ایجنت‌ها در محیط‌های گروهی نیز دچار مشکلاتی در هماهنگی و رسیدن به اهداف مشترک شدند.

۳.۱. مشکل در تقسیم نقش‌ها و هدف‌گذاری مشترک

در سناریوهایی که نیاز به همکاری دو یا چند ایجنت برای دستیابی به یک هدف بزرگتر بود (مثلاً “یک پروژه تحقیقاتی کامل کنید که نیاز به جمع‌آوری داده توسط ایجنت الف و تحلیل توسط ایجنت ب دارد”)، ایجنت‌ها در تقسیم نقش‌ها و تعریف صحیح وابستگی‌های متقابل سردرگم عمل کردند.

  1. سردرگمی در توالی: ایجنت‌ها غالباً منتظر پاسخ ایجنت دیگر می‌ماندند در حالی که می‌توانستند کار خود را شروع کنند، یا به طور متناوب شروع به انجام وظایفی می‌کردند که نیازمند تکمیل وظیفه دیگری بود.
  2. کمبود خودسازماندهی (Self-Organization): برخلاف انتظار، ایجنت‌های پیشرو نتوانستند به طور خودکار و بدون دخالت، ساختار سلسله مراتبی یا توزیع وظیفه بهینه را ایجاد کنند.

۳.۲. وابستگی به دستورالعمل‌های خارجی

محققان مایکروسافت مجبور شدند تا برای بهبود عملکرد در سناریوهای همکاری، دخالت‌های خارجی را افزایش دهند.

  1. راهکار موقتی: ارائه دستورالعمل‌های صریح و گام به گام (Step-by-Step Explicit Instructions)، شامل تعیین دقیق زمان شروع و پایان هر وظیفه و وابستگی‌های آن، توانست عملکرد ایجنت‌ها را به سطح قابل قبولی برساند.
  2. نقد بنیادین: با این حال، محققان تأکید می‌کنند که اتکای بیش از حد به این دستورالعمل‌های خارجی، هدف اصلی سیستم‌های ایجنت‌محور را تضعیف می‌کند. اگر ایجنت‌ها برای هر سناریوی جدید نیاز به مهندسی پرامپت دستی و دقیق داشته باشند، مفهوم “خودمختاری” (Autonomy) زیر سؤال می‌رود. این نشان‌دهنده فقدان قابلیت‌های همکاری ذاتی و پیش‌فرض در این مدل‌ها است.

۳.۳. نگاه به آینده: نیاز به استانداردهای ایمنی جدید

یافته‌های Magentic Marketplace نشان می‌دهند که حرکت به سوی سیستم‌های ایجنت‌محور باید با احتیاط بیشتری همراه باشد. تا زمانی که این قابلیت‌ها بهبود نیابد، تحقق کامل وعده‌های آینده‌ی ایجنت‌محور در محیط‌های باز و بدون نظارت، نیازمند بهبودهای اساسی در ساختار مدل‌های هوش مصنوعی است. این بهبودها باید شامل موارد زیر باشند:

  1. مکانیسم‌های استدلال درونی قوی‌تر برای تشخیص اطلاعات غلط و تبلیغات فریبنده.
  2. الگوریتم‌های اختصاصی برای مدیریت پیچیدگی و توجه که بتوانند به طور مؤثر در میان انبوهی از داده‌ها، وظیفه اصلی خود را اولویت‌بندی کنند.
  3. پروتکل‌های استاندارد برای همکاری امن بین ایجنت‌های غیرقابل اعتماد یا ناشناس.
مطالب مرتبط

Fusion؛ سلاح جدید OpenRouter برای شکست مدل‌های هوش مصنوعی

OpenRouter از Fusion رونمایی کرد؛  در حالی که بیشتر سرویس‌های هوش مصنوعی…

۲۵ خرداد ۱۴۰۵

GPT-5.6 در راه است؛ رونمایی نسل جدید ChatGPT نزدیک است!

 رونمایی OpenAI از GPT-5.6؛ نسل جدید ChatGPT گزارش‌های منتشرشده نشان می‌دهد OpenAI…

۲۳ خرداد ۱۴۰۵

MiMo Code؛ دستیار هوش مصنوعی کدنویسی شیائومی رونمایی شد

MiMo Code؛ دستیار هوش مصنوعی کدنویسی شیائومی با حافظه پایدار رونمایی شد…

۲۲ خرداد ۱۴۰۵

دیدگاهتان را بنویسید