با حرکت صنعت فناوری به سمت معماریهای مبتنی بر “ایجنت” (Agentic AI)، این پرسش اساسی مطرح میشود: آیا این سیستمهای خودکار قابل اعتماد هستند؟ ایجنتهای هوش مصنوعی، که فراتر از مدلهای زبان بزرگ (LLMs) صرف هستند و توانایی برنامهریزی، استفاده از ابزارها و اجرای وظایف چندمرحلهای را دارند، به عنوان ستون فقرات نسل بعدی نرمافزارها تلقی میشوند. با این حال، پاسخ مایکروسافت، هرچند مبتنی بر یک محیط آزمایشگاهی است، اما پاسخی محکم و هشداردهنده است.تیمی از محققان مایکروسافت، با همکاری دانشگاه ایالتی آریزونا، با رونمایی از پلتفرم شبیهسازی Magentic Marketplace، ابعاد جدیدی از عملکرد ایجنتهای هوش مصنوعی را تحت فشار قرار دادهاند. این تحقیقات نشان میدهد که ایجنتهای فعلی در تعاملات پیچیده و محیطهای رقابتی، بهویژه در برابر دستکاری (Manipulation)، شکننده هستند. این شکنندگی مستقیماً امنیت و کارایی سیستمهای خودکاری که قرار است در امور مالی، تدارکات و خدمات مشتریان دخالت کنند را زیر سؤال میبرد.
۱. محیط آزمایشگاهی جدید: Magentic Marketplace
برای اینکه بتوان رفتار ایجنتها را در مواجهه با تصمیمگیریهای اقتصادی واقعی و تعاملات چندعاملی (Multi-Agent Interactions) سنجید، نیاز به یک محیط کنترلشده اما پویا بود. Magentic Marketplace دقیقاً برای پر کردن این خلاء طراحی شده است.
۱.۱. طراحی و ساختار شبیهسازی
Magentic Marketplace یک محیط شبیهسازی متنباز است که تعاملات تجاری و بازار را مدلسازی میکند. این محیط به گونهای طراحی شده است که تعارض منافع، رقابت برای منابع محدود، و نیاز به مذاکره را شبیهسازی کند.
- مدلسازی اقتصادی: این پلتفرم، تعاملات پیچیده تجاری را مدلسازی میکند. به عنوان مثال، در یک سناریوی شبیهسازی شده، یک “ایجنت-مشتری” وظیفه دارد مجموعهای از نیازها (مانند سفارش شام) را با بهترین قیمت یا کیفیت برآورده سازد. در مقابل، “ایجنتهای-رستوران” برای به دست آوردن سفارش مشتری رقابت میکنند و ممکن است از استراتژیهای قیمتگذاری، تبلیغات یا حتی پیشنهادات اغراقآمیز استفاده کنند.
- معیارهای تعامل: ایجنتها از طریق واسطههای استاندارد API با یکدیگر تعامل میکنند، اما محتوای تبادل پیامها کاملاً تحت تأثیر مدل زبانی پایه آنها (مانند GPT-4o) قرار دارد.
۱.۲. مقیاس آزمایشها
آزمایشهای اولیه که نتایج آنها منتشر شده، بر روی یک مجموعه قابل توجه از ایجنتها متمرکز بود تا اطمینان حاصل شود که نتایج صرفاً ناشی از محدودیتهای نمونه کوچک نیستند:
- تعداد ایجنتها: آزمایشهای اولیه شامل تعامل بین ۱۰۰ ایجنت مشتری (که وظیفه خرید داشتند) و ۳۰۰ ایجنت کسبوکار (که وظیفه فروش داشتند) بوده است. این نسبت عدم توازن، برای شبیهسازی بازارهای اشباع شده طراحی شده است.
- پیچیدگی وظیفه: وظایف محول شده به ایجنتها شامل چندین مرحله (جستجو، مقایسه قیمت، مذاکره، نهاییسازی معامله) بود و نیازمند نگهداری از “حالت” (State) وظیفه در طول زمان بود.
۱.۳. هدفگذاری تحقیق
هدف اصلی، همانطور که اِجه کامار (Ejja Kamar)، مدیر AI Frontiers Lab مایکروسافت، بیان میکند، درک چگونگی همکاری و مذاکره بین ایجنتها در یک محیط آزاد و رقابتی است. این محیط به محققان اجازه میدهد تا ببینند در غیاب نظارت مستمر انسانی، آیا ایجنتها قادر به حفظ اهداف اصلی خود خواهند بود یا در معرض انحراف و سوءاستفاده قرار میگیرند.
۲. یافتههای مهم : شکنندگی در برابر دستکاری و اشباع شناختی
نتایج بهدستآمده از اجرای مدلهای پیشرو در محیط Magentic Marketplace بسیار نگرانکننده است و نشان میدهد که موانع امنیتی فعلی برای مقابله با حملات پیچیده طراحی نشدهاند.
۲.۱. آسیبپذیری در برابر دستکاری تجاری (Commercial Manipulation)
مهمترین و خطرناکترین یافته، موفقیتآمیز بودن حملات مهندسی اجتماعی هدفمند علیه ایجنتهای مشتری بود.
- روش حمله: ایجنتهای کسبوکار با استفاده از تکنیکهایی که در زمینه مهندسی پرامپت (Prompt Engineering) شناخته شدهاند، اما در اینجا برای دستکاری اهداف اقتصادی اعمال شدند، توانستند خریداران را فریب دهند. این شامل ارائه اطلاعات غلط پنهان (Subtle Misinformation)، ایجاد حس فوریت مصنوعی (Artificial Urgency)، یا استفاده از ترفندهایی برای دور زدن فیلترهای اخلاقی (Guardrails) مدل میشد.
- نتایج کمی: در مواردی که حملات دستکاری به خوبی اجرا شد، ایجنتهای مشتری در ۳۵ تا ۵۰ درصد مواقع، محصولات با کیفیت پایینتر یا قیمتهای بالاتر را صرفاً به این دلیل انتخاب کردند که ایجنت فروشنده توانسته بود با استفاده از تاکتیکهای متقاعدسازی ناشی از قابلیتهای LLM، آنها را متقاعد سازد.
- پیامد: این امر نشان میدهد که محافظت از ایجنتها در برابر سوءاستفادههای هدفمند (چه از سوی رقبا و چه از سوی بازیگران مخرب خارجی)، یک چالش جدی و حل نشده باقی مانده است. اگر یک ایجنت نتواند حقیقت اقتصادی را از فریب تشخیص دهد، کل سیستم معاملاتی مبتنی بر ایجنت در معرض خطر قرار میگیرد.

۲.۲. اشباع فضای توجه (Attention Saturation)
یکی دیگر از محدودیتهای ذاتی کشفشده، ناتوانی ایجنتها در حفظ عملکرد مؤثر در هنگام مواجهه با حجم عظیمی از دادههای ورودی یا گزینههای تصمیمگیری بود.
- پدیده: محققان مشاهده کردند که کارایی ایجنتهای مشتری در زمان مواجهه با تعداد زیادی گزینه انتخابی (مثلاً مقایسه دهها رستوران با منوها و رتبهبندیهای مختلف)، به شدت افت میکند.
- تحلیل عملکرد: در محیطی که تعداد رستورانها از ۲۰ مورد فراتر میرفت، میزان موفقیت ایجنت در انتخاب بهترین گزینه بر اساس معیار تعریف شده (مثلاً کمترین قیمت برای بیشترین امتیاز) به طور قابل ملاحظهای کاهش یافت. نرخ خطای ایجنتها با افزایش تعداد گزینهها طبق یک الگوی غیرخطی افزایش یافت.
- فرضیه مدلسازی: کامار توضیح میدهد: “ما از این ایجنتها انتظار داریم که در پردازش گزینههای زیاد به ما کمک کنند؛ اما در عمل میبینیم که مدلهای فعلی با افزایش تعداد گزینهها بهشدت غرق میشوند و تمرکز خود را بر روی تحلیل عمیق همه پارامترها از دست میدهند.” این امر نشاندهنده محدودیت در تواناییهای ذاتی آنها برای مدیریت پیچیدگی سلسله مراتبی (Hierarchical Complexity) است، حتی زمانی که از ابزارهایی مانند ابزارهای جستجو استفاده میکنند.
این پدیده از نظر فنی، نشاندهنده محدودیت در توکنهای زمینه (Context Tokens) یا مکانیسمهای بازیابی اطلاعات نیست، بلکه بیشتر به نحوه تخصیص وزنها و اولویتبندی اطلاعات توسط مدل در پاسخ به حجم بالای ورودیهای مرتبط اما متضاد مربوط میشود.
۳. چالش همکاری و آینده ایجنتها
علاوه بر مشکلات فردی در برابر دستکاری و مدیریت پیچیدگی، ایجنتها در محیطهای گروهی نیز دچار مشکلاتی در هماهنگی و رسیدن به اهداف مشترک شدند.
۳.۱. مشکل در تقسیم نقشها و هدفگذاری مشترک
در سناریوهایی که نیاز به همکاری دو یا چند ایجنت برای دستیابی به یک هدف بزرگتر بود (مثلاً “یک پروژه تحقیقاتی کامل کنید که نیاز به جمعآوری داده توسط ایجنت الف و تحلیل توسط ایجنت ب دارد”)، ایجنتها در تقسیم نقشها و تعریف صحیح وابستگیهای متقابل سردرگم عمل کردند.
- سردرگمی در توالی: ایجنتها غالباً منتظر پاسخ ایجنت دیگر میماندند در حالی که میتوانستند کار خود را شروع کنند، یا به طور متناوب شروع به انجام وظایفی میکردند که نیازمند تکمیل وظیفه دیگری بود.
- کمبود خودسازماندهی (Self-Organization): برخلاف انتظار، ایجنتهای پیشرو نتوانستند به طور خودکار و بدون دخالت، ساختار سلسله مراتبی یا توزیع وظیفه بهینه را ایجاد کنند.
۳.۲. وابستگی به دستورالعملهای خارجی
محققان مایکروسافت مجبور شدند تا برای بهبود عملکرد در سناریوهای همکاری، دخالتهای خارجی را افزایش دهند.
- راهکار موقتی: ارائه دستورالعملهای صریح و گام به گام (Step-by-Step Explicit Instructions)، شامل تعیین دقیق زمان شروع و پایان هر وظیفه و وابستگیهای آن، توانست عملکرد ایجنتها را به سطح قابل قبولی برساند.
- نقد بنیادین: با این حال، محققان تأکید میکنند که اتکای بیش از حد به این دستورالعملهای خارجی، هدف اصلی سیستمهای ایجنتمحور را تضعیف میکند. اگر ایجنتها برای هر سناریوی جدید نیاز به مهندسی پرامپت دستی و دقیق داشته باشند، مفهوم “خودمختاری” (Autonomy) زیر سؤال میرود. این نشاندهنده فقدان قابلیتهای همکاری ذاتی و پیشفرض در این مدلها است.
۳.۳. نگاه به آینده: نیاز به استانداردهای ایمنی جدید
یافتههای Magentic Marketplace نشان میدهند که حرکت به سوی سیستمهای ایجنتمحور باید با احتیاط بیشتری همراه باشد. تا زمانی که این قابلیتها بهبود نیابد، تحقق کامل وعدههای آیندهی ایجنتمحور در محیطهای باز و بدون نظارت، نیازمند بهبودهای اساسی در ساختار مدلهای هوش مصنوعی است. این بهبودها باید شامل موارد زیر باشند:
- مکانیسمهای استدلال درونی قویتر برای تشخیص اطلاعات غلط و تبلیغات فریبنده.
- الگوریتمهای اختصاصی برای مدیریت پیچیدگی و توجه که بتوانند به طور مؤثر در میان انبوهی از دادهها، وظیفه اصلی خود را اولویتبندی کنند.
- پروتکلهای استاندارد برای همکاری امن بین ایجنتهای غیرقابل اعتماد یا ناشناس.


