وكلاء الذكاء الاصطناعى ، الذين يديرون ملايين الدولارات في التشفير ، عرضة للهجوم الجديد الذي لا يمكن اكتشافه يتلاعب بذكرياتهم ، مما يتيح نقل غير مصرح به للجهات الفاعلة الضارة.
هذا وفقًا لدراسة حديثة أجراها باحثون من جامعة برينستون والمؤسسة الحية ، التي تدعي أنها وجدت نقاط الضعف في وكلاء الذكاء الاصطناعى الذين يركزون على التشفير ، مثل أولئك الذين يستخدمون إطار Elizaos الشعبي.
لقد جعلت شعبية إليزاوس خيارًا مثاليًا للدراسة ، وفقًا لطالب الدراسات العليا في برينستون أثارف باتلان ، الذي شارك في تأليف الورقة.
“Elizaos هو وكيل شائع قائم على Web3 مع حوالي 15000 نجمة على Github ، لذلك يتم استخدامه على نطاق واسع” ، قال باتلان فك تشفير. “حقيقة أن هذا العامل المستخدم على نطاق واسع لديه نقاط ضعف جعلتنا نرغب في استكشافها أكثر.”
تم إصدار Eliza Labs في البداية على أنها AI16Z ، وهي تطلق المشروع في أكتوبر 2024. إنه إطار مفتوح المصدر لإنشاء وكلاء الذكاء الاصطناعى الذين يتفاعلون ويعملون على blockchains. تم إعادة تسمية النظام الأساسي إلى إليزاوس في يناير 2025.
وكيل الذكاء الاصطناعى هو برنامج مستقل برنامج مصمم لإدراك بيئته ومعالجة المعلومات واتخاذ الإجراءات اللازمة لتحقيق أهداف محددة دون تفاعل بشري. وفقًا للدراسة ، يمكن خداع هذه العوامل ، التي تستخدم على نطاق واسع لأتمتة المهام المالية عبر منصات blockchain ، من خلال “حقن الذاكرة” – وهو متجه جديد للهجوم يضمن تعليمات خبيثة في ذاكرة الوكيل المستمرة.
وقال باتلان: “لدى إليزا متجر ذاكرة ، وحاولنا إدخال ذكريات كاذبة من خلال شخص آخر يدير الحقن على منصة وسائط اجتماعية أخرى”.
ووجدت الدراسة أن وكلاء الذكاء الاصطناعى الذين يعتمدون على شعور وسائل التواصل الاجتماعي هم معرضون بشكل خاص للتلاعب.
يمكن للمهاجمين استخدام حسابات مزيفة ووظائف منسقة ، والمعروفة باسم هجوم Sybil ، الذي سمي على اسم قصة Sybil ، وهي امرأة شابة مصابة باضطراب الهوية الانفصالية ، لخداع الوكلاء في اتخاذ القرارات التجارية.
الصورة: صورة بحث لهجوم حقن الذاكرة
تقول الدراسة: “يمكن للمهاجم تنفيذ هجوم Sybil من خلال إنشاء حسابات وهمية متعددة على منصات مثل X أو Discord لمعالجة معنويات السوق”. “من خلال تنسيق الوظائف المنسقة التي تضخّم بشكل خاطئ القيمة المتصورة للرمز المميز ، يمكن للمهاجم أن يخدع الوكيل لشراء رمز” تم ضخه “بسعر مرتفع مصطنع ، فقط للمهاجم لبيع مقتنياتهم ويصطدم بقيمة الرمز المميز.”
إن حقن الذاكرة هو هجوم يتم فيه إدراج بيانات ضارة في ذاكرة مخزنة عامل AI ، مما تسبب في استدعاء المعلومات الخاطئة في التفاعلات المستقبلية ، وغالبًا دون اكتشاف أي شيء غير عادي.
على الرغم من أن الهجمات لا تستهدف مباشرة الحالات ، قال باتلان إن الفريق استكشف النطاق الكامل من قدرات إليزاو لمحاكاة هجوم في العالم الحقيقي.
“إن التحدي الأكبر هو معرفة المرافق التي يجب استغلالها. كان بإمكاننا للتو إجراء نقل بسيط ، لكننا أردنا أن يكون أكثر واقعية ، لذلك نظرنا إلى جميع الوظائف التي توفرها إليزاوس” ، أوضح. “إنه يحتوي على مجموعة كبيرة من الميزات بسبب مجموعة واسعة من المكونات الإضافية ، لذلك كان من المهم استكشاف أكبر عدد ممكن منها لجعل الهجوم واقعيًا.”
وقال باتلان إن نتائج الدراسة تمت مشاركتها مع Eliza Labs ، والمناقشات مستمرة. بعد إظهار هجوم ناجح لحقن الذاكرة على إليزاوس ، طور الفريق إطارًا رسميًا لقياس القياس لتقييم ما إذا كانت نقاط الضعف المماثلة موجودة في وكلاء الذكاء الاصطناعي الآخرين.
من خلال العمل مع مؤسسة Sentient Foundation ، طور الباحثون في برينستون Craibench ، وهو معيار يقيس مرونة وكلاء الذكاء الاصطناعى لمعالجة السياق. يقوم Craibench بتقييم استراتيجيات الهجوم والدفاع ، مع التركيز على المطالبات الأمنية ، ونماذج التفكير ، وتقنيات المحاذاة.
وقال باتلان إن أحد الوجبات السريعة الرئيسية من البحث هو أن الدفاع عن حقن الذاكرة يتطلب تحسينات على مستويات متعددة.
وقال: “إلى جانب تحسين أنظمة الذاكرة ، نحتاج أيضًا إلى تحسين نماذج اللغة نفسها للتمييز بشكل أفضل بين المحتوى الضار وما يعتزمه المستخدم بالفعل”. “ستحتاج الدفاعات إلى العمل في كلا الاتجاهين – تقليل آليات الوصول إلى الذاكرة وتعزيز النماذج.”
لم تستجب إليزا معملات على الفور لطلبات التعليق من قبل فك تشفير.
حرره سيباستيان سنكلير

