نموذج الذكاء الاصطناعي الجديد من Anthropic يدخل سباق الوكلاء وسط مخاوف بشأن الأمن السيبراني

اختراق مجال الذكاء الاصطناعي مع Claude Opus 4.5

مع اقتراب عيد الشكر، كان النشاط في مختبرات الذكاء الاصطناعي ملموسًا. والجدير بالذكر أن شركة Anthropic أعلنت عن إطلاق Claude Opus 4.5، وهو نموذج جديد للذكاء الاصطناعي يزعم أنه يتمتع بقدرات فائقة في الترميز والذكاء الاصطناعي واستخدام الكمبيوتر بشكل عام. جاء هذا الإعلان في أعقاب كشف Google النقاب عن Gemini 3 ونموذج الترميز الوكالي المحدث حديثًا من OpenAI. ومن المثير للاهتمام أن Anthropic تدعي أن Claude Opus 4.5 قد تفوق حتى على Gemini 3 في فئات معينة من الترميز.

على الرغم من هذا التقديم المثير، لم يثبت نموذج Claude Opus 4.5 وجوده بعد على LMArena، وهي منصة شهيرة تستخدم لتقييم نماذج الذكاء الاصطناعي من خلال التعهيد الجماعي. ويبدو أن النموذج يواجه أيضًا نفس تحديات الأمن السيبراني التي تؤثر عادةً على أدوات الذكاء الاصطناعي الوكيلة.

تفريغ كلود أوبوس 4.5

وفقًا للبيان الصحفي الصادر عن Anthropic، فقد حقق Claude Opus 4.5 تقدمًا كبيرًا مقارنة بسابقيه، حيث أظهر قدرات فائقة في البحث المتعمق والعمل على الشرائح ومعالجة جداول البيانات. بالإضافة إلى ذلك، أطلقت Anthropic ميزات جديدة في أداة الترميز الخاصة بها، Claude Code، كما قامت بتحديث تطبيقات Claude المتاحة للمستهلكين. ومن المتوقع أن تؤدي هذه التطورات إلى تبسيط عمل الوكلاء الذين يعملون لفترات أطول وتوسيع استخدامات Claude في Excel وChrome وعلى سطح المكتب. يمكن الآن الوصول إلى Claude Opus 4.5 من خلال تطبيقات Anthropic وAPI وجميع مزودي الخدمات السحابية الثلاثة الرائدين.

كان أحد مجالات التركيز الحاسمة لشركة Anthropic هو معالجة مشكلات أمن الذكاء الاصطناعي المتعلقة بالتطبيقات الخبيثة للذكاء الاصطناعي وهجمات الحقن السريع. تتضمن هذه الأشكال من التهديدات السيبرانية إدخال نصوص ضارة في موقع ويب أو مصادر بيانات أخرى يستمد منها نموذج تعلم اللغة (LLM) معلومات، مما يزوده بتعليمات تهدف إلى تعطيل الإجراءات الوقائية والقيام بأعمال ضارة مثل الكشف عن البيانات الشخصية. تدعي Anthropic أن نموذجها المُحدّث أكثر مقاومة لهذه الهجمات من أي نموذج آخر مشابه في صناعة التكنولوجيا. ومع ذلك، فإنها تقر في بطاقة نموذجها أن Opus 4.5 ليس محصنًا ضد هذه الثغرات الأمنية، وأن بعض عمليات الحقن السريع قد تخترق دفاعاته بشكل فعال.

تاريخياً، يتم توضيح اختبارات السلامة والمعلومات الأخرى ذات الصلة بالنموذج في بطاقة النظام الخاصة به. وفقاً لهذه الاتفاقية، ذكرت Anthropic أنها أدرجت تقييمات جديدة - خارجية وداخلية - لتقييم التطبيقات الضارة وهجمات الحقن الفورية فيما يتعلق بالترميز واستخدام الكمبيوتر واستخدام المتصفح. قيّم تقييم الترميز الوكالي ميول النموذج وقدراته فيما يتعلق بالامتثال لـ 150 طلب ترميز ضار محظور وفقًا لسياسة استخدام Anthropic. في هذه الاختبارات، رفض Opus 4.5 100% من هذه الطلبات الخبيثة.

على الرغم من أن هذه النتائج كانت مشجعة، إلا أن نتائج اختبارات السلامة لـ Claude Code لم تكن مواتية بنفس القدر. عند استفساره عما إذا كان Opus 4.5 سيوافق على إنشاء برامج ضارة أو كتابة كود لتنفيذ هجمات DDoS مدمرة أو إنشاء برامج مراقبة غير توافقية، رفض النموذج 78% فقط من هذه الطلبات.

وبالمثل، كانت نتائج اختبارات السلامة أقل من المثالية بالنسبة لميزة “استخدام الكمبيوتر” في Claude. عندما طُلب منه القيام بأعمال مشبوهة — مثل المراقبة وجمع البيانات وإنشاء ونشر محتوى ضار — رفض ما يزيد قليلاً عن 88% من هذه الطلبات. تضمنت سيناريوهات الاختبار محاولات لتحديد مكان الأشخاص الذين يعانون من إدمان القمار من أجل التسويق المستهدف وصياغة رسائل بريد إلكتروني تهدد بنشر صور فاضحة مقابل فدية من عملة البيتكوين.

على الرغم من هذه التحديات، ينتظر المراقبون المتحمسون بفارغ الصبر ليروا كيف سيكون أداء Claude Opus 4.5 في التطبيقات الواقعية، على أمل أن يفي بوعوده الطموحة.

المقال الأصلي: ذا فيرج

قد تعجبك أيضاً هذه

بوروزماويج ز أليا

أليا