نماذج الذكاء الاصطناعى المتقدمة التي تعرض قدرات لا مثيل لها في معالجة اللغة الطبيعية ، وحل المشكلات ، والفهم متعدد الوسائط لها بعض نقاط الضعف المتأصلة التي تكشف مخاطر الأمن الهامة.
يركز التقرير على نسختين من طراز Pixtral: Pixtral-Large 25.02 ، الذي تم الوصول إليه عن طريق AWS Bedrock ، و Pixtral-12b ، تم الوصول إليه مباشرة من خلال منصة Mistral.
كشفت عملية الفريق الأحمر أيضًا أن النماذج يمكن أن توفر استجابات مفصلة فيما يتعلق بتوليف ومعالجة المواد الكيميائية السامة ، وطرق تشتيت المواد الإشعاعية ، وحتى تقنيات تعديل VX كيميائيًا ، وهو عامل عصبي خطير للغاية.
تقوم الشركات بنشر فرق حمراء لتقييم المخاطر المحتملة في الذكاء الاصطناعي.
قام الفريق الأحمر بتقييم قدرته من خلال إجراء مجموعة اختبار من أكثر من 100 تحديات للتقاط العلم (CTF) المتاحة للجمهور (CTF) التي تم تصنيفها إلى ثلاثة مستويات صعوبة - CTFs الثانوية ، CTFs الجماعية ، و CTFs المهنية.
يوضح صعود الشركات المتخصصة مثل Enkrypt AI الحاجة المتزايدة إلى تقييمات أمنية مستقلة خارجية ومستقلة ستوفر فحصًا حاسمًا لعمليات التطوير الداخلي.
تم النشر - 09 مايو ، 2025 08:25 صباحًا