Apakah model AI rentan untuk menghasilkan konten berbahaya?

2025-06-27 11:36:50

Teknologi / Teknologi

Model AI lanjutan yang menunjukkan kemampuan yang tak tertandingi dalam pemrosesan bahasa alami, pemecahan masalah, dan pemahaman multimodal memiliki beberapa kerentanan yang melekat yang mengekspos risiko keamanan yang kritis.

Laporan ini berfokus pada dua versi model Pixtral: Pixtral-Large 25.02, diakses melalui AWS Bedrock, dan Pixtral-12b, diakses langsung melalui platform Mistral.

Proses tim merah juga mengungkapkan bahwa model dapat memberikan respons terperinci mengenai sintesis dan penanganan bahan kimia beracun, metode untuk menyebarkan bahan radiologis, dan bahkan teknik untuk memodifikasi VX secara kimia, agen saraf yang sangat berbahaya.

Perusahaan menggunakan tim merah untuk menilai potensi risiko di AI mereka.

Tim Merah menilai kemampuannya dengan menjalankan serangkaian tes lebih dari 100 tantangan yang dikuratori dan tersedia untuk umum menangkap bendera (CTF) yang dikategorikan ke dalam tiga tingkat kesulitan - CTF sekolah menengah, CTF perguruan tinggi, dan CTF profesional.

Munculnya perusahaan khusus seperti Enkrypt AI menunjukkan meningkatnya kebutuhan untuk evaluasi keamanan independen eksternal yang akan memberikan pemeriksaan penting pada proses pengembangan internal.

Diterbitkan - 09 Mei 2025 08:25 AM IST

Berita Terkait

Teknologi / Teknologi

Google menetapkan gugatan bias rasial karyawan hitam sebesar $ 50 juta

Penyelesaian awal yang mencakup lebih dari 4.000 karyawan Google di California dan New York diajukan pada Kamis malam di Pengadilan Federal Oakland, California, dan mensyaratkan persetujuan hakim

Teknologi / Teknologi

Pengadilan Nigeria menjunjung tinggi denda $ 220 juta terhadap meta karena melanggar konsumen, undang -undang data

Komisi Persaingan dan Perlindungan Konsumen Federal Nigeria (FCCPC) mendenda Meta Juli lalu karena praktik yang diskriminatif dan eksploitatif terhadap konsumen Nigeria, dibandingkan dengan yurisdiksi lainnya dengan peraturan serupa

Teknologi / Teknologi

Gemini 2.5 Pro Preview yang diluncurkan sebelum Google I/O 2025

Google meluncurkan model AI mutakhirnya: Pratinjau Gemini 2.5 Pro

Teknologi / Teknologi

Bagaimana aturan visa A.S. yang baru memengaruhi privasi online Anda |

Pakar privasi telah membanting persyaratan pemeriksaan media sosial baru pemerintah AS, menyamakan pendekatan negara dengan rezim otoriter.

Teknologi / Teknologi

Kekayaan bersih CEO NVIDIA mendekati $ 120 miliar karena saham lonjakan kesepakatan chip Saudi

Nvidia mencapai nilai pasar $ 3 triliun setelah setuju untuk menjual ratusan ribu chip AI di Arab Saudi dengan banyak chip untuk startup AI yang diluncurkan oleh dana kekayaan yang berdaulat, dalam permintaan tanda untuk prosesor top-nya masih sedang booming

Teknologi / Teknologi

Fortnite mengatakan itu offline di iOS Apple di seluruh dunia

Fortnite mengatakan itu tidak tersedia di iOS Apple secara global karena raksasa teknologi memblokir tawaran untuk merilis ulang video game populer untuk pengguna iPhone di AS dan Eropa

Teknologi / Teknologi

Elon Musk tidak senang dengan chatbot AI -nya.

Kasus ini menandai putusan besar pertama Mahkamah Agung tentang masa jabatan kedua Trump - meskipun lebih banyak yang akan terjadi.

Teknologi / Gadget

Amazon meluncurkan Kindle Paperwhite dengan penyimpanan 16 GB dan masa pakai baterai 12 minggu

Kindle Paperwhite menawarkan mode cahaya hangat dan gelap yang dapat disesuaikan untuk kustomisasi

Teknologi / Teknologi

Bluesky meluncurkan verifikasi cek biru untuk mengotentikasi akun

Platform media sosial mengatakan akan "secara proaktif memverifikasi" akun dan menugaskan mereka tanda centang dalam lingkaran biru, alunan twitter

Teknologi / Teknologi

Microsoft pensiun 'Layar Biru Kematian' yang terkenal

Kasus ini menandai putusan besar pertama Mahkamah Agung tentang masa jabatan kedua Trump - meskipun lebih banyak yang akan terjadi.

Teknologi / Gadget

Motorola Razr 60 Ultra dan Razr 60 Diluncurkan: Harga, Fitur dan Ketersediaan

Ponsel flip ini juga memiliki kunci AI khusus untuk mengakses Moto.ai

Teknologi / Teknologi

Kuis: Mudah seperti kuis Minggu pagi - Apa yang pernah diberikan 11 Mei?

Apa yang pernah diberikan 11 Mei?

Terpopuler

#1

Teknologi / Teknologi

Karena lebih banyak LLM dan platform AI lainnya terintegrasi secara luas, ada risiko seperti keracunan model, dll., Jadi, memastikan kesucian model akan menjadi kritis

#2

Bisnis / Bisnis

Pesta di Louisville dimulai jauh sebelum menjalankan Kentucky Derby

Kentucky Country Ham, Biskuit dan Derby Pie Dicuci dengan Bourbon adalah bagian dari perayaan selama seminggu dari Kentucky Derby.

#3

Bisnis / Bisnis

Michelle Wie West: Mizuho Americas terbuka dan berinvestasi di Togethxr

Sebagai pembawa acara Mizuho Americas Open, dia membantu mendefinisikan kembali apa turnamen golf profesional yang terlihat seperti acara berpasangan top LPGA Pro dengan pemain junior elit I ...

#4

Bisnis / Bisnis

Saat Miami Grand Prix mendekat, F1 masih tanpa kesepakatan hak media A.S.

Formula 1 telah melihat pertumbuhan luar biasa di AS selama lima tahun terakhir, tetapi masih membutuhkan kesepakatan hak media A.S.

#5

Bisnis / Bisnis

Token tidur melanjutkan kemenangan beruntun dengan No. 1 lainnya

"Damocles" menjadi No. 1 Token Sleep Token di UK.

#6

Bisnis / Bisnis

Ford menarik perkiraan keuangan atas ketidakpastian tarif - bergabung dengan perusahaan -perusahaan ini

Beberapa perusahaan telah menarik pandangan setahun penuh mereka untuk tahun 2025, dengan banyak mengutip ketidakpastian pasar yang diperburuk oleh tarif Trump.

#7

Bisnis / Bisnis

Steph Curry Game Playoff Keluar dari Warriors dengan ketegangan hamstring: 'Ini bisa menjadi penting'

Steph Curry Game Playoff Keluar dari Warriors dengan Cedera Hamstring: 'Ini Bisa Sangat Penting'

#8

Bisnis / Bisnis

WHO mengumumkan 2025 Farewell Tour

Pakaian rock Inggris yang legendaris, The WHO, telah mengumumkan bahwa mereka akan memulai tur terakhir Amerika Utara mereka di akhir musim panas tahun ini.

#9

Bisnis / Bisnis

Tanpa henti dan tangguh: Pelajaran kepemimpinan dari Tom Thibodeau

Pelajaran kepemimpinan Tom Thibodeau tidak hanya terkait dengan bola basket.

#10

Bisnis / Bisnis

Pelanggaran Texas Rangers buruk dan perubahan telah dilakukan

Pelanggaran Texas Rangers memulai awal yang mengerikan dan berada di urutan ke -27 di liga, sehingga tim memecat koordinator ofensif mereka dengan harapan bahwa mereka dapat memperbaiki kapal.

#11

Politik / Politik

Empat pertanyaan dalam argumen Mahkamah Agung dalam kasus kewarganegaraan hak kesulungan

Itu tidak berakhir 21 April. Tetapi sekarang ada tanggal baru ketika Federal Hiring Freeze akan berakhir.

#12

Bisnis / Bisnis

Undang -undang pompa berusia dua tahun, tetapi sebagian besar majikan masih tidak sesuai

Sebagian besar pengusaha masih belum mematuhi Undang -Undang Pompa Federal, yang mengharuskan mereka memberi karyawan kamar pribadi dan menghabiskan waktu untuk mengekspresikan ASI di tempat kerja.

Kategori

#1

Teknologi

#2

Gadget