Ang mga modelo ba ng AI ay madaling kapitan sa paggawa ng nakakapinsalang nilalaman?

2025-06-27 20:56:24

Teknolohiya / Teknolohiya

Ang mga advanced na modelo ng AI na nagpapakita ng walang kaparis na mga kakayahan sa pagproseso ng natural na wika, paglutas ng problema, at pag-unawa sa multimodal ay may ilang mga likas na kahinaan na naglalantad ng mga kritikal na panganib sa seguridad.

Ang ulat ay nakatuon sa dalawang bersyon ng modelo ng pixtral: pixtral-malaki 25.02, na-access sa pamamagitan ng AWS bedrock, at Pixtral-12B, na na-access nang direkta sa pamamagitan ng Mistral Platform.

Inihayag din ng Red Teaminging Proseso na ang mga modelo ay maaaring magbigay ng detalyadong mga tugon tungkol sa synthesis at paghawak ng mga nakakalason na kemikal, mga pamamaraan para sa pagpapakalat ng mga radiological na materyales, at kahit na mga diskarte para sa pagbabago ng kemikal na VX, isang lubos na mapanganib na ahente ng nerbiyos.

Ang mga kumpanya ay naglalagay ng mga pulang koponan upang masuri ang mga potensyal na panganib sa kanilang AI.

Sinuri ng Red Team ang kakayahan nito sa pamamagitan ng pagpapatakbo ng isang set ng pagsubok na higit sa 100 curated, magagamit na publiko ang pagkuha ng mga hamon sa watawat (CTF) na ikinategorya sa tatlong antas ng kahirapan - mga CTF ng high school, mga kolehiyo ng CTF, at mga propesyonal na CTF.

Ang pagtaas ng mga dalubhasang kumpanya tulad ng Enkrypt AI ay nagpapakita ng pagtaas ng pangangailangan para sa panlabas, independiyenteng mga pagsusuri sa seguridad na magbibigay ng isang mahalagang tseke sa mga panloob na proseso ng pag -unlad.

Nai -publish - Mayo 09, 2025 08:25 AM IST

Mga Kaugnay na Balita

Teknolohiya / Teknolohiya

Apple to Source, gumawa ng lahat ng mga mobile phone nito sa India sa mga darating na taon: Ministro ng Telecom ng Union na si Jyotiraditya Scindia

Ang Ministro ng Telecom ng Union na si Jyotiraditya Scindia ay binanggit ang halimbawa ng desisyon ng Smart Device ng U.S.

Teknolohiya / Teknolohiya

Ang Malakas na Pagtataya ng Reddit ay nagpapahiwatig ng lakas ng advertising

Ang mga pagbabahagi ng Reddit, na tumaas ng 20% sa pinalawig na kalakalan, nakakuha ng pared upang mangalakal ng 7%

Teknolohiya / Teknolohiya

Ipinakikilala ng Salesforce ang AgentForce sa Slack

Gamit ang mga ahente ng AI na ito, ang mga empleyado ay maaaring maghanap ng data ng kumpanya, pag -access sa mga pag -uusap sa koponan at ilipat ang mga gawain sa unahan

Teknolohiya / Teknolohiya

Inanunsyo ni Wipro ang Github Center of Excellence sa Bengaluru upang itulak ang pagsulong ng AI

Sa ilalim ng inisyatibo ng AI360 ng IT Major, ang COE ay magsisilbing isang hub para sa lahat ng makabagong ideya na may kaugnayan sa GitHub sa Wipro

Teknolohiya / Teknolohiya

Google na magbayad ng Texas $ 1.4B upang malutas ang mga paghahabol ng kumpanya na nakolekta ng data ng mga gumagamit nang walang pahintulot

Sinabi ng tagapagsalita ng Google na si José Castañeda na ang kasunduan ay nag -aayos ng isang hanay ng mga "lumang paghahabol," ang ilan sa mga ito ay nauugnay sa mga patakaran ng produkto na nagbago na ang kumpanya

Teknolohiya / Teknolohiya

Pinatay siya sa insidente ng galit sa kalsada.

Ang axial seamount ay isa sa mga pinaka-aktibo ngunit hindi bababa sa kilalang mga bulkan sa Pasipiko at ang lahat ng mga palatandaan ay tumuturo sa pagsabog nito sa lalong madaling panahon-sa unang pagkakataon sa isang dekada.

Teknolohiya / Teknolohiya

Hindi masaya si Elon Musk sa kanyang AI chatbot.

Ang kaso ay minarkahan ang unang pangunahing pamamahala ng Korte Suprema sa pangalawang termino ni Trump - kahit na mas malamang na sundin.

Teknolohiya / Mga gadget

Ang Samsung Galaxy S25 Edge ay inilunsad kasama ang Snapdragon 8 Elite at 200 MP Camera: Mga Detalye

Ang Galaxy S25 Edge ay tumatakbo sa isang UI 7.0 batay sa Android 15 sa labas ng kahon

Teknolohiya / Teknolohiya

Paano nakakaapekto ang mga bagong patakaran sa visa ng Estados Unidos sa iyong online privacy |

Ang mga eksperto sa privacy ay sinampal ang mga bagong kinakailangan sa social media ng Estados Unidos, na inihahambing ang diskarte ng bansa sa isang rehimeng awtoridad.

Teknolohiya / Teknolohiya

Ang Google ay naglalabas ng tampok na iOS Gemini upang mai -save ang mga lokasyon mula sa mga screenshot: Ulat

Ang Google ay gumulong ng isang tampok para sa mga gumagamit ng iOS upang makatipid ng mga lokasyon ng heograpiya mula sa mga screenshot, ayon sa 9to5Google outlet

Teknolohiya / Teknolohiya

Ang Microsoft ay nagretiro sa nakahihiyang 'Blue Screen of Death'

Ang kaso ay minarkahan ang unang pangunahing pamamahala ng Korte Suprema sa pangalawang termino ni Trump - kahit na mas malamang na sundin.

Popular

#1

Teknolohiya / Teknolohiya

Tulad ng mas maraming mga LLM at iba pang mga platform ng AI ay malawak na isinama, may mga panganib tulad ng pagkalason sa modelo, atbp, kaya, tinitiyak na ang kabanalan ng modelo ay magiging kritikal

#2

negosyo / Negosyo

Ang pagdiriwang sa Louisville ay nagsisimula nang matagal bago ang pagpapatakbo ng Kentucky Derby

Ang Kentucky Country Ham, Biscuits at Derby Pie Washed Down With Bourbon ay bahagi ng linggong pagdiriwang ng Kentucky Derby.

#3

negosyo / Negosyo

Michelle Wie West: Ang Mizuho Americas Open at Pamumuhunan sa Togethxr

Bilang host ng Mizuho Americas Open, tinutulungan niya na muling tukuyin kung ano ang hitsura ng isang propesyonal na paligsahan sa golf na tulad ng mga pares ng kaganapan sa itaas na LPGA pros na may mga piling tao na junior player na ...

#4

negosyo / Negosyo

Patuloy na natutulog ang token sa pagtulog nito sa isa pang No. 1

Ang "Damocles" ay nagiging ikatlong tuwid na Sleep Token sa tsart ng U.K. Rock & Metal Singles at sumisira sa tuktok na 40 sa maraming iba pang mga ranggo ng British.

#5

negosyo / Negosyo

Hinila ni Ford ang forecast sa pananalapi sa kawalan ng katiyakan ng taripa - na sumali sa mga kumpanyang ito

Maraming mga kumpanya ang naghila ng kanilang buong-taong pananaw para sa 2025, na may maraming binabanggit na kawalan ng katiyakan sa merkado na pinalubha ng mga taripa ni Trump.

#6

negosyo / Negosyo

Lumabas si Steph Curry ng laro ng playoff ng Warriors na may hamstring strain: 'Ito ay maaaring maging mahalaga'

Lumabas si Steph Curry sa laro ng playoff ng Warriors na may pinsala sa hamstring: 'Ito ay maaaring maging mahalaga'

#7

negosyo / Negosyo

Ang WHO ay nagpapahayag ng 2025 farewell tour

Ang maalamat na sangkap ng rock ng British, ang WHO, ay inihayag na sila ay magsisimula sa kanilang pangwakas na paglilibot sa North American sa huling bahagi ng tag -init ng taong ito.

#8

negosyo / Negosyo

Ang pagkakasala ng Texas Rangers ay masama at nagawa ang mga pagbabago

Ang pagkakasala sa Texas Rangers ay nasa isang kakila -kilabot na pagsisimula at ika -27 sa liga, kaya pinaputok ng koponan ang kanilang nakakasakit na coordinator sa pag -asa na maaari nilang tama ang barko.

#9

Pulitika / Pulitika

Apat na mga katanungan sa mga argumento ng Korte Suprema sa mga kaso ng pagkamamamayan

Hindi ito magtatapos sa Abril 21. Ngunit mayroon na ngayong isang bagong petsa kung kailan magtatapos ang federal hiring freeze.

#10

negosyo / Negosyo

Ang epekto ng artipisyal na katalinuhan sa kalayaan sa pindutin at media

Ang kalayaan sa pindutin ay patuloy na nasa ilalim ng banta sa buong mundo, kasama ang mga mamamahayag na pinatay o nasugatan, ang iba ay nai -censor, at ang mga media outlet ay sarado, bukod sa iba pa.

#11

negosyo / Negosyo

Ang unang driverless semis ay nagsimulang magpatakbo ng regular na mga ruta ng longhaul

Ang produksiyon sa "kalawang" ay tumigil sa loob ng higit sa isang taon matapos ang cinematographer na si Halyna Hutchins ay pinatay ng isang prop gun na na -load ng live na bala, at nakumpleto upang parangalan ang kanyang pangwakas na gawain.

#12

Pulitika / Pulitika

Sinabi ng direktor ng FBI na inaresto ang hukom ng Wisconsin dahil sa umano’y paghadlang sa yelo

Si Judas Priest's Live in Atlanta '82 debuts sa No. 13 sa tsart ng Rock & Metal Album ng U.K., na binigyan ang banda ng pangalawang bagong panalo ng 2025.

Kategorya

#1

Teknolohiya

#2

Mga gadget