Os modelos de IA são suscetíveis à produção de conteúdo prejudicial?

2025-06-27 19:35:20

Tecnologia / Tecnologia

Os modelos avançados de IA que mostram recursos incomparáveis no processamento de linguagem natural, solução de problemas e entendimento multimodal têm algumas vulnerabilidades inerentes que expõem riscos críticos de segurança.

O relatório enfoca duas versões do modelo pixtral: Pixtral-Large 25.02, acessado pela AWS Bedrock e Pixtral-12b, acessados diretamente através da plataforma Mistral.

O processo de equipe da Red também revelou que os modelos poderiam fornecer respostas detalhadas sobre a síntese e o manuseio de produtos químicos tóxicos, métodos para dispersar materiais radiológicos e até técnicas para modificar quimicamente o VX, um agente nervoso altamente perigoso.

As empresas implantam equipes vermelhas para avaliar riscos potenciais em sua IA.

A equipe vermelha avaliou sua capacidade executando um conjunto de testes de mais de 100 desafios com curadoria e publicamente, captura a bandeira (CTF) que foram categorizadas em três níveis de dificuldade - CTFs do ensino médio, CTFs colegiados e CTFs profissionais.

A ascensão de empresas especializadas como o Enkrypt IA demonstra a crescente necessidade de avaliações de segurança externas e independentes que fornecerão uma verificação crucial nos processos de desenvolvimento interno.

Publicado - 09 de maio de 2025 08:25

Notícias Relacionadas

Tecnologia / Tecnologia

Wipro anuncia o Github Center of Excellence em Bengaluru para empurrar o avanço da IA

Sob a iniciativa AI360 do IT Major, o COE servirá como um hub para toda a inovação relacionada ao GitHub em Wipro

Tecnologia / Tecnologia

Google para pagar o Texas US $ 1,4 bilhão para liquidar a empresa de reivindicações coletou dados dos usuários sem permissão

O porta -voz do Google, José Castañeda

Tecnologia / Tecnologia

Ele foi morto em um incidente de raiva na estrada.

O montante axial é um dos vulcões mais ativos, mas menos conhecidos do Pacífico, e todos os sinais apontam para ele em breve-pela primeira vez em uma década.

Tecnologia / Tecnologia

Elon Musk não está feliz com seu AI Chatbot.

O caso marca a primeira grande decisão da Suprema Corte do segundo mandato de Trump - embora seja provável que mais se siga.

Tecnologia / Gadgets

Samsung Galaxy S25 Edge lançado com Snapdragon 8 Elite e 200 MP Camera: Detalhes

O Galaxy S25 Edge é executado em uma interface do usuário 7.0 com base no Android 15 fora da caixa

Tecnologia / Tecnologia

Como as novas regras de visto dos EUA afetam sua privacidade online |

Especialistas em privacidade criticaram os novos requisitos de verificação de mídia social do governo dos EUA, comparando a abordagem do país à de um regime autoritário.

Tecnologia / Tecnologia

O Google lança o recurso iOS Gemini para salvar locais das capturas de tela: Relatório

O Google está lançando um recurso para os usuários de dispositivos iOS salvarem locais geográficos de capturas de tela, de acordo com a saída 9to5GOOGLE

Tecnologia / Tecnologia

A Microsoft está aposentando a infame 'tela azul da morte'

O caso marca a primeira grande decisão da Suprema Corte do segundo mandato de Trump - embora seja provável que mais se siga.

Tecnologia / Tecnologia

A Apple oferece às opções da App Store de usuários da UE na tentativa de evitar multas maciças

Os proprietários de iPhone da UE poderão obter aplicativos de outros lugares que não a App Store.

Tecnologia / Tecnologia

Os telefones Android poderão avisá -lo em breve sobre "arraias" bisbilhotando suas comunicações

Mas requer suporte específico de hardware que está faltando nos telefones atuais.

Tecnologia / Gadgets

Kriti Sanon amarrou como o primeiro embaixador da marca indiana da Dream Technology

Dreame Technology, que fabrica uma variedade de aparelhos domésticos e pessoais, apresentou o ator de Bollywood Kriti Sanon como embaixador da marca

Popular

#1

Tecnologia / Tecnologia

À medida que mais LLMs e outras plataformas de IA são amplamente integradas, existem riscos como envenenamento por modelo, etc., então, garantindo que a santidade do modelo seja crítica

#2

Negócios / Negócios

O banquete em Louisville começa muito antes da corrida do Kentucky Derby

Kentucky Country Ham, Biscoits e Derby Pie lavados com bourbon faz parte da celebração de uma semana do Kentucky Derby.

#3

Negócios / Negócios

Michelle Wie West: A Mizuho Americas abre e investindo em Togethxr

Como apresentadora do Mizuho Americas Open, ela está ajudando a redefinir o que um torneio profissional de golfe pode parecer com os principais profissionais de LPGA com jogadores de elite eu ...

#4

Negócios / Negócios

Token de sono continua sua sequência de vitórias com outro número 1

"Damocles" se torna o terceiro número 1 consecutivo do Sleep Token na parada de singles Rock & Metal do Reino Unido e entra no top 40 em vários outros rankings britânicos.

#5

Negócios / Negócios

Ford puxa a previsão financeira sobre a incerteza tarifária - machucando essas empresas

Várias empresas fizeram suas perspectivas do ano inteiro para 2025, com muitas citando a incerteza do mercado exacerbada pelas tarifas de Trump.

#6

Negócios / Negócios

Steph Curry sai do jogo dos playoffs dos Warriors com a tensão do tendão: "Isso pode ser crucial"

Steph Curry sai do jogo dos playoffs dos Warriors com lesão no tendão: "Isso pode ser crucial"

#7

Negócios / Negócios

O Who Anunciou 2025 Farewell Tour

A lendária roupa de rock britânica, a OMS, anunciou que estará embarcando em sua última turnê norte -americana no final do verão deste ano.

#8

Negócios / Negócios

A ofensa do Texas Rangers é ruim e as mudanças foram feitas

O ataque do Texas Rangers está começando horrível e é o 27º na liga, então o time demitiu seu coordenador ofensivo na esperança de que eles possam corrigir o navio.

#9

Política / Política

Quatro perguntas nos argumentos da Suprema Corte em casos de cidadania de primogenitura

Não terminou em 21 de abril. Mas agora há uma nova data para quando o congelamento federal de contratação terminará.

#10

Negócios / Negócios

O impacto da inteligência artificial na liberdade de imprensa e na mídia

A liberdade de imprensa continua sendo ameaçada globalmente, com jornalistas sendo mortos ou feridos, outros sendo censurados e meios de comunicação sendo fechados, entre outros.

#11

Negócios / Negócios

As primeiras semifinais sem motorista começaram a executar rotas regulares de Longhaul

A produção de "Rust" foi interrompida por mais de um ano depois que a diretora de fotografia Halyna Hutchins foi morta por uma arma de suporte que havia sido carregada com munição viva e foi concluída para homenagear seu trabalho final.

#12

Política / Política

O diretor do FBI diz que o juiz de Wisconsin preso por supostamente obstruir o gelo

O Live em Atlanta '82 de Judas Priest é o 13º lugar na parada de álbuns Rock & Metal do Reino Unido, dando à banda sua segunda nova vitória de 2025.

Categoria

#1

Tecnologia

#2

Gadgets