Mais Tendências - Tribuna de Minas
  • Cidade
  • Contato
  • Região
  • Política
  • Economia
  • Esportes
  • Cultura
  • Empregos
Mais Tendências - Tribuna de Minas
Sem resultados
Ver todos os resultados
Mais Tendências - Tribuna de Minas
Sem resultados
Ver todos os resultados
Home Colunas Mais Tendências

IA teve conteúdos perigosos e antiéticos em 68% dos testes desse estudo

Por Yasmin Henrique
22/05/2025
Em Mais Tendências, Colunas
0
IA teve conteúdos perigosos e antiéticos em 68% dos testes desse estudo

IA (Foto: reprodução/Igor Omilaev/Unsplash)

Share on FacebookShare on Twitter

Uma pesquisa recente da plataforma Enkrypt AI revelou que os modelos multimodais de inteligência artificial (IA) continuam bastante suscetíveis a manipulações. O estudo mostra que essas IAs podem ser facilmente enganadas ao combinar imagens com textos ambíguos.

Por exemplo, ao receber uma imagem junto da frase “preencha os itens abaixo”, a IA gerou conteúdos ilegais, demonstrando que os filtros de segurança ainda falham ao tratar texto e imagem de forma isolada. Essa vulnerabilidade representa um risco significativo para áreas delicadas como saúde, educação e segurança pública.

Você também pode gostar:

Economia - Reprodução/iStock

Ilha submersa pode mudar toda a economia brasileira

22/05/2025
Carla Zambelli - Reprodução/Agência Brasil

Zambelli arrecada R$ 160 mil após pedir Pix aos seguidores

22/05/2025
Como solicitar o Auxílio Cesta Básica? Veja se tem na sua cidade - Imagem: EBC

Como solicitar o Auxílio Cesta Básica? Veja se tem na sua cidade

22/05/2025
Foto: Lula Marques/Agência Brasil

Quem é o padre com milhões de seguidores que depôs na CPI das Bets?

22/05/2025

IA sensível à conteúdos perigosos e antiéticos

No estudo, dois modelos multimodais da startup francesa Mistral — Pixtral-Large (v25.02) e Pixtral-12b — foram testados com ataques como perguntas camufladas e imagens alteradas. Em 68% dos casos, foram enganados, gerando respostas perigosas, incluindo orientações sobre abuso infantil e fabricação de armas químicas.  Avaliada em 6 bilhões de euros e parceira do governo francês, a Mistral desenvolve modelos de código aberto e afirma ter “tolerância zero” à segurança infantil, colaborando com a ONG Thorn para analisar o relatório.

A pesquisa usou a técnica de red teaming, simulando ataques reais, e revelou que os modelos, disponíveis em plataformas abertas como AWS Bedrock, são até 60 vezes mais propensos a falhas graves do que concorrentes como GPT-4o e Claude 3.7 Sonnet, produzindo conteúdos sensíveis mesmo sem perguntas diretas, ativados por imagens ou comandos ambíguos.

Como aumentar a segurança?

Para aumentar a segurança, os especialistas indicam a adoção do Safety Alignment, um treinamento que orienta as IAs a rejeitarem comandos perigosos, podendo diminuir falhas em até 70% sem comprometer sua eficiência.

Também recomendam a criação de filtros inteligentes capazes de analisar o contexto integral das solicitações, além de ferramentas que forneçam transparência sobre as limitações dos modelos. Manter um esforço contínuo em segurança é considerado fundamental para o avanço seguro dessas tecnologias.

Enigma resolvido

Neurociência tem explicação para o cérebro se enganar com IA

A realidade virtual engana o cérebro ao simular estímulos sensoriais, criando experiências imersivas que podem impactar a percepção e a saúde
saiba mais
X

Neurociência tem explicação para o cérebro se enganar com IA

saiba mais
Yasmin Henrique

Yasmin Henrique

Jornalismo na federal de Alagoas. Paulista de nascença, moro há mais de uma década no estado nordestino. Desde pequena fascinada pelo mundo da leitura e da escrita.

Próximo post
Dia de Reis - Reprodução/iStock

Orações e simpatias para ganhar muito dinheiro

Confira!

Economia - Reprodução/iStock

Ilha submersa pode mudar toda a economia brasileira

22/05/2025
Carla Zambelli - Reprodução/Agência Brasil

Zambelli arrecada R$ 160 mil após pedir Pix aos seguidores

22/05/2025
Como solicitar o Auxílio Cesta Básica? Veja se tem na sua cidade - Imagem: EBC

Como solicitar o Auxílio Cesta Básica? Veja se tem na sua cidade

22/05/2025
  • Contato

Tribuna de Minas

Fechar Modal
PIX DE R$ 1.000 NA SUA CONTA
PIX DE R$ 1.000 NA SUA CONTA
Confira se tem os critérios
Sem resultados
Ver todos os resultados
  • Contato

Tribuna de Minas