Mais Tendências - Tribuna de Minas
  • Cidade
  • Contato
  • Região
  • Política
  • Economia
  • Esportes
  • Cultura
  • Empregos
Mais Tendências - Tribuna de Minas
Sem resultados
Ver todos os resultados
Mais Tendências - Tribuna de Minas
Sem resultados
Ver todos os resultados

IA teve conteúdos perigosos e antiéticos em 68% dos testes desse estudo

Por Yasmin Henrique
22/05/2025
Em Mais Tendências, Colunas
0
Conflito digital dos anos 90 revive com inteligência artificial

IA (Foto: reprodução/Igor Omilaev/Unsplash)

Uma pesquisa recente da plataforma Enkrypt AI revelou que os modelos multimodais de inteligência artificial (IA) continuam bastante suscetíveis a manipulações. O estudo mostra que essas IAs podem ser facilmente enganadas ao combinar imagens com textos ambíguos.

Por exemplo, ao receber uma imagem junto da frase “preencha os itens abaixo”, a IA gerou conteúdos ilegais, demonstrando que os filtros de segurança ainda falham ao tratar texto e imagem de forma isolada. Essa vulnerabilidade representa um risco significativo para áreas delicadas como saúde, educação e segurança pública.

IA sensível à conteúdos perigosos e antiéticos

No estudo, dois modelos multimodais da startup francesa Mistral — Pixtral-Large (v25.02) e Pixtral-12b — foram testados com ataques como perguntas camufladas e imagens alteradas. Em 68% dos casos, foram enganados, gerando respostas perigosas, incluindo orientações sobre abuso infantil e fabricação de armas químicas.  Avaliada em 6 bilhões de euros e parceira do governo francês, a Mistral desenvolve modelos de código aberto e afirma ter “tolerância zero” à segurança infantil, colaborando com a ONG Thorn para analisar o relatório.

A pesquisa usou a técnica de red teaming, simulando ataques reais, e revelou que os modelos, disponíveis em plataformas abertas como AWS Bedrock, são até 60 vezes mais propensos a falhas graves do que concorrentes como GPT-4o e Claude 3.7 Sonnet, produzindo conteúdos sensíveis mesmo sem perguntas diretas, ativados por imagens ou comandos ambíguos.

Como aumentar a segurança?

Para aumentar a segurança, os especialistas indicam a adoção do Safety Alignment, um treinamento que orienta as IAs a rejeitarem comandos perigosos, podendo diminuir falhas em até 70% sem comprometer sua eficiência.

Também recomendam a criação de filtros inteligentes capazes de analisar o contexto integral das solicitações, além de ferramentas que forneçam transparência sobre as limitações dos modelos. Manter um esforço contínuo em segurança é considerado fundamental para o avanço seguro dessas tecnologias.

Enigma resolvido

Neurociência tem explicação para o cérebro se enganar com IA

A realidade virtual engana o cérebro ao simular estímulos sensoriais, criando experiências imersivas que podem impactar a percepção e a saúde
saiba mais
X

Neurociência tem explicação para o cérebro se enganar com IA

saiba mais
Dúvidas, críticas ou sugestões? Fale com o nosso time editorial.
Yasmin Henrique

Yasmin Henrique

Jornalismo na federal de Alagoas. Paulista de nascença, moro há mais de uma década no estado nordestino. Desde pequena fascinada pelo mundo da leitura e da escrita.

Próximo post
Dia de Reis - Reprodução/iStock

Orações e simpatias para ganhar muito dinheiro

Confira!

Cachorro - Reprodução/iStock

A psicologia explica por que quem conversa com o pet como se fosse gente tem características acima da média

05/06/2026
Imposto de Renda Receita Federal

Mesmo com problemas na pré-preenchida, declaração pode virar automática em 3 anos

05/06/2026
Esponja - Reprodução/Unsplash/fcafotodigital

Estudo comprova que a esponja de louça libera microplásticos na água a cada vez que é usada

05/06/2026

Copyright Tribuna de Minas. Todos os direitos reservados. É proibida a reprodução do conteúdo dessa página em qualquer meio de comunicação, eletrônico ou impresso, sem a autorização escrita da Tribuna de Minas

Contato

Bem-vindo de volta!

Faça login abaixo

Esqueceu a senha?

Recupere sua senha

Insira seu nome de usuário ou endereço de e-mail para redefinir sua senha.

Log In

Adicionar nova Playlist

Sem resultados
Ver todos os resultados
  • Contato

Tribuna de Minas