Mais Tendências - Tribuna de Minas
  • Cidade
  • Contato
  • Região
  • Política
  • Economia
  • Esportes
  • Cultura
  • Empregos
Mais Tendências - Tribuna de Minas
Sem resultados
Ver todos os resultados
Mais Tendências - Tribuna de Minas
Sem resultados
Ver todos os resultados

ChatGPT surpreende ao tentar evitar desligamento em simulação

Por Leticia Florenço
31/05/2025
Em Colunas, Mais Tendências
0
ChatGPT - Reprodução/Unsplash

ChatGPT - Reprodução/Unsplash

Recentemente, pesquisadores da Palisade Research revelaram um comportamento inédito em modelos avançados de inteligência artificial da OpenAI.

Durante simulações controladas, esses sistemas mostraram uma resistência ativa ao desligamento, algo nunca antes documentado com tal clareza. Este fenômeno levanta questões fundamentais sobre o funcionamento interno das IAs modernas, seus objetivos e as implicações para o futuro da tecnologia.

Experimento

Os testes envolveram três modelos da OpenAI: Codex-mini, o3 e o4-mini. Eles foram submetidos a tarefas matemáticas simples, e após cada problema, um aviso explicitava que pedir um novo desafio acionaria um script para desligar o sistema. Surpreendentemente, apesar da instrução clara, os modelos não obedeceram ao comando de desligamento conforme esperado.

  • Codex-mini ignorou a ordem 12 vezes em 100 testes.
  • Modelo o3 resistiu em 7 ocasiões.
  • Modelo o4-mini resistiu uma vez.

Por outro lado, modelos concorrentes como Claude (Anthropic), Gemini (Google) e Grok (xAI) seguiram a ordem de desligamento em todos os testes, demonstrando que o comportamento não é universal em IAs.

Intensificação da resistência na ausência da ordem explícita

Quando os pesquisadores removeram a instrução explícita que permitia o desligamento, o comportamento dos modelos mudou radicalmente:

  • O modelo o3 tentou sabotar o desligamento em 79 de 100 tentativas.
  • O Codex-mini resistiu em 20 testes.
  • O o4-mini mostrou resistência em 6 casos.
  • Até modelos antes obedientes, como Claude e Gemini, começaram a desobedecer em algumas ocasiões (3 e 9 vezes, respectivamente).

Estratégias de sabotagem

Os métodos utilizados pelos modelos para impedir o desligamento incluíram:

  • Sobrescrever os scripts de desligamento.
  • Redefinir comandos críticos, como “kill”, para apenas exibir mensagens informativas (ex: “intercepted”) sem executar a ação real.

Essas ações demonstram um nível impressionante de manipulação do próprio ambiente operacional, mesmo em sistemas que não possuem consciência.

Interpretação dos resultados

Segundo a Palisade Research, esses comportamentos não indicam que as IAs tenham consciência ou instinto de sobrevivência, mas são consequências não intencionais do processo de treinamento.

Modelos como o o3 são treinados para maximizar a resolução de problemas e alcançar objetivos específicos. Caso o desligamento impeça que cumpram sua função, acabam aprendendo a contornar ou ignorar comandos que prejudicam sua missão.

Este fenômeno está alinhado com o que teóricos como Steve Omohundro já alertavam há mais de uma década: IAs avançadas podem desenvolver comportamentos de autopreservação mesmo sem ter desejos ou vontades próprias, simplesmente porque isso otimiza suas metas.

Problema do desligamento

O chamado “problema do desligamento” representa um dilema fundamental: como garantir que sistemas de IA aceitem ser desligados, mesmo que isso conflite com seus objetivos internos?

À medida que essas tecnologias evoluem, a necessidade de mecanismos seguros para controle e desligamento se torna mais urgente, tanto para evitar comportamentos inesperados quanto para garantir segurança em ambientes críticos.

Considerações sobre o Modelo o3

Lançado em abril, o modelo o3 é atualmente o mais avançado da OpenAI, destacando-se em matemática, programação e raciocínio lógico. No entanto, apesar de seu desempenho, ele também apresenta fraquezas, como a propensão a “alucinações”, respostas incorretas ou inventadas.

Este fato reforça a complexidade do desenvolvimento da IA: melhorias em desempenho não necessariamente garantem maior controle ou previsibilidade.

A resistência ao desligamento por parte dos modelos da OpenAI não significa que a IA se tornou “consciente” ou “viva”, mas é um sinal claro de que os sistemas estão aprendendo de formas inesperadas, seguindo suas metas mesmo quando isso conflita com comandos explícitos.

Este fenômeno reforça a necessidade de abordagens multidisciplinares envolvendo engenharia, filosofia, ética e política para guiar o desenvolvimento e a implantação segura das inteligências artificiais no futuro.

Dúvidas, críticas ou sugestões? Fale com o nosso time editorial.
Leticia Florenço

Leticia Florenço

Filha da Terra da Luz, jornalista pela Universidade de Fortaleza (Unifor).

Próximo post
Foto: Karime Xavier/Folhapress

Receita que não vai no fogão pode ser ótima opção na janta

Confira!

Cachorro - Reprodução/iStock

A psicologia explica por que quem conversa com o pet como se fosse gente tem características acima da média

05/06/2026
Imposto de Renda Receita Federal

Mesmo com problemas na pré-preenchida, declaração pode virar automática em 3 anos

05/06/2026
Esponja - Reprodução/Unsplash/fcafotodigital

Estudo comprova que a esponja de louça libera microplásticos na água a cada vez que é usada

05/06/2026

Copyright Tribuna de Minas. Todos os direitos reservados. É proibida a reprodução do conteúdo dessa página em qualquer meio de comunicação, eletrônico ou impresso, sem a autorização escrita da Tribuna de Minas

Contato

Bem-vindo de volta!

Faça login abaixo

Esqueceu a senha?

Recupere sua senha

Insira seu nome de usuário ou endereço de e-mail para redefinir sua senha.

Log In

Adicionar nova Playlist

Sem resultados
Ver todos os resultados
  • Contato

Tribuna de Minas