{"id":50688,"date":"2026-05-01T18:00:00","date_gmt":"2026-05-01T21:00:00","guid":{"rendered":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/?p=50688"},"modified":"2026-04-28T20:12:53","modified_gmt":"2026-04-28T23:12:53","slug":"estudo-mostra-ranking-das-ias-que-mais-inventam-informacoes-ao-responder","status":"publish","type":"post","link":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/estudo-mostra-ranking-das-ias-que-mais-inventam-informacoes-ao-responder\/","title":{"rendered":"Estudo mostra ranking das IAs que mais inventam informa\u00e7\u00f5es ao responder"},"content":{"rendered":"\n<p>Um levantamento realizado pela empresa Legal Guardian Digital, especializada em SEO para o setor jur\u00eddico, trouxe novos elementos para o debate sobre confiabilidade de chatbots de intelig\u00eancia artificial. <\/p>\n\n\n\n<p>O estudo comparou diferentes modelos populares do mercado e identificou diferen\u00e7as na taxa de erros factuais, fen\u00f4meno conhecido como \u201calucina\u00e7\u00e3o\u201d em IA.<\/p>\n\n\n\n<p>A an\u00e1lise avaliou desempenho, consist\u00eancia, satisfa\u00e7\u00e3o do usu\u00e1rio, disponibilidade e frequ\u00eancia de respostas incorretas, resultando em um score geral de 0 a 100 para cada sistema.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">O que s\u00e3o \u201calucina\u00e7\u00f5es\u201d em intelig\u00eancia artificial<\/h2>\n\n\n\n<p>As chamadas alucina\u00e7\u00f5es de IA ocorrem quando um modelo gera informa\u00e7\u00f5es que parecem corretas, mas s\u00e3o, na realidade, falsas ou sem base em dados verific\u00e1veis.<\/p>\n\n\n\n<p>Segundo o estudo, isso acontece porque os Grandes Modelos de Linguagem (LLMs) funcionam prevendo a pr\u00f3xima palavra mais prov\u00e1vel em uma sequ\u00eancia de texto. <\/p>\n\n\n\n<p>Quando n\u00e3o h\u00e1 padr\u00f5es suficientes ou dados confi\u00e1veis para uma resposta precisa, o sistema pode \u201ccompletar lacunas\u201d com informa\u00e7\u00f5es plaus\u00edveis, mas incorretas.<\/p>\n\n\n\n<p>Com o uso crescente dessas ferramentas no ambiente profissional o relat\u00f3rio aponta que cerca de 25% dos trabalhadores nos Estados Unidos j\u00e1 utilizam IA regularmente, a checagem humana continua sendo considerada essencial, especialmente para dados sens\u00edveis como nomes, datas e valores.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Ranking das IAs com maior taxa de alucina\u00e7\u00e3o<\/h2>\n\n\n\n<p>O estudo mediu a porcentagem de respostas com informa\u00e7\u00f5es incorretas em testes controlados. Confira o ranking:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Google Gemini:<\/strong> 32%<\/li>\n\n\n\n<li><strong>ChatGPT: <\/strong>30%<\/li>\n\n\n\n<li><strong>Kimi:<\/strong> 27%<\/li>\n\n\n\n<li><strong>Microsoft Copilot:<\/strong> 27%<\/li>\n\n\n\n<li><strong>Meta AI: <\/strong>25%<\/li>\n\n\n\n<li><strong>Claude: <\/strong>20%<\/li>\n\n\n\n<li><strong>Grok:<\/strong> 15%<\/li>\n\n\n\n<li><strong>DeepSeek: <\/strong>14%<\/li>\n\n\n\n<li><strong>Perplexity AI:<\/strong> 13%<\/li>\n<\/ul>\n\n\n\n<p>De acordo com os dados, o Google Gemini apresentou a maior taxa de alucina\u00e7\u00e3o, com 32%, o que significa que aproximadamente 32 em cada 100 respostas analisadas continham algum tipo de erro factual.<\/p>\n\n\n\n<p>J\u00e1 o ChatGPT aparece logo em seguida, com 30%, mais que o dobro da taxa registrada pelo DeepSeek, que marcou 14%.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Desempenho geral e ranking de confiabilidade<\/h2>\n\n\n\n<p>Al\u00e9m da taxa de erro, a pesquisa criou um \u00edndice geral que combina diferentes m\u00e9tricas de desempenho. O resultado final foi o seguinte:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Perplexity AI<\/strong>: 85 pontos<\/li>\n\n\n\n<li><strong>Grok<\/strong>: 79 pontos<\/li>\n\n\n\n<li><strong>DeepSeek<\/strong>: 76 pontos<\/li>\n<\/ul>\n\n\n\n<p>Outros modelos intermedi\u00e1rios<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>ChatGPT<\/strong>: 50 pontos<\/li>\n\n\n\n<li><strong>Google Gemini<\/strong>: 41 pontos<\/li>\n\n\n\n<li><strong>Meta AI<\/strong>: 37 pontos<\/li>\n<\/ul>\n\n\n\n<p>O estudo mostra que modelos com menor taxa de alucina\u00e7\u00e3o nem sempre ocupam as primeiras posi\u00e7\u00f5es em outros crit\u00e9rios, como experi\u00eancia do usu\u00e1rio ou estabilidade.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Destaques por categoria<\/h2>\n\n\n\n<p>O levantamento tamb\u00e9m analisou o desempenho das intelig\u00eancias artificiais em crit\u00e9rios espec\u00edficos, indo al\u00e9m da taxa de erros para entender como cada modelo se comporta em diferentes aspectos de uso no dia a dia.<\/p>\n\n\n\n<p>No quesito satisfa\u00e7\u00e3o do usu\u00e1rio, duas plataformas se destacaram de forma conjunta: DeepSeek e ChatGPT, ambas alcan\u00e7ando a melhor avalia\u00e7\u00e3o do p\u00fablico, com nota m\u00e9dia de 4,7 de 5. <\/p>\n\n\n\n<p>Na outra ponta do ranking, a Meta AI apresentou o desempenho mais baixo nessa categoria, registrando apenas 3,4 de 5, o que indica uma experi\u00eancia considerada menos satisfat\u00f3ria pelos usu\u00e1rios avaliados.<\/p>\n\n\n\n<p>Quando o assunto \u00e9 consist\u00eancia e qualidade das respostas, o maior destaque ficou com o modelo Kimi, que obteve nota 4,3 de 5, sendo apontado como o mais equilibrado nesse crit\u00e9rio espec\u00edfico, com respostas mais est\u00e1veis e coerentes ao longo dos testes.<\/p>\n\n\n\n<p>J\u00e1 na categoria de disponibilidade (uptime), dois sistemas atingiram o desempenho m\u00e1ximo: Perplexity AI e Grok, ambos com 100% de funcionamento durante o per\u00edodo analisado, sem quedas registradas. <\/p>\n\n\n\n<p>Em contrapartida, o modelo Claude apresentou o menor \u00edndice entre todos, com 98,68% de disponibilidade, ainda assim mantendo um n\u00edvel elevado de estabilidade, mas abaixo dos concorrentes diretos nesse aspecto.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">O que os dados revelam sobre o uso de IA<\/h2>\n\n\n\n<p>A pesquisa refor\u00e7a que mesmo os sistemas mais avan\u00e7ados ainda podem apresentar erros relevantes.<\/p>\n\n\n\n<p>Especialistas destacam que isso n\u00e3o significa que as ferramentas sejam in\u00fateis, mas sim que seu uso exige cautela, especialmente em contextos profissionais, acad\u00eamicos ou jur\u00eddicos.<\/p>\n\n\n\n<p>O cen\u00e1rio tamb\u00e9m evidencia um avan\u00e7o desigual entre os modelos, com algumas plataformas priorizando precis\u00e3o, enquanto outras se destacam mais em experi\u00eancia de uso ou velocidade de resposta.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Um levantamento realizado pela empresa Legal Guardian Digital, especializada em SEO para o setor jur\u00eddico, trouxe novos elementos para o debate sobre confiabilidade de chatbots de intelig\u00eancia artificial. O estudo comparou diferentes modelos populares do mercado e identificou diferen\u00e7as na taxa de erros factuais, fen\u00f4meno conhecido como \u201calucina\u00e7\u00e3o\u201d em IA. A an\u00e1lise avaliou desempenho, consist\u00eancia, [&hellip;]<\/p>\n","protected":false},"author":5,"featured_media":11834,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"jnews-multi-image_gallery":[],"jnews_single_post":{"format":"standard"},"jnews_primary_category":[],"jnews_social_meta":[],"jnews_override_counter":[],"jnews_post_split":[],"footnotes":""},"categories":[83,84],"tags":[],"class_list":["post-50688","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-colunas","category-mais-tendencias"],"_referencia":"","_links":{"self":[{"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/posts\/50688","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/comments?post=50688"}],"version-history":[{"count":1,"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/posts\/50688\/revisions"}],"predecessor-version":[{"id":50689,"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/posts\/50688\/revisions\/50689"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/media\/11834"}],"wp:attachment":[{"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/media?parent=50688"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/categories?post=50688"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/tribunademinas.com.br\/colunas\/maistendencias\/wp-json\/wp\/v2\/tags?post=50688"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}