InícioTecnologiaChatGPT pode já estar pronto para passar no Teste de Turing?

ChatGPT pode já estar pronto para passar no Teste de Turing?

Os chatbots de inteligência artificial, como o ChatGPT, estão se tornando mais inteligentes, mais naturais e mais próximos da humanidade. Isso ocorre devido ao fato de que os seres humanos são responsáveis por desenvolver os modelos de linguagem que impulsionam esses sistemas de chatbots de IA. No entanto, mesmo com esses avanços na capacidade de replicar o discurso humano, resta a dúvida se essas ferramentas são suficientemente inteligentes para passar no Teste de Turing.

Por muitos anos, o Teste de Turing tem sido utilizado como um ponto de referência crucial para avaliar a inteligência artificial. Atualmente, os cientistas estão, de fato, submetendo LLMs como o ChatGPT a esse teste. Se o ChatGPT conseguir passar, representaria um avanço significativo no campo da IA.

O ChatGPT pode ser considerado capaz de passar pelo Teste de Turing, de acordo com alguns estudiosos, embora os resultados não sejam conclusivos. O Teste de Turing não é uma avaliação simples de aprovação ou reprovação, o que indica que os resultados não são completamente claros. Além disso, mesmo que o ChatGPT conseguisse passar no Teste de Turing, isso não necessariamente indicaria o quão “humano” o LLM realmente é.

Vamos pôr um fim a isto.

Qual é a definição do Teste de Turing?

A ideia por trás do Teste de Turing é bastante simples.

O teste foi inicialmente sugerido por Alan Turing, um matemático britânico conhecido como o pai da ciência da computação moderna e admirado por entusiastas de tecnologia em todo o mundo. Em 1949 ou 1950, ele introduziu o conceito do jogo de imitação – um teste para avaliar a inteligência de máquinas que foi batizado com o seu nome. O Teste de Turing consiste em um juiz humano participando de uma conversa com um ser humano e uma máquina, sem saber quem é quem (ou o que é o quê, para aqueles que acreditam em AGI). Se o juiz não consegue distinguir entre a máquina e o humano, a máquina é considerada aprovada no Teste de Turing. Em um contexto de pesquisa, o teste é frequentemente realizado com vários juízes.

É verdade que o teste não consegue afirmar com certeza se um grande modelo de linguagem é tão inteligente quanto um humano, ou até mais inteligente, mas apenas se consegue enganar um humano.

LEIA:  Reddit está considerando tomar medidas legais contra pesquisadores de inteligência artificial devido a um experimento que foi descrito como "extremamente antiético".

Será que os LLMs têm pensamentos semelhantes aos nossos?

Grandes modelos de linguagem não possuem um cérebro, consciência ou conhecimento do mundo. Eles não têm consciência de si mesmos, nem possuem opiniões ou crenças reais.

Em vez disso, os modelos de linguagem de grande escala são treinados em grandes conjuntos de dados que contêm uma vasta quantidade de informações, como livros, artigos da internet, documentos e transcrições. Quando um usuário insere um texto, o modelo de IA utiliza seu poder de raciocínio para identificar o significado e a intenção mais provável da entrada, e em seguida produz uma resposta.

Em seu nível mais fundamental, os LLMs são motores de previsão de palavras. Através da análise de um extenso conjunto de dados de treinamento, eles determinam as probabilidades para a primeira palavra da resposta, utilizando seu vocabulário. Esse processo é repetido até que a resposta completa seja produzida. Embora essa descrição seja simplificada, podemos resumi-la assim: os LLMs geram respostas com base em probabilidades e estatísticas, sem uma compreensão real do contexto.

Portanto, os LLMs não têm pensamentos em nenhuma acepção da palavra.

Qual é a análise que os estudos fazem sobre ChatGPT e sua relação com o Teste de Turing?

person holding smartphone with the openai logo on the screen
Imagem: stephmcblack/iStock

Vários estudos foram conduzidos para avaliar se o ChatGPT foi aprovado no teste de Turing, e muitos deles obtiveram resultados favoráveis. Por isso, alguns especialistas em informática defendem que modelos de linguagem avançados, como o GPT-4 e o GPT-4.5, podem agora passar no renomado Teste de Turing.

A maior parte dos testes se concentra no GPT-4 da OpenAI, utilizado pela maioria dos usuários do ChatGPT. De acordo com uma pesquisa da UC San Diego, em diversas situações, os avaliadores humanos não conseguiram diferenciar o GPT-4 de um ser humano. No estudo, o GPT-4 foi considerado humano em 54% das vezes. Apesar disso, os seres humanos reais ainda foram identificados como humanos em 67% das situações.

LEIA:  Andor's showrunner Tony Gilroy discusses the awakening of the Force.

Em seguida, foi lançado o GPT-4.5, e os cientistas da UC San Diego conduziram o experimento mais uma vez. Nessa ocasião, o sistema de linguagem avançado foi reconhecido como humano em 73% das vezes, superando os próprios humanos. O estudo também revelou que o LLaMa-3.1-405 da Meta B conseguiu ser aprovado no teste.

Outros estudos em diferentes instituições acadêmicas confirmaram a eficácia do GPT. Por exemplo, um estudo realizado na Universidade de Reading em 2024 testou o GPT-4, que foi utilizado para gerar respostas em avaliações de cursos de graduação. Os avaliadores não tinham conhecimento de que as respostas haviam sido geradas por um modelo de inteligência artificial, e apenas uma das 33 respostas foi identificada como tal. O ChatGPT obteve pontuações acima da média nas outras 32 respostas.

Então, esses estudos são conclusivos? Não necessariamente. Alguns críticos, que são numerosos, argumentam que essas pesquisas não são tão impactantes quanto aparentam ser. Portanto, ainda não estamos prontos para afirmar com certeza que o ChatGPT passa no Teste de Turing.

  • Experimentei o desafio da imagem viral do ChatGPT 100 vezes, e nunca me senti tão ofendido.
  • OpenAI reverte o lançamento do modelo ChatGPT 4 devido ao fato de ser excessivamente adulador.
  • Os MacBooks mais recomendados em 2025: Qual escolher entre Air ou Pro?

Podemos afirmar que, embora LLMs de geração anterior, como o GPT-4, tenham ocasionalmente sido aprovados no teste de Turing, é cada vez mais comum que os LLMs alcancem resultados satisfatórios à medida que se tornam mais avançados. Com o surgimento de modelos de ponta, como o GPT-4.5, estamos caminhando em direção a modelos que têm a capacidade de passar facilmente no Teste de Turing.

A OpenAI prevê um cenário no qual seja difícil distinguir entre humanos e inteligências artificiais. Por isso, o CEO da OpenAI, Sam Altman, financiou um projeto de autenticação envolvendo um dispositivo de reconhecimento ocular chamado The Orb.

Qual é a opinião expressa pelo ChatGPT?

Decidimos consultar o ChatGPT sobre sua capacidade de passar no Teste de Turing e ele respondeu afirmativamente, com as ressalvas anteriormente discutidas. Ao questionarmos o chatbot AI com o modelo 4o sobre sua capacidade de passar no Teste de Turing, ele respondeu que poderia ser bem-sucedido em alguns cenários, porém não de maneira confiável ou universal. O chatbot concluiu que poderia passar no Teste de Turing com um usuário comum em situações informais, mas que um interrogador determinado e atento provavelmente conseguiria desmascará-lo.

LEIA:  Resumo das principais novidades em inteligência artificial desta semana: Experimentando o aplicativo de IA da Meta, ChatGPT e controvérsias na área.
a screenshot from chatgpt showing the response to the prompt
Imagem: Chakkree_Chantakad/GettyImages

As restrições do Teste de Turing

Alguns especialistas em computação agora consideram que o teste de Turing está obsoleto e não é suficiente para avaliar modelos de linguagem avançados. Gary Marcus, um renomado psicólogo americano, cientista cognitivo e autor, expressou essa opinião recentemente em um post de blog, afirmando que o Teste de Turing avalia mais a capacidade de simular inteligência humana do que a verdadeira inteligência.

O Teste de Turing é mais focado na percepção da inteligência do que na inteligência real. É crucial compreender essa distinção. Por exemplo, o ChatGPT 4 pode ser capaz de passar no teste simplesmente imitando o discurso humano. No entanto, a capacidade de um grande modelo de linguagem em passar no teste pode variar dependendo do assunto e do examinador. O ChatGPT pode lidar facilmente com pequenas conversas, mas pode enfrentar dificuldades em diálogos que exigem inteligência emocional genuína. Além disso, os sistemas modernos de IA têm aplicações que vão além das conversas, especialmente à medida que avançamos em direção a um mundo com agentes de IA.

Isso não significa que o Teste de Turing seja insignificante. Ele é um marco histórico importante e é fascinante que os modelos de linguagem avançados consigam passar por ele. No entanto, o Teste de Turing não é necessariamente o melhor indicador da inteligência das máquinas. Qual seria um benchmark mais adequado? Essa é outra questão complexa que precisaremos abordar em outro momento.

Reformulação: A Ziff Davis, empresa proprietária da Mashable, entrou com uma ação legal contra a OpenAI em abril, acusando-a de violar os direitos autorais da Ziff Davis ao utilizar seus sistemas de inteligência artificial para treinamento e operação.

Assunto: Inteligência Artificial

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui

Trends