What is it about?

Este artigo avalia a capacidade de dois chatbots, o chatGPT e o Bard (atualmente chamado de Gemini) em resolver questões de múltipla escolha do POSCOMP - Exame Nacional para Ingresso na Pós-Graduação em Computação. Os chatbots responderam a 271 questões e, em média, atingiram um desempenho 20% superior ao desempenho médio dos humanos.

Featured Image

Why is it important?

Com a melhoria do desempenho dos chatbots para responder a uma gama variada de perguntas e o aumento de exames que ocorrem de forma online, é cada vez mais importante avaliar a capacidade desses sistemas em realizar provas de diferentes áreas.

Perspectives

Num contexto em que há muitas provas e trabalhos sendo aplicados de forma online e no qual chatbots estão cada vez mais aptos a realizar essas atividades, é necessário avaliar de forma crítica como provas e trabalhos são elaborados e quais habilidades estão sendo cobradas dos estudantes.

Dr. Luciano Antonio Digiampietri
Universidade de Sao Paulo Campus da Capital

Read the Original

This page is a summary of: ChatGPT and Bard Performance on the POSCOMP Exam, May 2024, ACM (Association for Computing Machinery),
DOI: 10.1145/3658271.3658320.
You can read the full text:

Read

Contributors

The following have contributed to this page