What is it about?
Este artigo avalia a capacidade de dois chatbots, o chatGPT e o Bard (atualmente chamado de Gemini) em resolver questões de múltipla escolha do POSCOMP - Exame Nacional para Ingresso na Pós-Graduação em Computação. Os chatbots responderam a 271 questões e, em média, atingiram um desempenho 20% superior ao desempenho médio dos humanos.
Featured Image
Photo by BoliviaInteligente on Unsplash
Why is it important?
Com a melhoria do desempenho dos chatbots para responder a uma gama variada de perguntas e o aumento de exames que ocorrem de forma online, é cada vez mais importante avaliar a capacidade desses sistemas em realizar provas de diferentes áreas.
Perspectives
Read the Original
This page is a summary of: ChatGPT and Bard Performance on the POSCOMP Exam, May 2024, ACM (Association for Computing Machinery),
DOI: 10.1145/3658271.3658320.
You can read the full text:
Contributors
The following have contributed to this page