五大模型解上海高考数学卷
今年是大型模型发挥优势的一年。对于高考数学题,那些号称万能的大型模型答题成功率如何呢?
在对2023年上海高考数学试卷的10道填空题进行测试时,使用五种AI大模型的效果超乎预期。
我们测试了五款AI大模型,它们分别是:ChatGPT、百度文心一言、阿里通义千问、科大讯飞星火认知大模型和360智脑。
其中,科大讯飞的星火认知大模型答对了5道题,准确率为50%。
ChatGPT和百度文心一言都正确回答了4道问题,准确率为40%。
相比之下,阿里通信的千问和360智慧脑都错了10道题,正确率为0%。