数模测评:doubao1.5>deepseek-v3>gpt-o1
本次测试了当前评价最高的三款大模型doubao1.5、gpt-o1、deepseek-v3(r1崩溃),都是采用无提示词的硬核提问方式,测试视频如下。
gpto1、doubao1.5、deepseek测评
测试方式:
上传美赛六道题目文件
直接提问以下5句话:
-
这是一道数学建模题目,请做下问题重述
-
请给出每一个问题的思路
-
针对每个问题推荐前沿算法
-
建立第一问数学模型
-
编写第一问数学模型的程序