DeepSeek学术写作测评第一弹:论文润色,中译英效果如何?
我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。
最近风很大的DeepSeek,持续火出圈,引起了硅谷AI圈的热议。很多学员让娜姐测评一下对于平时需要学术写作润色的论文党,效果究竟怎么样?
娜姐分别测试了论文润色、翻译(中译英),数据分析,学术问题回答分析,根据背景知识进行学术写作,以及文献阅读分析等场景。
发现DeepSeek还真有点东西,有些场景效果已经可以媲美ChatGPT了,有些还稍微弱一些。
一篇文章太长,娜姐分几篇文章来详细分析DeepSeek和ChatGPT的对比效果。
本文是第一弹:中英文论文润色、翻译(中译英)效果和ChatGPT的对比评估。
1 英文润色
首先是我们最常用的场景:论文润色。
先说结论,DeepSeek的润色效果完全可以平替ChatGPT。
之前英文论文润色,娜姐测试对比的效果是ChatGPT一直处于领先水平。甚至Claude都比ChatGPT稍逊一点:润色后表达稍显生硬,读来不够流畅。
但是,DeepSeek的效果很惊艳。为了严谨起见,娜姐和之前的润色测评用同一篇文章,且从头到尾完整对比了润色后的全文。
DeepSeek逐字逐句,改的很仔细。
我们来仔细看一下,润色质量如何:
娜姐作为一个老练的SCI期刊编辑,服气的说,这效果真的可以!
时态把握的很准确,一些学术写作规则(P斜体,=><前后要空格,左旋肉碱L大写等)能很好的遵从;特别是Results部分,原作者写的很差,意思表达的含混不清。DeepSeek则可以按照学术写作规范,将结果的统计学差异清晰简洁的表达出来,逻辑也非常流畅。
娜姐仔细对比了全文的润色结果,质量一以贯之,非常好。使用方法和ChatGPT是一样的。
2 中文润色:
很多同学的中文学术写作也不规范,不管是论文还是标书,这一块娜姐之前写过,ChatGPT是表现很不错的:
AI润色中文论文标书,效果怎么样?
那DeepSeek呢?还能是ChatGPT的最佳平替吗?
先说结论:基本的错别字,用词不当,DeepSeek没问题,但是逻辑错误DeepSeek没改出来。很奇怪吧,一个中文大模型居然润色中文没有英文出色!
先来看一下摘要部分的润色对比:
DeepSeek:
之前ChatGPT润色的:
原文病句:本项目拟结合CRISPR-Cas9系统和PiggyBac转座子靶向干细胞中CXCR4以产生抗HIV-1复制的突变体而不影响其分化和增殖。
DeepSeek改的:本项目拟结合CRISPR-Cas9系统和PiggyBac转座子技术,靶向干细胞中的CXCR4基因以产生抗HIV-1复制的突变体,同时确保其分化和增殖功能不受影响。
ChatGPT改的:本项目拟结合CRISPR-Cas9系统和PiggyBac转座子技术,在干细胞中靶向CXCR4基因,产生既能抑制HIV-1复制又不影响细胞分化和增殖的突变体干细胞。
很明显,原句主语不清,DeepSeek改的没有ChatGPT好。
娜姐又对比了全文的润色效果,发现只要涉及逻辑不顺畅的地方,DeepSeek的润色效果都没有ChatGPT好。
有人说,会不会是你提示词的问题?你的提示词是适配ChatGPT的,所以对DeepSeek发挥效果有限。
于是我又修改了提示词,改成通常更简洁的版本,但是效果还不如第一版的精细化提示词。
娜姐猜想是不是DeepSeek用来训练的数据集主要是英文来源的?我把它使用的数据集表格发给ChatGPT,它帮我分析的结果果然是-—预训练阶段80%以上数据集是英文来源,微调阶段也是主要是英文来源。
所以DeepSeek对英文语法的习得比中文更好。
3 中译英:
这个也是大家的高频需求,用中文写作更高效,表达更顺畅。
但是,由于中英表达习惯的不同:中文习惯状语前置,有时候主语很长,而英文表达则相反。因此,中译英后的效果总是很别扭。
之前娜姐的三步反思法,ChatGPT中译英可以彻底消除中文腔,翻译的很地道。
论文中译英的最佳解决方案?ChatGPT自我反思翻译法了解一下!
来看看DeepSeek表现如何:
协同护理模式在全髋关节置换术后恐动症患者中的应用:
以下是ChatGPT的中译英效果对比:
总的来说,DeepSeek翻译的还不错,也符合学术论文的表达规范。但是,仔细对比,Methods部分DeekSeek的翻译全是长句, 因为中文原文也是长句。但是ChatGPT会将长句切断成短句,长短交错。更符合英文的表达习惯。
中译英,结论是DeepSeek还可以, 但是ChatGPT还是比DeepSeek更胜一筹。
娜姐还测试了数据分析,学术问题回答分析,根据背景知识进行学术写作,以及文献阅读分析等场景。
基于DeepSeek R1的推理模型,有些部分效果还不错。但是在抽象学术问题回答分析中,也会出现强行造新词,“意大利面拌42号混凝土”之类的胡言乱语。有人说是因为DeepSeek R1的训练方式使得它在输出上存在的缺陷:一个天才儿童,有超强的思维能力,但是却难以用常规语言解释清楚。
娜姐会在下一篇文章中继续测评DeepSeek在其他场景中的详细表现。
总结一下:
英文论文润色:DeepSeek完全可以平替ChatGPT;
中文论文标书润色:ChatGPT比DeepSeek强;
中译英:ChatGPT比DeepSeek强。