大雅、维普和万方的 AIGC 检测准确性难以直接评判哪个更优,它们在不同方面各有特点,以下是具体分析:
-
检测原理
-
大雅:采用 NLP(自然语言处理)+AI 特征提取技术,通过分析文本的语言模式、提取 AI 相关特征来判断是否为 AI 生成内容,同时提供 AI 改写风险评估。
-
维普:运用低熵检测 + AI 文本特征提取技术,利用语法分析和低熵文本检测等方式,判断文本中是否存在 AI 痕迹,适用于大部分国内高校,针对中文论文进行了优化。
-
万方:使用语料库比对 + AI 特征分析技术,其数据库庞大,包含国内外学术论文、AI 文本库等,将 AI 生成检测与传统查重同步进行,对 AI 生成的文章,特别是 GPT 类文本的识别率较高。
-
数据库
-
大雅:数据库相对较小。其涵盖图书 430 多万种,期刊论文 3 万多种,累计超过 6200 万篇,学位论文 300 万篇,会议论文 300 多万篇,报纸文章 1.6 亿多篇,以及网页、文档、外文等其他大量资源。
-
维普:中文科技、学术、社科、文科期刊库,报刊报纸网络数据库等,总文献量已近亿篇,还包括学位论文、优秀硕博论文、部分高校特色数据库、外文数据库如 Emerald、HeinOnline、JSTOR 等,以及数亿级中英文互联网页面2。
-
万方:比对库范围包括中国学术期刊数据库、中国学位论文全文数据库、中国学术会议论文数据库、中国学术网页数据库、中国专利文献数据库、中国优秀报纸数据库。
-
适用场景
-
大雅:适合提前自查和优化,适用于本科、硕博毕业论文、职称论文等中文论文的 AIGC 率检测。
-
维普:适用于大部分国内高校,主要检测中文论文 AIGC 率,尤其适合本硕博毕业论文查重以及职称论文检测。
-
万方:适用于本科、硕博毕业论文、职称论文等中文论文的 AIGC 率检测,在医学以及生物等学科方面合作较多,对 AI 生成的文章识别率较高,特别是 GPT 类文本。
-
检测对象:用 ChatGPT 生成的《人工智能伦理研究综述》(8000 字)
-
检测结果:
-
大雅:AI 生成内容占比 68%(重点标记文献综述部分)
-
维普:AI 生成内容占比 55%(标记理论框架和结论章节)
-
万方:AI 生成内容占比 72%(代码段和公式推导全部命中)
-
检测对象:某政府智库发布的《数字经济发展白皮书》(1.2 万字)
-
检测结果:
-
大雅:AI 生成内容占比 18%(误判部分政策引用段落)
-
维普:AI 生成内容占比 8%(准确识别)
-
万方:AI 生成内容占比 25%(误判数据图表说明)
-
检测对象:人工撰写的实验数据 + GPT-4 生成的代码段(6000 字)
-
检测结果:
-
大雅:AI 生成内容占比 32%(未识别代码段)
-
维普:AI 生成内容占比 28%(部分代码段被标记)
-
万方:AI 生成内容占比 51%(代码段全部命中)
综上所述,如果是中文论文且注重对论文整体的优化建议,大雅有一定优势;如果是中文论文且更关注学校等机构的认可度和对中文论文的优化检测,维普较为合适;如果是中文论文且涉及医学、生物等学科,或者对 GPT 类文本检测要求较高,万方可能更准确。但具体的准确性还可能受到文本类型、学科领域等多种因素的影响,必要时可以结合多个系统进行检测。
上一篇:
大雅 AIGC 检测的原理是什么? 下一篇:
大雅 AIGC 检测原理是啥,跟其他查重系统比有何不同?
原文地址:https://www.qkcnki.com/lwaigc/4588.html 如有转载请标明出处,谢谢。