1/7生物医学纸摘要AI撰写

- 编辑:大发棋牌官方网站入口 -

1/7生物医学纸摘要AI撰写

对学术文献的大规模分析表明,去年发表的生物医学论文摘要大约1/7可以在人工智能(AI)的帮助下编写。在2024年,PubMed Medical数据库中包含的150万个摘要中,有超过200,000多个词汇包括通常用于大语模型(LLM)的词汇。相关研究于2024年6月在网上发布,预计将在AI的帮助下完成该摘要的约1/9。上述评论的最新结果已于今年7月2日发表在“科学进度”中。英国伦敦大学学院的安德鲁·格雷(Andrew Gray)说:“ LLM编辑的论文的数量是'无法控制的增长'。”他认为,研究人员并未完全认识到用于产生acadepic流行结果的工具的大小,“希望本文将引起人们的注意。”许多团队试图评估LLM对学术产出的影响,但是这个过程很困难,因为大多数用户没有透露此行为。一种常见的方法是训练模型以识别差异 - 人和LLM产生的文本,然后将其应用于文献检查。但是,目前尚不清楚如何在两个文本中识别此类模型,并且培训数据集可能不一定反映最新的LLM趋势。德国图宾根大学的德米特里·科巴克(Dmitry Kobak)及其同事采用了一种更开放的研究方法。他们搜索了“冗余词汇”,在2022年11月Chatgpt变得流行后,频率异常增加。研究发现,2024年的词汇量比2010年以来的任何一年都更加频繁。其中大多数是与研究内容无关的“样式”,这些样式与研究内容,以及基本动词和基本动词和形容词无关。其中包括“发现”和“潜在”的常用词,以及更不寻常的单词“探索”和“显示”。 Kobak指出,新添加了Secon中的多余单词D 2024的一半包括最高的形容词,例如“显着增强”,“阻止”,“无与伦比”和“非常有用”。科学词汇的演变是一个长期过程。 2021年有190个“冗余词汇”,其中大多数是与研究内容有关的名词。但是,词汇变化是因为LLM的受欢迎程度变得更加重要,并且在样式层面上主要可见。除了诸如计算科学和生物信息学之类的领域外,LLM还撰写了超过1/5的摘要。科巴克说:“今年的一般数据可能会增加,LLM的使用将继续增加。” AI的实际使用可能高于最新研究表明。 2月,巴黎高级大学及其同事的Geng明星针对预印型平台Arxiv发布的一项研究,其频率是一些标志性的词汇和短语,例如“探索”,如2024年底。ARY或LLM维修LLM请求或LLM维修。防止发现。随着那些带有 - 集合的人继续调整他们的技术,很难评估AI对学术文献的影响。另一个主要挑战是研究,包括Kobapos可以像确定AI工具的特定使用一样有效。该集合可以用于合理的情况,例如光滑的文本或辅助翻译,或者可能涉及更具争议性的技能,例如在没有适当管理的情况下开发大型文本细分市场。格雷说:“科学研究完整性存在真正的隐藏危险。”相关论文信息:https://dii.org/10.48550/arxiv.2406.07016