GPT:人类生成 or 机器生成?ChatGPT 引发了一场真假辩论

原文:英国《金融时报》

像ChatGPT这样的大型语言模型是合理性的提供者。许多聊天机器人基于所谓的生成式人工智能,经过训练可以通过在互联网上搜索相关信息并收集连贯的答案来回答用户的问题,从而生成令人信服的学生论文、权威的法律文件和可信的新闻报道。

但是,由于公开可用的数据包含错误信息和虚假信息,一些机器生成的文本可能不准确或不真实。这引发了人们争相开发工具来识别文本是由人还是机器起草的。科学也在努力适应这个新时代,现场讨论是否应该允许聊天机器人撰写科学论文,甚至产生新的假说。

区分人工智能和人类智能的重要性与日俱增。本月,瑞银分析师透露,ChatGPT是历史上增长最快的网络应用程序,1月份每月活跃用户达到1亿。一些部门已经决定没有必要锁住稳定的大门:周一,国际文凭组织表示,学生将被允许使用ChatGPT撰写论文,前提是他们注明引用了它。

OpenAI:GPT-4在许多标准化测试中比人类表现得更好:金色财经报道,Open-AI刚刚公布大型语言模型的最新版本——GPT-4,该版本比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。OpenAI表示,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。例如,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。 (CNBC)[2023/3/15 13:04:36]

平心而论,这项技术的创造者坦率地指出了它的局限性。OpenAI首席执行官萨姆奥特曼(SamAltman)去年12月警告说,ChatGPT“在某些方面足够出色,足以给人一种伟大的误导印象”。我们在稳健性和真实性方面还有很多工作要做。”该公司正在为其内容输出开发加密水印,这是一种机器可读的秘密标点符号、拼写和词序序列;并且正在磨练一个“分类器”来区分合成文本和人工生成的文本,使用两者的例子来训练它。

清华大学教授朱岩:区块链在改变着人类社会的组织模式:清华大学教授朱岩认为,Token的价值在于我们借助一种手段,让讲信用的人获得回报。所以,每个人都可以发行“股票”,让你的诚信、你一辈子积攒的高贵品格,能够被社会认知,并兑现其价值。如果能做到这一点,它对整个人类的组织结构的改变将会非常巨大。当人群彼此之间的信任关系、人群的规模在发生改变的时候,或将是千载难逢的人类文明的大变革。也就是说,区块链在改变着人类社会的组织模式。[2018/3/14]

斯坦福大学的研究生EricMitchell认为分类器需要大量的训练数据。他与同事一起提出了DetectGPT,这是一种发现差异的“零样本”方法,这意味着该方法不需要事先学习。相反,该方法会自行启动聊天机器人,以嗅探出自己的输出。

快的打车创始人陈伟星:区块链可以释放人类信用 打破记账货币的垄断:近日,快的打车创始人陈伟星在谈到区块链时表示,货币的本质是“信用”,就是相信自己“劳动”换来的“数字”可以换取同等价值或者更多价值的“劳动”,区块链可以释放人类信用,打破记账货币的垄断,所以以后一切都关乎“相对价格”,不怕泡沫大,只在乎泡沫不平等。信用有天生的“网络效应”,越分散越安全就越被储蓄,从而导致越高的相对价格。同时他还表示,区块链用加密算法资本化,加密是手段,资本化是目的,目前看来几乎是唯一目的。[2018/2/14]

它是这样工作的:DetectGPT询问聊天机器人它对示例文本的“喜欢”程度,“喜欢”是示例与其自己的创作有多相似的简写。DetectGPT然后更进一步——它“扰乱”了文本,稍微改变了措辞。假设是聊天机器人在“喜欢”更改后的人工生成文本方面比更改后的机器文本更具可变性。研究人员声称,在早期测试中,该方法在95%的时间内正确地区分了人类和机器作者。

需要注意的是:这些结果尚未经过同行评审;该方法虽然优于随机猜测,但在所有生成式AI模型中的工作可靠性并不相同。对合成文本进行人为调整可能会愚弄DetectGPT。

这一切对科学意味着什么?科学出版是研究的命脉,将想法、假设、论据和证据注入全球科学经典。一些人很快就将ChatGPT作为研究助理,一些有争议的论文将AI列为合著者。

Meta甚至推出了一款名为Galactica的科学专用文本生成器。三天后它被撤回了。在它被使用的这段时间,构建了一段熊在太空旅行的虚构历史。

Tübingen的马克斯普朗克智能系统研究所的迈克尔·布莱克教授当时在推特上表示,他对Galactica对有关他自己研究领域的多项询问的回答感到“困扰”,包括将虚假论文归咎于真正的研究人员。“在所有情况下,都是错误的或有偏见的,但听起来是正确和权威的。我认为这很危险。”

危险来自于看似合理的文本滑入真正的科学提交,用虚假引用充斥文献并永远歪曲经典。《科学》杂志现在完全禁止生成文本;《自然》杂志则允许使用它,前提是必须对使用进行了声明,但禁止将其列为共同作者。

话又说回来,大多数人不会查阅高端期刊来指导他们的科学思维。如果狡猾的人如此倾向,这些聊天机器人可以按需喷出大量引用伪科学,解释为什么疫苗不起作用,或者为什么全球变暖是个局。在线发布的误导性材料可能会被未来的生成人工智能吞噬,产生新的谎言迭代,进一步污染公共话语。

贩卖怀疑的商人肯定已经摩拳擦掌,迫不及待了。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

链链资讯

[0:0ms0-2:482ms