《大河恋》
不能再任由虚假信息摧毁AI产业赖以生存的原料土壤
因发布了一篇关于“董明珠言论帖”,深圳的小程(化名)被起诉了。据报道,格力公司方面表示,董明珠并没有发表“想双休的人,拿不到高薪,更不值得培养”等言论,小程所发内容纯属捏造,且已实际引发公众对格力公司及其产品的抵制言论和负面评价,其行为已造成对格力公司名誉权的严重损害。
法院最终判决,小程道歉并赔偿格力公司经济损失7万元。一起简单的名誉权纠纷案,事实和判决并无多少异议,但此案中的一个关键细节,却仍有警示意义。
据报道,小程表示,“在引用信息时,通过权威信息检索工具、最新一代顶尖大模型人工智能核实来源”,自认为已尽到普通公众的合理注意义务。若此说属实,亦即,其引用的都是网络公开信息,且通过AI核实信源,但还是不慎引用了错误信息。
将真假判断交由AI,当然是人工智能崇拜下的AI迷思所致。AI若得善用,必会是提效助手,但使用者若是本末倒置,放弃独立思考,丧失主观能动性,彻底依赖AI,极易带来灾难性后果。
特别是在AI训练、使用若不规范的语境下,必须警惕“数据投毒”带来的信息污染。国家安全部5日发布安全提示文章称,人工智能的训练数据存在良莠不齐的问题,其中不乏虚假信息、虚构内容和偏见性观点。当训练数据集中仅有0.01%的虚假文本时,模型输出的有害内容会增加11.2%;即使是0.001%的虚假文本,其有害输出也会相应上升7.2%。
可见,训练数据一旦虚假或虚构,其将会影响AI的判断与创造,造成递归污染,形成具有延续性的“污染遗留效应”,并传导至终端使用场景。换言之,用虚假数据训练AI,这种现象就像生物界近亲繁殖导致基因缺陷一样,数据近亲繁殖同样会造成模型性能退化,加剧AI“幻觉”。而为这种认知幻觉买单的,无疑是普通使用者。
涉企谣言泛滥,治理还需各方协同合作。具体而言,技术方面,加强末端清洗,定期修复受污数据;政策方面,强化源头治理,实现对于模型、设备、人员的精准溯源和治理;执法层面,加强应急处置和反制机制,集中清理相关违法不良信息,处置处罚违规账号、MCN机构和相关平台。
说到底,不能再任由虚假信息摧毁AI产业赖以生存的原料土壤。AI时代,保留一块非污染的保护区,留下干净的“人类语料”已迫在眉睫。
成都商报-红星新闻特约评论员 李晓亮 【编辑:刘阳禾】

在这些发现的基础上,2018年,探源工程专家组将文明标准定为四条:生产力方面,农业和手工业有相当程度发展;社会明显分化;出现作为政治、经济、文化中心的城市;出现王权。后来,国内学者又陆续提出一些看法,但国家、城市、王权、阶级分化这几个要素重合率颇高。《大河恋》 2002年春天启动的中华文明探源工程,由中国社科院考古所和北京大学考古文博学院牵头,联合20个学科、400多位学者,对中华文明起源阶段进行详细研究。这项工程以浙江良渚、山西陶寺、陕西石峁和河南二里头四个都邑性遗址,以及黄河、长江和辽河流域的中心性遗址为重点,得出了中华文明起源、形成和早期发展的大脉络。探源研究中,一个根本性的问题难以绕开:到底什么是文明?