央视网消息:随着AI人工智能技术和应用的蓬勃发展,各类AI工具已经成为我们日常工作和生活的助手。不过近年来,不少网民发现,部分人工智能的回答开始有些不靠谱,也就是AI数据被污染了。
今年2月6日,宁波警方注销了“宁波交警”抖音号。5月2日,在浙江宁波余姚境内,一辆未悬挂车牌的轿车在违法超车过程中撞倒一辆摩托车。当网民询问AI软件宁波交警抖音号为何注销时,人工智能给出的答案竟然是“主要与5月2日的这起交通事故引发广泛关注有关”。人工智能的这一荒唐回答引起了网民广泛关注,宁波交警随后进行了紧急辟谣。
近年来,AI杜撰的信息更是数不胜数,杜撰不存在论文、论文的作者、网址等,AI更是成为了谣言类信息的帮凶,游船侧翻、幼儿园大火等谣言都可以帮网民编造出来。
专家介绍,人工智能数据污染分为两类,一种是人为主观恶意去篡改数据,误导人工智能的输出结果,另一种是人工智能本身会海量收集网络的庞大数据,其中不良信息如果没有被甄别删除掉,而是当做可以信任的信息源加入算力中,输出的结果同样不可信任。
国家安全部数据显示,AI在训练过程中,即使是0.001%的虚假文本被采用,其有害输出也会相应上升7.2%。另外,AI数据污染还可能在金融、公共安全等领域引发一系列现实风险。
中国网络空间安全协会人工智能安全治理专业委员会委员薛智慧称:“例如在经济金融领域,一旦数据受到污染,一些市场行为分析、信用风险评估、异常交易监控等工作就可能出现判断和决策错误,进而造成直接的经济损失。而在社会舆论方面,数据污染会破坏信息的真实性,让民众难以辨别信息的真伪,这就可能会引发社会舆论风险。”
针对AI数据污染,专家表示,应加强源头监管,防范污染生成。安全机关此前针对AI数据污染也提示,要定期依据法规标准清洗修复受污数据,逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。
广大网友在日常生活和工作中,要使用正规平台和企业提供的AI工具;AI产生的结果可以参考,但不能盲信;同时不作不良信息的投喂者,共同守护网络家园。