研究:中共网络审查能影响人工智能准确度

较早时谷歌翻译被揭发在翻译一些有关中国的字句时出现错误,一项最新研究可能解释到个中原委。该研究表明,包括中共在内的政府审查制度可以影响人工智能运算。该研究指出,人工智能运算法可能学习了备受审查的单词和短句,从而影响翻译程式的用语。 

据美国科技资讯网站《有线》(Wired)报道,加州大学圣地亚哥分校的政治学教授玛格丽特·罗伯茨(Margaret Roberts)和博士生Eddie Yang研究了经过两种来源训练的人工智能语言运算:其研究对象包括在中国受到屏蔽的「维基百科(Wikipedia)中文版」,以及类似维基但受到中共审查的中国网站「百度百科」。 

罗伯茨和Eddie分别用学习「维基百科」和「百度百科」的人工智能来评估新闻条目意思是属于「正面」抑或「负面」,结果表明,「维基百科」在遇到「选举」、「自由」和「民主」等字眼时,多数会评价为「正面」,而「百度百科」就会对出现「监视」、「社会监控」和「中共」字眼的条目给予较高评价。他们也发现,维基百科认为「民主」可连系「稳定」,但百度百科就认为「民主」跟「混乱」有关联。 

罗伯茨认为,研究中发现的差别可能并非完全出于政府审查,也有可能是词条撰写人本身的自我审查或他们来自不同的文化所造成。 

罗伯茨表示,重要的是,要认识到政府政策可能导致其他形式的「偏见」潜伏在人工智能系统中。罗伯茨说:「我们认为这是一个起点,我们开始去尝试理解政府授意(government-shaped)的数据如何在人工智能的学习过程中发挥作用。」 

这项研究将在3月的2021年公平性问责制和透明度会议(FAccT)上发表。 

上月有网民发现,于谷歌翻译(Google translate)输入「China breaks promise (中国违约)」,会得出「中国信守诺言」的结果;但输入「US breaks promise (美国违约)」,则会得出「美国违约」的结果。但相关错误在稍后得到修正。

转自:RFA

本文发布在 时政博览. 收藏 永久链接.

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注