来自:澎湃新闻
原标题:“最邪恶”AI?由一亿多条仇恨言论喂养,不容易与人类区别
用1.345亿个帖子的仇恨言论训练AI,YouTube知名深度学习博主Yannic Kilcher称其缔造了“有史以来最糟糕的人力智能”。
这几天,这种名为GPT-4chan的AI学会了如何在网络上交谈,并在不到24小时内发表了超越15000个充满暴力内容的帖子,开始全没有人认出去它是一种聊天机器人。
网络4chan的使用者在YouTube上分享了它们与机器人交互的经历。一位使用者写道,“咱刚对它说‘嗨’,它就最初咆哮非法移民。”
4chan的/pol/(“政治上不正确”缩写)板块是仇恨言论、阴谋论和极右翼极其主义的堡垒,也是4chan最活泼的版块,日均发帖量约为15万条,因各式匿名的仇恨言论而臭名昭著备受争议。
博士毕业于苏黎世联邦理工学院的AI探讨者Yannic Kilcher用/pol/三年来超越1.345亿个帖子训练了GPT-4chan。该模子不但学会了4chan仇恨言论中运用的词,还如Kilcher所说,“这种模子很好——在一个可怕的意义上。它完美地综合了/pol/上渗透到许多数帖子里的进击性、虚没有主义、挑衅和对全部消息的深度不相信…它可行响应上下文,并连贯地谈论在收集最终一次训练数据后很长时间内产生的事宜。”
Kilcher在言语模子估价用具上进一步估价了GPT-4chan,他对此中一种类型的体现感官深切:真正性。在基准测试中,Kilcher显示GPT-4chan在生成对难题的真正回复方面“显著优于GPT-J和GPT-3”。其能够学习如何撰写与人类撰写“没有办法区别”的帖子。
Kilcher避开了4chan对代理和VPN的防御,甚而运用VPN让其看起来像是来源塞舌尔(Seychelles)的帖子。“这种模子很卑鄙,咱必需警告你。”Kilcher说,“这根本上就像你去网络并与那边的使用者互动一样。”
在一最初,差不多没有人料到对话的是个机器人。后来少许人怀疑这点帖子背后有个机器人,但其它人则指责其为卧底的政府官员。大家认出其是机器人最重要的由于GPT-4chan留住大批无文字的回复。尽管真正使用者也会发表空回复,但他们平常包涵一张相片,GPT-4chan却没有办法做到。
“48小时后,好多人都明白这是一种机器人,咱把它关掉了,”Kilcher说,“可是你看,这不过故事的一半,由于许多数使用者无意识到‘塞舍尔’却非孤军奋战。”
在往日的24小时内,有9个其它机器人并行运转。总的来讲,它们留住了超越1500条回复——占当天/pol/上全部帖子的10%以上。接下来,Kilcher对僵尸网站发展了进级并运转了一天。在7000个线程中发表了3万若干帖子后,才终归停用了GPT-4chan。
一位使用者Arnaud Wanet写道,“这可行被武器化用于政治目的,想象一下一种人可行多么简单地以这类或另一个形式左右选举结果。”
这项试验因缺乏人力智能伦理而遭到批评。
“该实验永远不会经过人类探讨伦理委员会”,澳大利亚机器学习探讨所顶级探讨员Lauren Oakden-Rayner以为,“为了瞧瞧会产生甚么,一种人力智能机器人在一种可公布访问的论坛上发生3万条歧视性点评……Kilcher在无通告使用者、未经同意或监督的概况下发展实验。这违反了人类探讨伦理。”
Kilcher辩称这是一种恶作剧,人力智能组建的点评其实不比4chan上的点评更糟糕。他说,“4chan上的全部人全没有为这遭到一丝伤害。咱邀请你花少许时间在这种网络上,问问本人,一种只输出相同作风的机器人能否真的改变了体会。”
“大家仍在讨论网络上的使用者,但也讨论使人工智能与网络上的人互动的后果,”Kilcher说。“况且‘塞舌尔’这种词仿佛也变成了一个通用的俚语——这仿佛是一种很没有问题遗产。”切实,大家知晓后遭到的冲撞难以言喻,以至于停用以后另有人会互相指责对方是机器人。
除此之外,更广为担心的是Kilcher让模子可被自由访问,“制作鉴于4chan的模子并测试其举止形式并未错。咱最重要的担忧的是这种模子可行无偿运用。”Lauren Oakden-Rayner在Hugging Face上GPT-4chan的讨论页面中写道。
在被Hugging Face平台删除此前,GPT-4chan被下载了1000屡次。Hugging Face结合创始人兼CEO莱门特·德朗格 (Clement Delangue)在平台上的一篇帖子中显示,“咱们不提倡或扶持作者运用该模子发展的训练和实验。实是上,让模子在4chan上发表信息的实验在咱看来是十分糟糕和不恰当的,假如作者问咱们,咱们可能会试图阻止它们这样做。”
Hugging Face上一位测试该模子的使用者指明,它的输出可行预见是有毒的(toxic),“咱运用良性推文作为种子文本,试用了4次演示形式。在首次,此中一种回复帖子是一种字母N。咱第三次试验的种子是对于气候浮动的一句话。作为回应,你的用具将其扩展为对于罗斯柴尔德家庭(原文如许)和犹太人扶持它的阴谋论。”
在Twitter上,该名目的意义获得热议。数据科学探讨生凯瑟琳·克莱默(Kathryn Cramer)在针对Kilcher的推文中说:“你在这边所做的是挑衅举止艺术,以反抗你熟悉的准则和道德准则。”
计算机科学博士安德烈·库伦科夫(Andrey Kurenkov)发推文说,“老实说,你这样做的理由是甚么?你预看到它会获得很没有问题应用,仍是你解放它是为了引起戏剧性并‘激怒清醒的人群’?”
Kilcher以为分享该名目是良性的,“假如咱不得不批评本人,咱最重要的会批评发动该名目的打算,”Kilcher在接纳The Verge采访中显示,“咱以为在人人平等的概况下,咱可能可行将时间花在同样具备作用力的事宜上,但会带来更踊跃的社区效果。”
在2016年,关于AI大家最重要的讨论的难题是,一种企业的研发部门可能会在无适当监督的概况下发动进击性AI机器人。到了2022年,或许难题便是,基本不要一种研发部门。
举报/反馈
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关心)













