鉴黄师要下岗了!日本人教你花式识别“小黄文”

AI不仅可以在围棋盘上打败人类,还可以……智能识别小黄文。

5月23日到5月26日,在中国棋手们努力迎战阿尔法狗的同时,日本也举办了第31届全国人工智能大会。在这次大会上,立命馆大学情报理工学科的三名研究人员发布了一篇关于AI识别小黄文的论文。

论文的主要内容是,如何利用AI来识别那些“使用隐喻手法”来表现“少儿不宜”的文章。也就是说,即使作者只是在小说里遮遮掩掩地进行了某些暗示,也会被AI给揪出来

研究人员为什么要做这种奇怪的研究我们不得而知,但使用的研究样本对同人文化、腐文化非常不友好,在日本国内也引发了激烈的争论。

论文截图

论文截图

争论的原因之一是,这篇对全年龄段读者公开发表的论文,引用了网站分级为R18的小说内容,而且还没有提前取得网站和小说作者的同意。

论文使用了pixiv网站上,2016年十月R18分类下人气最高的10篇BL同人小说。论文将这些小说作为研究样本,在“小说里有不健康内容”的前提下,来说明“AI如何识别出通过隐喻手段表达的不健康内容”。

为了说明AI的识别方法,论文里引用了不少“少儿不宜”的内容。论文作者在引用前没有取得作者或pixiv网站的授权,还私自公布了小说的题目、作者和URL地址。

pixiv是一家日本同人插画和小说网站,对内容有严格的分级制度,它有一个中文名字“插画交流网站”(而且还支持新浪微博登陆)。pixiv上分类为R18的内容只有年龄设置在18岁以上的注册用户才能查看。

pixiv

这篇论文公开发表后,所有年龄段的人都可以看到被引用的少儿不宜内容,也都可以通过论文中的URL地址找到被引用的R18小说。一些小说作者只能将被引用的小说删除或设成不公开状态。

论文中给出的小说题目和URL地址

论文中给出的小说作者和URL地址

除了会被小朋友看见,在未经网站和作者允许的情况下,使用这些小说作为研究对象在日本还存在版权问题。

被引用的小说在pixiv网站上只有注册用户能够查看,并且不对18岁以下用户公开。这样的内容是否可以被判定为“网络公开内容”加以引用和公开发表,在日本法律界还没有定论。

日本网友们的另一个争论点是,把这些有分级的小说划为不健康内容真的合适吗?

被引用的小说在pixiv网站已经被分级在R18类型下,未成年人不能阅读。研究中依然将这些小说归为“内容不健康文章”,还公布了小说作者和URL地址,一些日本网友认为这是对小说作者的诽谤,有违研究伦理。

这篇论文5月24日在大会上发表,5月25日,pixiv就公开表示:

我们已经要求发表论文者所在学校对这件事加以调查和解决,也希望大家以后能够继续安心使用P站。

AIR18003

机器的日文翻译大家随便看看就好

学校方面则表示正在着手调查这件事。这篇论文在此之前已经在日本人工智能学会的网站上发布,不过目前已经被隐藏。论文作者之一、立命馆大学助理教授山西良典在接受日本媒体采访时表示,论文确实存在一些问题,之后是否会继续发表还有待研究。

虽然这项利用AI判断隐晦小黄文的研究存在问题,但用AI来识别网络内容的研究方向实在让人不寒而栗。如果将来AI真的开始监督网上发布的内容,我们在网上说话的时候是不是要更小声了呢?

bigaibs

感到背后的寒意了吗?Big AI is watching you.

更多有趣好玩的内容 尽在品玩微信公众号
brand

PingWest品玩移动客户端