反“低俗”从互联网兴起之初就是全球努力的关注点,但是即便是现在利用灵犬反低俗等app智能软件,也只能说是在一定程度上让互联网环境较之以前大有改观,而且反低俗的同时又不可避免地杀掉一些正常“细胞”。因为低俗与否在一定程度上是很难界定的。
这里我首先从界定的角度来仔细分析一下:
话不多说上图,但需要先制作一下打上马赛克,其实这真是正常的图片,但如果不打上马赛克,估计平台会自动识别那是低俗,你也就看不到我的这篇文章了。估计有过发文体验的朋友一定会感同身受。
艺术也得这样掩盖,光马赛克无法通过,影响您的体验抱歉
机器的智能学习判断为网络反低俗提供了更大可能
为了深入了解灵犬反低俗app的发展历程,我在网络上查找了大量资料:
第一版灵犬,采用的是词向量与CNN技术。词向量是让词蕴含语义信息;CNN是卷曲神经网络的缩写,这种技术架构性能好、速度快。
第二版灵犬,用的是LSTM和 Attention技术。LSTM是“长短期记忆”的缩写,这种神经网络可以很好地对序列进行建模,对长句的识别非常好。Attention是注意力机制,可以结合词与词之间的信息,对句子有更全面的了解。
最新的版本,用的技术是Bert技术与半监督技术,Bert是当前最先进的自然语言理解技术,是这个领域进展的集大成者。Bert开展了新的更大规模的网络结构,并且使用半监督学习技术,可以利用天然的超大规模的语料库进行训练,使得对语义的刻画更精准。
灵犬运用的解决方案,不仅是“机器学习”,而且是机器“深度学习”。深度学习有三个要素:一是数据量,二是算力,三是模型。灵犬也在利用分布式训练算法以及GPU训练集群,加速模型的训练和调试,利用模型压缩技术,提升模型的预测速度。
但越来越先进的技术并不能完全取代人工鉴别。因为机器模块仅仅是判断你设定的条件,一旦有类似正常图片的介入,机器就会毫不犹豫地将其判定为“低俗”,所以人工鉴别的参与就显得极为重要了。否则就极易产生误伤的情况。不信,请看下图,让机器判断肯定是果断,但肯定会误伤。
世界名画对不起,我必须得把你涂掉,否则无法通过啊
据说Facebook 曾经因为“裸露”,误伤了一张著名的越战新闻照片,照片里一位小女孩遭到汽油弹炸伤、浑身赤裸奔跑。再比如很多塑像存在“露点”,但其实是名胜古迹;芭蕾舞蹈图片,以机器的视角来看,它很类似于裙底偷拍。
在八十年代早期,邓丽君的歌曲曾被认为是“靡靡之音”。1982年,人民音乐出版社出版了《怎样鉴别黄色歌曲》,里面就批判了邓丽君歌曲。但时至今日,邓丽君演唱的歌曲,已经成为了华语经典歌曲的一部分。
建议大家在发文前仔细检查,以免反工。