跳转到内容

關鍵詞過濾:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
摘掉{{Link Style}}:共1个跨语言链接
标签移除Link style模板
影响:​ 以免例子被轉換
 
(未显示24个用户的32个中间版本)
第1行: 第1行:
{{Multiple issues|
{{Refimprove |time=2011-05-12T14:41:16+00:00 }}
{{Refimprove|time=2020-02-16T10:40:03+00:00}}
{{Globalize|time=2020-08-13T03:59:14+00:00}}
}}
{{noteTA
{{noteTA
|G1=IT
|G1=IT
}}{{审查制度}}
}}
'''关键词过滤''',也稱'''關鍵字過濾''',指[[网络]]应用中,对传输-{zh-tw:訊息;zh-cn:信息;}-进行预先的程序过滤、嗅探指定的关键字词,并进行智能识别,检查网络中是否有违反指定策略的行为。类似于[[IDS]]的过滤管理,这种过滤机制是主动的,通常对包含关键词的信息进行阻断连接、取消或延后显示、替换、人工干预等处理。
'''关键词过滤''',也稱'''關鍵字過濾''',指[[网络]]应用中,对传输-{zh-tw:訊息;zh-cn:信息;}-进行预先的程序过滤、嗅探指定的关键字词,并进行智能识别,检查网络中是否有违反指定策略的行为。类似于[[入侵检测系统]]的过滤管理,这种过滤机制是主动的,通常对包含关键词的信息进行阻断连接、取消或延后显示、替换、人工干预等处理。


关键词过滤的主要布置在路由器、应用服务器、终端软件上,对应的应用场合主要有网络访问、论坛、网志、即时通讯、电子邮件等。
关键词过滤的主要布置在路由器、应用服务器、终端软件上,对应的应用场合主要有网络访问、论坛、网志、即时通讯、电子邮件等。


== 路由器关键词过滤 ==
== 路由器关键词过滤 ==
在[[路由器]]、[[网关]]、[[防火墙]]中设置关键词过滤,对URL、数据包进行酌别。可用于对内部网对外通讯进约束,也可用于[[互联网]]的管理。
在[[路由器]]、[[网关]]、[[防火墙]]中设置关键词过滤,对URL、数据包进行酌别。可用于对内部网对外通讯进约束,也可用于[[互联网]]的管理。


对于[[HTTP]]等应用层协议,[[防火长城]]使用[[深度包检测]]技术实现关键字过滤。
最著名的路由器级关键词过滤系统可能是[[防火长城]]。


== 应用服务关键词过滤 ==
== 应用服务关键词过滤 ==
论坛、网游、新闻评论、网志等互联网应用的服务器端进行过滤,常用于对色情、暴力、宗教或其它策略要求的言论进行控制。
论坛、网游、新闻评论、网志等[[互联网]]应用的服务器端进行过滤,常用于对色情、暴力、宗教或其它策略要求的言论进行控制。


通常对关键词的信息不予显示、替换或转人工审查。
通常对关键词的信息不予显示、替换或转人工审查。
第20行: 第23行:
网络应用软件自身附带关键词列表,对指定关键词进行处理。
网络应用软件自身附带关键词列表,对指定关键词进行处理。


[[QQ]](包括QQ游戏)、[[上海维西公司|VeryCD公司]]基于官方[[eMule]]修改的[[eMule VeryCD Mod]]和[[EasyMule]](官方eMule中无关键字词过滤)、[[Skype|TOM-SKYPE]]等中国网络软件中,被很多使用这些软件的网友发现有内容几乎相同的关键字词过滤文件。
[[QQ]](包括QQ游戏)、[[上海维西公司|VeryCD公司]]基于官方[[eMule]]修改的[[eMule VeryCD Mod]]和[[EasyMule]](官方eMule中无关键字词过滤)、[[TOM-Skype]]等中国大陸网络软件中,被很多使用这些软件的网友发现有内容几乎相同的关键字词过滤文件。{{fact}}


在2006年,黑客发现 eMule VeryCD Mod 有一个关键词过滤文件。<ref name="censor">位于其目录下的[[關鍵詞過濾|审查字符]]文件</ref>
在2006年,黑客发现 eMule VeryCD Mod 有一个关键词过滤文件。<ref name="censor">位于其目录下的[[關鍵詞過濾|审查字符]]文件</ref>


同年,有中国[[黑客]]发现QQ有一套过滤词汇表,是QQ游戏目录下的COMToolKit.dll,<ref>[http://chinadigitaltimes.net/2004/08/the_words_you_n.php The words you never see in Chinese cyberspace :: China Digital Times]</ref><ref name="qq">[http://gbxtd.org/article.php/248 中共非法过滤QQ词列表大起底]</ref>过滤词汇内容与eMule VeryCD Mod的关键词过滤文件内容几乎相同。<ref name="qq" />这套过滤程序收录了1041个词汇,与[[性行为 (消歧义)|性]]相关的约占15%,其余基本都是与[[政治]]相关。<ref>[http://www.rfa.org/cantonese/zhuanti/redian/2005/05/23/china_internet/ 热点:大陆一千零四十一个被禁止的网络词汇--何山]</ref>由于[[中华人民共和国网络审查|中国网络审查]]缺乏对公众透明,这个关键词过滤文件是否是由中国的[[网络警察]]创作的,目前没有明确的说法。
同年,有中国大陸[[黑客]]发现QQ有一套过滤词汇表,是QQ游戏目录下的COMToolKit.dll,<ref>[http://chinadigitaltimes.net/2004/08/the_words_you_n.php The words you never see in Chinese cyberspace :: China Digital Times] {{webarchive|url=https://web.archive.org/web/20080109061908/http://chinadigitaltimes.net/2004/08/the_words_you_n.php |date=2008-01-09 }}</ref><ref name="qq">[http://gbxtd.org/article.php/248 中共非法过滤QQ词列表大起底] {{webarchive|url=https://web.archive.org/web/20100717012256/http://gbxtd.org/article.php/248 |date=2010-07-17 }}</ref>过滤词汇内容与eMule VeryCD Mod的关键词过滤文件内容几乎相同。<ref name="qq" />这套过滤程序收录了1041个词汇,与[[人类性行为|性]]相关的约占15%,其余基本都是与[[政治]]相关。<ref>[http://www.rfa.org/cantonese/zhuanti/redian/2005/05/23/china_internet/ 热点:大陆一千零四十一个被禁止的网络词汇--何山] {{webarchive|url=https://web.archive.org/web/20051112011423/http://www.rfa.org/cantonese/zhuanti/redian/2005/05/23/china_internet/ |date=2005-11-12 }}</ref>由于[[中华人民共和国网络审查|中国大陸网络审查]]缺乏对公众透明,这个关键词过滤文件是否是由中国大陸的[[网络警察]]创作的,目前没有明确的说法。


并且,为了某些安全上面的需要,某些网页游戏(flash编写)中有一部分资源文件亦有使用as脚本编写的敏感词过滤文件(扩展名为swf),不过必须使用专门的软件对其进行反向工程才可以查看包含的敏感词。{{fact}}
==参==

*[[中華人民共和國審查辭彙列表]]
== 影响 ==
[[斯肯索普问题]],指的是整句字词里含有部分字符[[子串]]含有敏感字符(如“-{开放性交互式编辑界面}-”一词含有“性交”一词),从而被网站關鍵詞過濾。英国小镇[[斯肯索普]] (Scunthorpe) 含有英文字词 "cunt" (阴道、“屄”),1996年,当地居民称无法从[[美国在线]]注册,因故得名“斯肯索普问题”。

==参==
*[[中华人民共和国网络审查]]
*[[中华人民共和国网络审查]]
*[[防火长城]]
*[[防火长城]]
第33行: 第40行:


==参考文献==
==参考文献==
{{reflist}}
<div class="references-small">

<references />
[[Category:过分拘谨]]
</div>
[[Category:內容管制軟體]]
{{翻牆技術}}
[[Category:互联网审查]]

2024年7月26日 (五) 09:02的最新版本

关键词过滤,也稱關鍵字過濾,指网络应用中,对传输信息进行预先的程序过滤、嗅探指定的关键字词,并进行智能识别,检查网络中是否有违反指定策略的行为。类似于入侵检测系统的过滤管理,这种过滤机制是主动的,通常对包含关键词的信息进行阻断连接、取消或延后显示、替换、人工干预等处理。

关键词过滤的主要布置在路由器、应用服务器、终端软件上,对应的应用场合主要有网络访问、论坛、网志、即时通讯、电子邮件等。

路由器关键词过滤

[编辑]

路由器网关防火墙中设置关键词过滤,对URL、数据包进行酌别。可用于对内部网对外通讯进约束,也可用于互联网的管理。

对于HTTP等应用层协议,防火长城使用深度包检测技术实现关键字过滤。

应用服务关键词过滤

[编辑]

论坛、网游、新闻评论、网志等互联网应用的服务器端进行过滤,常用于对色情、暴力、宗教或其它策略要求的言论进行控制。

通常对关键词的信息不予显示、替换或转人工审查。

终端软件关键词过滤

[编辑]

网络应用软件自身附带关键词列表,对指定关键词进行处理。

QQ(包括QQ游戏)、VeryCD公司基于官方eMule修改的eMule VeryCD ModEasyMule(官方eMule中无关键字词过滤)、TOM-Skype等中国大陸网络软件中,被很多使用这些软件的网友发现有内容几乎相同的关键字词过滤文件。[來源請求]

在2006年,黑客发现 eMule VeryCD Mod 有一个关键词过滤文件。[1]

同年,有中国大陸黑客发现QQ有一套过滤词汇表,是QQ游戏目录下的COMToolKit.dll,[2][3]过滤词汇内容与eMule VeryCD Mod的关键词过滤文件内容几乎相同。[3]这套过滤程序收录了1041个词汇,与相关的约占15%,其余基本都是与政治相关。[4]由于中国大陸网络审查缺乏对公众透明,这个关键词过滤文件是否是由中国大陸的网络警察创作的,目前没有明确的说法。

并且,为了某些安全上面的需要,某些网页游戏(flash编写)中有一部分资源文件亦有使用as脚本编写的敏感词过滤文件(扩展名为swf),不过必须使用专门的软件对其进行反向工程才可以查看包含的敏感词。[來源請求]

影响

[编辑]

斯肯索普问题,指的是整句字词里含有部分字符子串含有敏感字符(如“开放性交互式编辑界面”一词含有“性交”一词),从而被网站關鍵詞過濾。英国小镇斯肯索普 (Scunthorpe) 含有英文字词 "cunt" (阴道、“屄”),1996年,当地居民称无法从美国在线注册,因故得名“斯肯索普问题”。

参見

[编辑]

参考文献

[编辑]