维基百科:地区词处理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文维基百科里,地区词处理和繁简处理是字词转换系统的两大组成部分。地区词转换旨在为中国大陆、香港、澳门、新加坡、马来西亚、台湾的中 文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡与马来西亚(zh-sg)的地区词为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地区词为繁体(正体)中文。
地区词的全局转换
地区词的全局转换总共通过五个转换表来实现:分别是MediaWiki内置的转换表、大陆简体转换表、台湾正体转换表、港澳繁体转换表和新马简体转换表。
全局转换是最为方便快速的转换处理方式,但也较容易出现过度转换的问题。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。
对于地区词的全局转换,维基百科特别设立了一个字词转换/地区词候选的页面,在该页面中,用户可根据需求,并在符合后文中列出的先决条件的情况下,提交其希望加入全局转换的地区词。并通过社群投票产生共识,再由管理员加入相应的转换页面中。
判断投票通过的一般依据是:在7天时间里,总共获得6名具备投票资格的维基人的支持,且反对票数不超过总票数的三分之一。
以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这样的限制,提报位置见下):
- 被转换词为单字的转换绝不能出现在全局转换中,例如“宏=>巨集”的转换;
- 提请进行全局转换的被转换词必须至少在100篇条目中出现(可通过搜索引擎以判断);
此外,被转换词字数较少(不大于三字)的转换,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。
关于汉字字频方面的研究,可参考汉字单字字频总表、现代汉语常用字表与其他的相关统计。
如果您发现了地区词的过度转换错误,请前往Wikipedia:字词全局转换修复请求提报。
地区词的全文转换
全文转换适用于特定的单个条目,有极强的针对性。
“-{A|转换内容}-”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利于进行维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“{{NoteTA}}
”的模版,并依照该模版页面的说明输入转换内容即可。
由于全文转换的针对性极强,所以较难出现过度转换的情况。但有些情况也需要利用单独转换来实现。
地区词的公共组转换
对于一些主题、领域相同和相似的条目,其中需要被转换的内容是大同小异的,可以把这些多个条目中要用到的共同转换字词单独建立一个公共转换组。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。
建立一个公共转换组时,要依据这一组大多数词汇在多个条目中被转换的可能性,而不应依据转换词汇的类别。比如,各国现任领导人的姓名转换,存在复用的可能性非常低,就不应当建立这样类别的公共组。建立公共转换组的方法可参见Wikipedia:字词转换处理/公共转换组中。
公共组转换中的转换内容可由普通用户所控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换。一个典型的例子是“數位=>数码”的转换:对于全局转换来说,在非电脑和信息技术相关的条目中,“數位”的后侧极有可能会搭配“人士”并组成“數位人士”一词,这样便会导致“数码人士”的过度转换结果产生。然而,在电脑和信息技术的公共组转换中,所涉及到的条目大多是技术类型的条目,其中有许多本来就应该被转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。
然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也是有其局限性的。过度的地区转换可以通过繁简处理的全局转换来进行修复(详见该页面),也可以通过后文中提供的其他方式实现。
地区词的单独转换
“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。
举例而言,在条目艾奥瓦州中,单独转换“又譯作'''-{zh:爱荷华州;zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''
”可以用于别名的展示。其展示的结果便是“又译作爱荷华州、爱我华州或衣阿华州”。或者,使用“{{tl|各地中文名}}
”等模板,说明之间差异。
又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位→数码”转换的同时可通过“數-{}-位人士”来避免过度转换。
注意事项
手动转换的书写格式
- 概括而言:您可以只使用zh-hans与zh-hant便达到目的,也欢迎您按照推荐的格式来书写
虽然,地区词处理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg五种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。
然而,上述的操作实际上并不完全符合于繁简转换与地区词转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填写繁简体对应词,不要填写对应地区词。对A转换采用哪一地区词先到先得(即先编辑转换的),对于T转换,要求除繁简之别外与标题一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。
参考文献中应避免地区词转换的情况
此外,参考文献中的文字应只进行繁简转换,而不进行地区词转换(非中文的标题、姓名、引文等内容的中文翻译除外)。因此,如果在参考文献中不进行避免过度转换的处理,则无论是在全局转换、主题转换还是全文转换中,都有可能会对其中的文字造成影响。为避免此类现象发生,请在引用参考文献时使用可防止地区词转换的{{cite}}系列模板。
官方中文名称应避免地区词转换的情况
当一个机构或人物已经有官方的汉字或中文名称时,应该按照“名从主人”的原则,不对其进行地区词转换。例如,朝鲜民主主义人民共和国在繁体地区一般称为“北韩”,但是其官方国名“朝鲜民主主义人民共和国”以及执政党“朝鲜劳动党” 的正式名称都包含“朝鲜”两字,不应过度转换成“北韩民主主义人民共和国”与“北韩劳动党”;又,中国大陆一般称该国为“朝鲜”,但在大韩民国一些机构,如“自由北韩放送”的官方名称中包含“北韩”二字时,也不应该过度转换成“自由北朝鲜放送”或“自由朝鲜放送”。又例如中国大陆的“信息”在繁体地区一般作“资讯”,但例如广州“信息时报”就不应过度转换成“资讯时报”。