维基百科:地区词处理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文维基百科裡,地區詞处理和繁简处理是字词转换系统的两大组成部分。地區詞转换旨在为中国大陆、香港、澳门、新加坡、马来西亚、台湾的中 文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡与马来西亚(zh-sg)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地區詞为繁体(正體)中文。
地区词的全局转换
地区词的全局转换总共通过五个转换表来实现:分别是MediaWiki内置的转换表、大陆简体转换表、台湾正体转换表、港澳繁体转换表和新马简体转换表。
全局转换是最为方便快速的转换处理方式,但也较容易出现过度转换的问题。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。
对于地区词的全局转换,维基百科特别设立了一个字词转换/地区词候选的页面,在该页面中,用户可根据需求,并在符合后文中列出的先决条件的情况下,提交其希望加入全局转换的地區詞。并通过社群投票产生共识,再由管理员加入相应的转换页面中。
判断投票通过的一般依据是:在7天时间里,总共获得6名具备投票资格的维基人的支持,且反对票数不超过总票数的三分之一。
以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这样的限制,提报位置见下):
- 被转换词为单字的转换绝不能出现在全局转换中,例如“宏=>巨集”的转换;
- 提请进行全局转换的被转换词必须至少在100篇条目中出现(可通过搜索引擎以判断);
此外,被转换词字数较少(不大于三字)的转换,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。
关于汉字字频方面的研究,可参考汉字单字字频总表、现代汉语常用字表与其他的相关统计。
如果您发现了地区词的过度转换错误,请前往Wikipedia:字词全局转换修复请求提报。
地區詞的全文转换
全文转换适用于特定的单个条目,有极强的针对性。
“-{A|转换内容}-”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利于进行维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“{{NoteTA}}
”的模版,并依照该模版页面的说明输入转换内容即可。
由于全文转换的针对性极强,所以较难出现过度转换的情况。但有些情况也需要利用单独转换来实现。
地區詞的公共组转换
对于一些主题、领域相同和相似的条目,其中需要被转换的内容是大同小异的,可以把這些多个条目中要用到的共同轉換字詞單獨建立一個公共轉換組。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。
建立一個公共轉換組時,要依據這一組大多數詞彙在多個條目中被轉換的可能性,而不應依據轉換詞彙的類別。比如,各國現任領導人的姓名轉換,存在復用的可能性非常低,就不應當建立這樣類別的公共組。建立公共轉換組的方法可參見Wikipedia:字詞轉換處理/公共轉換組中。
公共组转换中的转换内容可由普通用户所控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换。一个典型的例子是“數位=>数码”的转换:对于全局转换来说,在非电脑和信息技术相关的条目中,“數位”的后侧极有可能会搭配“人士”并组成“數位人士”一词,这样便会导致“数码人士”的过度转换结果产生。然而,在电脑和信息技术的公共组转换中,所涉及到的条目大多是技术类型的条目,其中有许多本来就应该被转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。
然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也是有其局限性的。过度的地区转换可以通过繁简处理的全局转换来进行修复(详见该页面),也可以通过后文中提供的其他方式实现。
地區詞的单独转换
“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。
举例而言,在条目艾奥瓦州中,单独转换“又譯作'''-{zh:爱荷华州;zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''
”可以用于别名的展示。其展示的结果便是“又譯作爱荷华州、爱我华州或衣阿華州”。或者,使用「{{tl|各地中文名}}
」等模板,說明之間差異。
又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位→数码”转换的同时可通过“數-{}-位人士”来避免过度转换。
注意事项
手动转换的书写格式
- 概括而言:您可以只使用zh-hans与zh-hant便达到目的,也欢迎您按照推荐的格式来书写
虽然,地區詞处理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg五种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。
然而,上述的操作实际上并不完全符合于繁简转换与地區詞转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填寫繁简體對應詞,不要填寫對應地區詞。對A轉換采用哪一地區詞先到先得(即先編輯轉換的),對於T轉換,要求除繁簡之別外與標題一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。
参考文献中应避免地区词转换的情况
此外,参考文献中的文字应只进行繁简转换,而不进行地區詞转换(非中文的标题、姓名、引文等内容的中文翻譯除外)。因此,如果在参考文献中不进行避免过度转换的处理,则无论是在全局转换、主题转换还是全文转换中,都有可能会对其中的文字造成影响。为避免此类现象发生,请在引用参考文献时使用可防止地区词转换的{{cite}}系列模板。
官方中文名稱应避免地区词转换的情况
當一個機構或人物已經有官方的漢字或中文名稱時,應該按照「名從主人」的原則,不對其進行地區詞轉換。例如,朝鮮民主主義人民共和國在繁體地區一般稱為「北韓」,但是其官方國名「朝鮮民主主義人民共和國」以及執政黨「朝鮮勞動黨」 的正式名稱都包含「朝鮮」兩字,不應過度轉換成「北韓民主主義人民共和國」與「北韓勞動黨」;又,中國大陸一般稱該國為「朝鮮」,但在大韓民國一些機構,如「自由北韓放送」的官方名稱中包含「北韓」二字時,也不應該過度轉換成「自由北朝鮮放送」或「自由朝鮮放送」。又例如中國大陸的「信息」在繁體地區一般作「資訊」,但例如廣州「信息時報」就不應過度轉換成「資訊時報」。