維基百科:地區詞處理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文維基百科裏,地區詞處理和繁簡處理是字詞轉換系統的兩大組成部分。地區詞轉換旨在為中國大陸、香港、澳門、新加坡、馬來西亞、台灣的中 文用戶提供貼近其語言習慣的轉換模式。其中,中國大陸(zh-cn)、新加坡與馬來西亞(zh-sg)的地區詞為簡體中文;台灣(zh-tw)、香港(zh-hk)與澳門(zh-mo)的地區詞為繁體(正體)中文。
地區詞的全局轉換
地區詞的全局轉換總共通過五個轉換表來實現:分別是MediaWiki內置的轉換表、大陸簡體轉換表、台灣正體轉換表、港澳繁體轉換表和新馬簡體轉換表。
全局轉換是最為方便快速的轉換處理方式,但也較容易出現過度轉換的問題。為了避免過度轉換造成的錯誤,除了穩定和使用廣泛的地區對應詞彙(判定依據見下方的先決條件),維基百科一般不接受其他情況的全局地區轉換。
對於地區詞的全局轉換,維基百科特別設立了一個字詞轉換/地區詞候選的頁面,在該頁面中,用戶可根據需求,並在符合後文中列出的先決條件的情況下,提交其希望加入全局轉換的地區詞。並通過社群投票產生共識,再由管理員加入相應的轉換頁面中。
判斷投票通過的一般依據是:在7天時間裏,總共獲得6名具備投票資格的維基人的支持,且反對票數不超過總票數的三分之一。
以下為提請加入全局地區詞轉換的先決條件(申請刪除全局地區詞轉換沒有這樣的限制,提報位置見下):
- 被轉換詞為單字的轉換絕不能出現在全局轉換中,例如「宏=>巨集」的轉換;
- 提請進行全局轉換的被轉換詞必須至少在100篇條目中出現(可通過搜尋引擎以判斷);
此外,被轉換詞字數較少(不大於三字)的轉換,社群在投票過程中還應考慮其中漢字的字頻,以及可能導致過度轉換的可能性。
關於漢字字頻方面的研究,可參考漢字單字字頻總表、現代漢語常用字表與其他的相關統計。
如果您發現了地區詞的過度轉換錯誤,請前往Wikipedia:字詞全局轉換修復請求提報。
地區詞的全文轉換
全文轉換適用於特定的單個條目,有極強的針對性。
「-{A|轉換內容}-」是全文轉換的原始碼實現,但這一方式實現的全文轉換往往會導致轉換代碼與條目正文的代碼混淆不清,不利於進行維護。因此,維基百科推薦內嵌全文轉換的{{NoteTA}}模版來作為實現全文轉換的方式。要使用這一模版實現該功能,只需在特定條目原始碼的頂端插入「{{NoteTA}}
」的模版,並依照該模版頁面的說明輸入轉換內容即可。
由於全文轉換的針對性極強,所以較難出現過度轉換的情況。但有些情況也需要利用單獨轉換來實現。
地區詞的公共組轉換
對於一些主題、領域相同和相似的條目,其中需要被轉換的內容是大同小異的,可以把這些多個條目中要用到的共同轉換字詞單獨建立一個公共轉換組。公共轉換組的方便程度處於全局轉換與全文轉換之間,而過度轉換程度也處於這兩者之間。
建立一個公共轉換組時,要依據這一組大多數詞彙在多個條目中被轉換的可能性,而不應依據轉換詞彙的類別。比如,各國現任領導人的姓名轉換,存在復用的可能性非常低,就不應當建立這樣類別的公共組。建立公共轉換組的方法可參見Wikipedia:字詞轉換處理/公共轉換組中。
公共組轉換中的轉換內容可由普通用戶所控制,而它所影響到的範圍也沒有全局轉換這麼大。公共組轉換甚至可以用來填補在全局轉換中受限制的二字轉換。一個典型的例子是「數位=>数码」的轉換:對於全局轉換來說,在非電腦和信息技術相關的條目中,「數位」的後側極有可能會搭配「人士」並組成「數位人士」一詞,這樣便會導致「数码人士」的過度轉換結果產生。然而,在電腦和信息技術的公共組轉換中,所涉及到的條目大多是技術類型的條目,其中有許多本來就應該被轉換的「數位」詞語,同時,技術性的內容也導致「數位人士」的用法幾乎不會出現。
然而,也正如上述所說,假如真的碰巧出現了「數位人士」,公共組轉換也是有其局限性的。過度的地區轉換可以通過繁簡處理的全局轉換來進行修復(詳見該頁面),也可以通過後文中提供的其他方式實現。
地區詞的單獨轉換
「-{轉換內容}-」或「避免過度-{}-轉換內容」是單獨轉換的原始碼實現。單獨轉換可以用於避免特定的過度轉換,或者實現其他的一些特殊功能。
舉例而言,在條目艾奧瓦州中,單獨轉換「又譯作'''-{zh:爱荷华州;zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''
」可以用於別名的展示。其展示的結果便是「又譯作愛荷華州、愛我華州或衣阿華州」。或者,使用「{{tl|各地中文名}}
」等模板,說明之間差異。
又舉例說明避免特定的過度轉換:上文所述的「數位人士」,在存在「數位→数码」轉換的同時可通過「數-{}-位人士」來避免過度轉換。
注意事項
手動轉換的書寫格式
- 概括而言:您可以只使用zh-hans與zh-hant便達到目的,也歡迎您按照推薦的格式來書寫
雖然,地區詞處理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg五種模式,但出於方便實際操作的原因,並不強制要求按照何種方式填寫,只要填寫的轉換能夠滿足預期的要求,並在各種模式下都不出現錯誤即可。
然而,上述的操作實際上並不完全符合於繁簡轉換與地區詞轉換分立的思想。因此,這裏還推薦另一種做法,即讓zh-hans、zh-hant的名稱保持一致,只填寫繁簡體對應詞,不要填寫對應地區詞。對A轉換採用哪一地區詞先到先得(即先編輯轉換的),對於T轉換,要求除繁簡之別外與標題一致。這一做法並不要求所有的編者都要掌握,因此不會對第一種簡便做法填寫造成任何妨礙,了解第二種做法的編者會逐漸地將第一種做法修正。
參考文獻中應避免地區詞轉換的情況
此外,參考文獻中的文字應只進行繁簡轉換,而不進行地區詞轉換(非中文的標題、姓名、引文等內容的中文翻譯除外)。因此,如果在參考文獻中不進行避免過度轉換的處理,則無論是在全局轉換、主題轉換還是全文轉換中,都有可能會對其中的文字造成影響。為避免此類現象發生,請在引用參考文獻時使用可防止地區詞轉換的{{cite}}系列模板。
官方中文名稱應避免地區詞轉換的情況
當一個機構或人物已經有官方的漢字或中文名稱時,應該按照「名從主人」的原則,不對其進行地區詞轉換。例如,朝鮮民主主義人民共和國在繁體地區一般稱為「北韓」,但是其官方國名「朝鮮民主主義人民共和國」以及執政黨「朝鮮勞動黨」 的正式名稱都包含「朝鮮」兩字,不應過度轉換成「北韓民主主義人民共和國」與「北韓勞動黨」;又,中國大陸一般稱該國為「朝鮮」,但在大韓民國一些機構,如「自由北韓放送」的官方名稱中包含「北韓」二字時,也不應該過度轉換成「自由北朝鮮放送」或「自由朝鮮放送」。又例如中國大陸的「信息」在繁體地區一般作「資訊」,但例如廣州「信息時報」就不應過度轉換成「資訊時報」。