顯示包含「維基繁簡轉換」標籤的文章。顯示所有文章
顯示包含「維基繁簡轉換」標籤的文章。顯示所有文章

2007年12月4日星期二

分久必合 合久必分

首先,我這個Blog已被正式納入中文Planet Wikimedia的一員了。Planet Wikimedia是維基媒體計劃參與者於其網誌中發表Wiki相關文章内容的聚合。中文版本剛剛啟動,內容貢獻者暫時不多,希望日後有更多同類的Blog能夠加入。

加入了Planet Wikimedia後,這個Blog的文章的曝光率也自然大為提高。不過我有兩點聲明:第一,這個Blog是不定期更新的,最頻密每天可以多於一篇,也可 以整個月也沒有一篇;第二,這個Blog本來的設計是以香港人為主要對象,因此本Blog的文章會較為從香港的觀點角度出發,希望非香港人的讀者不要介意。

最近香港有兩件大事。第一是2007年香港立法會港島選區補選,我也盡了自己的公民責任。在維基媒體上,值得欣慰的,除了是中文維基百科對其條目及八名候選人的條目均受到關注外,就連中文維基新聞也有數篇相關報道,為缺少香港新聞的中文維基新聞增添幾分色彩。第二件大事是兩鐵合併,對我的影響也只是車費減少少(但九鐵學生仍無優惠),以及手頭上的地鐵公司股 票改了名而已。但對於中文維基百科,影響頗為巨大,因為有極大量的條目需要作出相應改動。在此衷心多謝每位協作進行修改的香港維基人。最令我感慨的是,初 時我極力爭取將地鐵及九鐵的同名車站分開條目介紹,當時幸獲社群認同;然而到了今時今日,分開的條目終歸合併,真是風水輪流轉了。

香港的地鐵和九鐵合併成港鐵,中文維基百科這邊廂正在搞分拆,搞的就是繁簡字詞跟地區用詞的分拆。中文維基百科以往分為四個轉換:中國大陸簡體台灣正體港澳繁體新馬簡體,但部份人認為繁體和簡體無分地區,加上現時的轉換也十分混亂,有些詞語會錯誤轉換。新系統新增了繁體(正體)和簡體, 繁簡字詞的轉換與地區用詞的轉換分家了。這個改變,尤其對港澳繁體使用者有利。以往的港澳繁體,是要先經過台灣正體才轉換的,實際情況下也出現了台灣用語 出現在港澳繁體的錯誤。全新的港澳繁體,只是經過繁體轉換,把簡體轉成繁體,再執行港澳用詞轉換,途中不用經過台灣正體,減少出錯的機會。不過,短期內各 轉換表需要大幅重新整理,相信短期內港澳繁體的出錯仍需等待一段時間才可全面解決。但無論如何,繁簡轉換的安排能夠有這樣的突破,總算是中文維基百科的一 個里程碑。

2007年6月15日星期五

塞拉利昂郊野公園

獅子山

當你看到「塞拉利昂郊野公園」時,有甚麼感覺?也許你認為那個稱為塞拉利昂非洲國家也有郊野公園?當你又看到「麥理浩徑經過塞拉利昂」時,會否更加驚訝?是塞拉利昂也有麥理浩徑?還是香港真的有塞拉利昂呢?對!香港真的有「塞拉利昂」,中文維基百科曾幾何時有這樣的記載:「香港的塞拉利昂,是於九龍九龍塘新界沙田大圍之間的一座山峰......」沒有甚麼「謎」了,謎團已被解開:「塞拉利昂」者,「獅子山」也。

背後原因是甚麼呢?便要先從塞拉利昂的國名Sierra Leone說起。這個國名本身是葡語,直譯成中文就是「獅子」的意思,也是中華民國政府及台灣坊間對該國所使用的譯名,而香港和中國大陸則使用音譯「塞拉利昂」。而中文維基百科為了照顧兩岸四地中文使用者的習慣,引進了其他語言版本沒有的系統——繁簡轉換系統。問題就是出在這裡了。系統的初稿,是在「港澳繁體」的環境下,將所有使用「獅子山」的全轉換為「塞拉利昂」。但後來發現不妥,因為香港也有自己的「獅子山」,便手動取消了這個轉換。

可是,繁簡轉換系統卻時有問題,對「港澳繁體」而言更不是大故障便是小故障。在小故障時,部份字詞會自動轉為「台灣正體」,如「意大利」會轉為「義 大利」;在大壞故障時,那些手動取消更會失效,如「獅子山」會自動轉換為「塞拉利昂」。最近的一次大故障發生於今年5月,而「塞拉利昂郊野公園」便成為香港維基社群談論的焦點。今日剛留意到有發言更指,今期最新出版的某本香港電腦週刊,居然有「麥理浩徑經過塞拉利昂」與中文維基百科故障時雷同的字句,只是該文章完全沒有提及過維基。我真是想知道是哪本雜誌,知道了我也樂於在此公開。那本雜誌直抄維基百科不要緊,但沒註明來源之餘更沒有小心校對一次,以至犯了這種低級錯誤,真是「抵死」。

遲些假如我有時間,我會在另文探討中文維基百科的繁簡轉換系統。

 
本站最佳瀏覽解像度為 1024 x 768 或以上。

Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Hong Kong License 本站所有文章均以
共享創意 署名-非商業性-禁止衍生 3.0 授權條款釋出。