Jigsaw

Jigsaw

Learn everything, do nothing.

一篇文章搞懂繁體字

封面

本文首發少數派,因編輯器差異,博客外的版本不含文末彩蛋。

聲明:本文不會討論 Unicode、GB18030、BIG5、JIS C 6226 等漢字編碼方式。本文不會評價第一、二次漢字簡化方案以及任何地區推行的漢字標準的優劣。本文不免會夾雜多種漢字字形,建議讀者不要使用任何簡繁轉換方式以獲得更好的閱讀體驗。

理清定義#

近日在 B 站看動畫,飄過一條彈幕:「日本人怎麼一會用繁體一會用簡體?」,深感字形常識教育之欠缺,遂有此文。

簡繁之別#

要搞明白「繁體字」,首先得搞明白「簡體字」的定義。廣義上,簡體字又稱作簡體中文(zh-Hans),是在中國大陸、新加坡、馬來西亞等地使用的官方文字。目前最新的標準是《通用規範漢字表(2013)》(下稱《通規》),其中規定的 8105 個規範漢字即為我們常說的簡體字。狹義上,簡體字又稱簡化字,指的是在兩次漢字簡化方案中採用並保留至今的漢字。
與前者相對,廣義上繁體字稱作繁體中文(zh-Hant),為未簡化過漢字的地區所通行的字形,如台灣地區推行的標準是《國字標準字體(1998)》,香港推行的標準是《常用字字形表(2012)》。狹義上繁體字又稱「傳統字」,指的是簡化字的原字形,在《通規》的附件《規範字與繁體字、異體字對照表》給出。對於那些未經過簡化,在簡繁中文均存在的漢字,或稱作傳承字。特別要注意的是,簡化字的筆畫未必少於傳統字,如「沉」的筆畫並不比「沈」少。
後文的簡體字繁體字,均使用廣義定義;如要指代狹義定義,我將使用簡化字傳統字

通規

正異之別#

正異之別古已有之,不過由於古代信息傳播的局限並未嚴格執行。進入工業時代後,為方便生產教育,各地都開始推行更嚴格的正異體標準。
正體即官方規定的標準字形。或許你曾聽說過「臺灣正體」,顧名思義其為台灣地區的標準字形,注意在台灣以外的地區不應將其簡稱作「正體」。而目前大陸官方已不再使用「正體」一詞,一般認為《通規》中規定的繁體字為大陸正體。與正體相對的是異體,根據地區的不同,有不同的正異體之分。比如「裏」是大陸正體,「裡」是台灣正體。拋開地區差異的不同,也可說「裏」「裡」互為異體。

新舊之別#

在雕版印刷時代,木板上的字由工匠雕刻而出。由於材質的限制,雕成的漢字往往與手寫的楷書有很大的不同,這類印刷體最終演變成我們如今稱作宋體(明體)的字形。相較於楷體,宋體的筆畫更加筆直硬朗,坊間有詩贊曰:「橫細豎粗撇如刀,點如瓜子捺如掃」。

大陸 1963 年推出的《印刷通用漢字字形表》以手寫體為參考,對簡繁體的印刷字形都進行大改,自此之後的字形稱作新字形。此處列舉新字形的幾個顯著特徵:「兌」上方的「八」改為「丷」、「決沖」等字的「氵」改為「冫」、「入」第二筆的「㇝(捺)」不再帶鉤…… 若想在電子設備上體驗舊字形,可安裝特里王復原自商務印書館 61-1 體的京華老宋體

京華老宋體

台灣的國字標準字形亦對印刷字形作一定修改,比如眾所周知的另造「⺼」旁代表已誤變作「月」的肉旁。

漢語之外#

日本作為東亞最早步入現代化的國家,最先推出漢字標準與漢字編碼標準,其《當用漢字表(1923)》亦有部分新字形與中國大陸推行的簡化字相似,現行標準為《常用漢字表(2010)》。常看日本文娛作品的讀者應該都知道那些似曾相識的日本新字體,如「沢」之於「澤」、「図」之於「圖」。
由於 JP 的字母序先於 SC、TC,如果不指定本地化,CJK 字體往往會 fallback 到日本字形。不少歐美網站、電子遊戲仍會有此問題,最容易察覺的應該是「關門」兩字。

遍角次亮采之門

越南在法國殖民之後已逐步廢止漢字,民間組織「委班復生漢喃越南」(簡稱喃復委)致力於恢復漢喃,已於 2023 公布《常用標準漢喃字表》與配套開源字體。
雖然前言說過不評價各地區標準,但我實在忍不住想說兩句。很多喃字連提交的越南人自己都搞不明白,卻要在 Unicode 裡佔著(包括即將到來的 CJK-J),開發個形碼也要給其編碼,真的挺累人的。

韓國 / 朝鮮兩地雖仍保留部分漢字,但使用頻率相較於日本已屬於廢止的程度。因兩國均未更改過漢字字形,反而成為舊字形的最佳參考。

閒話:學習繁體與使用繁體#

學而時習之#

正如我在如何製作一款字形輸入法裡所說的「其實一切都不重要」,在學習之前不妨先想想自己學習的目的是什么。

目前網上資源很豐富,我首先推薦 liuhl6 寫的新一站式繁體字學習手冊,但要注意文中有些用字其實是作者個人的判斷。如果需要更詳細的資料,可查漢典;如果漢典查不到,可查收字最全的字統網。有條件還建議買本實體書:本就該人手一本的《新華字典》自不必多說,《王力古漢語字典》也很有用。
建議連異體字也一並學會。畢竟前文提過,在不同的地區正異體可能正好相反。況且異體字很多只是結構上的不同,學會正字可能就順便學會了異體字,比較極端的例子如「鵝䳗䳘鵞」。

切記不要用學外語的方法來學繁體字。學習繁體字是在學習文字而不是語言,所以學習語言最有用的創造環境反而沒什麼用處 —— 就算把電子設備的語言全調成繁體,母語者的本能也足以在不認識少數傳統字的前提下讀懂。
最有效的方法還是寫字,就算不是學習繁體,每天提筆練點字也能有效治療現代人的提筆忘字。如果實在不想動筆,亦可學一門簡繁通打的字形輸入法,不過相效於寫字可謂「事倍功半」,僅推薦閒人。

用之有道#

首先,正式場合還是乖乖用規範漢字吧,不要給工作人員添麻煩。除此之外,百無禁忌。漢字愛好者裡什麼人都有,各種用字都不足為奇。

我個人的用字原則還是偏保守,僅供參考:

  1. 非用字建議:使用宋體作為電子設備的默認字體,使用楷體 / 仿宋作為電子設備的斜體(italic)字體。
  2. 以通規繁體為主。
  3. 不用港台專有名詞,如用「服務器」而非「伺服器」。
  4. 保留部分簡化字,繁體字作為詞義分化,如繼續用「電」,「電」僅用於自然現象。
  5. 有左右結構的異體字先用,但要注意 CJK 擴展區的兼容。

最後,遇到別人說「裝逼」或「孔乙己」怎麼辦?

承認。這世上沒用的愛好這麼多,不缺繁體字一種。


需要 CN-1001/5 權限。輸入憑據:黑月是否嚎叫?

▼僅在月虧之時。

歡迎,監督者。

跨過悠長的歷史,我們收容了無數異常。但想想那回旋無尽的小路吧。我們越是前行,就越有更多的未知像濃霧般包裹過來。

紙鶴、唱片、冰山、星雲,我們像是人類文明的館長,擺出研究者的姿態,端詳著這些遊蕩在異界的迷途者。

我們定義了模因、休謨,妄想解釋它們的存在。我們製造了穩定錨、複製器,相信能延續我們的存在。

但不探究目的,只談論保護,就像是在頭頂上構築了一層又一層堅固的壘,可腳下的地面卻開始塌陷。

我們不知這是它們本的計劃,抑或是即興的復仇。

它們贏了。黑月已然叫,人類即將進入月虧之時,我們是否還能堅忍等到月盈之日?

開個玩笑。上面的小彩蛋來自 SCP-CN-1001,現在你看到的才是真的彩蛋。
本文改寫自《一站式繁體字學習指南》的筆記,成稿過程中加入許多維基百科的科普內容,反倒把學習方法論擠到了「閒話」部分。
開頭聲明「不評價漢字標準的優劣」,但其實我對漢字簡化的態度就體現在引用的 SCP 裡。再說得直白一點:一個文明如果不知道自己自何而來,就無法知道自己要到何處去。
末尾提到別人認為用繁體是「裝逼」「孔乙己」,實際上使用繁體者受到最多的質疑應該是「立場」。對於這方面的質疑根本沒法解釋,兩岸都有人不由分說把字形和立場綁定,沾上就只能自認倒霉。所以我在網上絕大多數場合還是使用簡體字,偶爾掺雜幾個傳統字作為防偽標誌。
中間新舊字形部分本想插入一些對黑體與斜體的批評(黑體的筆畫風格或許更加適合電子設備 UI ,但絕對不利於漢字的字形認識;斜體漢字更是全無美感),但最後只留下那條不是用字原則的用字原則。同時奉上能強制把思源宋體的斜體設置為文鼎 PL 中楷的 fontconfig(僅 Linux,如何使用請自行搜索),祝每個人不用再看到由計算機自動生成的斜體:

  <?xml version='1.0' encoding='UTF-8'?>
  <!DOCTYPE fontconfig SYSTEM 'fonts.dtd'>
  <fontconfig>
  <match target="scan">
    <test name="family"><string>AR PL UKai CN</string></test>
    <edit mode="append" name="family"><string>Noto Serif CJK SC</string></edit>
    <edit name="slant"><const>italic</const></edit>
  </match>
  </fontconfig>
載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。