本文首發少數派,因編輯器差異,博客外的版本不含文末彩蛋。
聲明:本文不會討論 Unicode、GB18030、BIG5、JIS C 6226 等漢字編碼方式。本文不會評價第一、二次漢字簡化方案以及任何地區推行的漢字標準的優劣。本文不免會夾雜多種漢字字形,建議讀者不要使用任何簡繁轉換方式以獲得更好的閱讀體驗。
理清定義#
近日在 B 站看動畫,飄過一條彈幕:「日本人怎麼一會用繁體一會用簡體?」,深感字形常識教育之欠缺,遂有此文。
簡繁之別#
要搞明白「繁體字」,首先得搞明白「簡體字」的定義。廣義上,簡體字又稱作簡體中文(zh-Hans),是在中國大陸、新加坡、馬來西亞等地使用的官方文字。目前最新的標準是《通用規範漢字表(2013)》(下稱《通規》),其中規定的 8105 個規範漢字即為我們常說的簡體字。狹義上,簡體字又稱簡化字,指的是在兩次漢字簡化方案中採用並保留至今的漢字。
與前者相對,廣義上繁體字稱作繁體中文(zh-Hant),為未簡化過漢字的地區所通行的字形,如台灣地區推行的標準是《國字標準字體(1998)》,香港推行的標準是《常用字字形表(2012)》。狹義上繁體字又稱「傳統字」,指的是簡化字的原字形,在《通規》的附件《規範字與繁體字、異體字對照表》給出。對於那些未經過簡化,在簡繁中文均存在的漢字,或稱作傳承字。特別要注意的是,簡化字的筆畫未必少於傳統字,如「沉」的筆畫並不比「沈」少。
後文的簡體字和繁體字,均使用廣義定義;如要指代狹義定義,我將使用簡化字和傳統字。
正異之別#
正異之別古已有之,不過由於古代信息傳播的局限並未嚴格執行。進入工業時代後,為方便生產教育,各地都開始推行更嚴格的正異體標準。
正體即官方規定的標準字形。或許你曾聽說過「臺灣正體」,顧名思義其為台灣地區的標準字形,注意在台灣以外的地區不應將其簡稱作「正體」。而目前大陸官方已不再使用「正體」一詞,一般認為《通規》中規定的繁體字為大陸正體。與正體相對的是異體,根據地區的不同,有不同的正異體之分。比如「裏」是大陸正體,「裡」是台灣正體。拋開地區差異的不同,也可說「裏」「裡」互為異體。
新舊之別#
在雕版印刷時代,木板上的字由工匠雕刻而出。由於材質的限制,雕成的漢字往往與手寫的楷書有很大的不同,這類印刷體最終演變成我們如今稱作宋體(明體)的字形。相較於楷體,宋體的筆畫更加筆直硬朗,坊間有詩贊曰:「橫細豎粗撇如刀,點如瓜子捺如掃」。
大陸 1963 年推出的《印刷通用漢字字形表》以手寫體為參考,對簡繁體的印刷字形都進行大改,自此之後的字形稱作新字形。此處列舉新字形的幾個顯著特徵:「兌」上方的「八」改為「丷」、「決沖」等字的「氵」改為「冫」、「入」第二筆的「㇝(捺)」不再帶鉤…… 若想在電子設備上體驗舊字形,可安裝特里王復原自商務印書館 61-1 體的京華老宋體。
台灣的國字標準字形亦對印刷字形作一定修改,比如眾所周知的另造「⺼」旁代表已誤變作「月」的肉旁。
漢語之外#
日本作為東亞最早步入現代化的國家,最先推出漢字標準與漢字編碼標準,其《當用漢字表(1923)》亦有部分新字形與中國大陸推行的簡化字相似,現行標準為《常用漢字表(2010)》。常看日本文娛作品的讀者應該都知道那些似曾相識的日本新字體,如「沢」之於「澤」、「図」之於「圖」。
由於 JP 的字母序先於 SC、TC,如果不指定本地化,CJK 字體往往會 fallback 到日本字形。不少歐美網站、電子遊戲仍會有此問題,最容易察覺的應該是「關門」兩字。
越南在法國殖民之後已逐步廢止漢字,民間組織「委班復生漢喃越南」(簡稱喃復委)致力於恢復漢喃,已於 2023 公布《常用標準漢喃字表》與配套開源字體。
雖然前言說過不評價各地區標準,但我實在忍不住想說兩句。很多喃字連提交的越南人自己都搞不明白,卻要在 Unicode 裡佔著(包括即將到來的 CJK-J),開發個形碼也要給其編碼,真的挺累人的。
韓國 / 朝鮮兩地雖仍保留部分漢字,但使用頻率相較於日本已屬於廢止的程度。因兩國均未更改過漢字字形,反而成為舊字形的最佳參考。
閒話:學習繁體與使用繁體#
學而時習之#
正如我在如何製作一款字形輸入法裡所說的「其實一切都不重要」,在學習之前不妨先想想自己學習的目的是什么。
目前網上資源很豐富,我首先推薦 liuhl6 寫的新一站式繁體字學習手冊,但要注意文中有些用字其實是作者個人的判斷。如果需要更詳細的資料,可查漢典;如果漢典查不到,可查收字最全的字統網。有條件還建議買本實體書:本就該人手一本的《新華字典》自不必多說,《王力古漢語字典》也很有用。
建議連異體字也一並學會。畢竟前文提過,在不同的地區正異體可能正好相反。況且異體字很多只是結構上的不同,學會正字可能就順便學會了異體字,比較極端的例子如「鵝䳗䳘鵞」。
切記不要用學外語的方法來學繁體字。學習繁體字是在學習文字而不是語言,所以學習語言最有用的創造環境反而沒什麼用處 —— 就算把電子設備的語言全調成繁體,母語者的本能也足以在不認識少數傳統字的前提下讀懂。
最有效的方法還是寫字,就算不是學習繁體,每天提筆練點字也能有效治療現代人的提筆忘字。如果實在不想動筆,亦可學一門簡繁通打的字形輸入法,不過相效於寫字可謂「事倍功半」,僅推薦閒人。
用之有道#
首先,正式場合還是乖乖用規範漢字吧,不要給工作人員添麻煩。除此之外,百無禁忌。漢字愛好者裡什麼人都有,各種用字都不足為奇。
我個人的用字原則還是偏保守,僅供參考:
- 非用字建議:使用宋體作為電子設備的默認字體,使用楷體 / 仿宋作為電子設備的斜體(italic)字體。
- 以通規繁體為主。
- 不用港台專有名詞,如用「服務器」而非「伺服器」。
- 保留部分簡化字,繁體字作為詞義分化,如繼續用「電」,「電」僅用於自然現象。
- 有左右結構的異體字先用,但要注意 CJK 擴展區的兼容。
最後,遇到別人說「裝逼」或「孔乙己」怎麼辦?
承認。這世上沒用的愛好這麼多,不缺繁體字一種。
需要 CN-1001/5 權限。輸入憑據:黑月是否嚎叫?
▼僅在月虧之時。
歡迎,監督者。
跨過悠長的歷史,我們收容了無數異常。但想想那回旋無尽的小路吧。我們越是前行,就越有更多的未知像濃霧般包裹過來。
紙鶴、唱片、冰山、星雲,我們像是人類文明的館長,擺出研究者的姿態,端詳著這些遊蕩在異界的迷途者。
我們定義了模因、休謨,妄想解釋它們的存在。我們製造了穩定錨、複製器,相信能延續我們的存在。
但不探究目的,只談論保護,就像是在頭頂上構築了一層又一層堅固的保壘,可腳下的地面卻開始塌陷。
我們不知這是它們元本的計劃,抑或是即興的復仇。
它們贏了。黑月已然豪叫,人類即將進入月虧之時,我們是否還能堅忍等到月盈之日?
開個玩笑。上面的小彩蛋來自 SCP-CN-1001,現在你看到的才是真的彩蛋。
本文改寫自《一站式繁體字學習指南》的筆記,成稿過程中加入許多維基百科的科普內容,反倒把學習方法論擠到了「閒話」部分。
開頭聲明「不評價漢字標準的優劣」,但其實我對漢字簡化的態度就體現在引用的 SCP 裡。再說得直白一點:一個文明如果不知道自己自何而來,就無法知道自己要到何處去。。
末尾提到別人認為用繁體是「裝逼」「孔乙己」,實際上使用繁體者受到最多的質疑應該是「立場」。對於這方面的質疑根本沒法解釋,兩岸都有人不由分說把字形和立場綁定,沾上就只能自認倒霉。所以我在網上絕大多數場合還是使用簡體字,偶爾掺雜幾個傳統字作為防偽標誌。
中間新舊字形部分本想插入一些對黑體與斜體的批評(黑體的筆畫風格或許更加適合電子設備 UI ,但絕對不利於漢字的字形認識;斜體漢字更是全無美感),但最後只留下那條不是用字原則的用字原則。同時奉上能強制把思源宋體的斜體設置為文鼎 PL 中楷的 fontconfig(僅 Linux,如何使用請自行搜索),祝每個人不用再看到由計算機自動生成的斜體:
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE fontconfig SYSTEM 'fonts.dtd'>
<fontconfig>
<match target="scan">
<test name="family"><string>AR PL UKai CN</string></test>
<edit mode="append" name="family"><string>Noto Serif CJK SC</string></edit>
<edit name="slant"><const>italic</const></edit>
</match>
</fontconfig>