Jigsaw

Jigsaw

Learn everything, do nothing.

一篇文章搞懂繁体字

封面

本文首发少数派,因编辑器差异,博客外的版本不含文末彩蛋。

声明:本文不会讨论 Unicode、GB18030、BIG5、JIS C 6226 等汉字编码方式。本文不会评价第一、二次汉字简化方案以及任何地区推行的汉字标准的优劣。本文不免会夹杂多种漢字字形,建议读者不要使用任何简繁转换方式以获得更好的阅读体验。

厘清定义#

近日在 B 站看动画,飘过一条弹幕:「日本人怎么一会用繁体一会用简体?」,深感字形常识教育之欠缺,遂有此文。

简繁之别#

要搞明白「繁体字」,首先得搞明白「简体字」的定义。广义上,简体字又称作简体中文(zh-Hans),是在中国大陆、新加坡、马来西亚等地使用的官方文字。目前最新的标准是《通用规范汉字表(2013)》(下称《通规》),其中规定的 8105 个规范汉字即为我们常说的简体字。狭义上,简体字又称简化字,指的是在两次汉字简化方案中采用并保留至令的汉字。
与前者相对,广义上繁体字称作繁体中文(zh-Hant),为未简化过汉字的地区所通行的字形,如台湾地区推行的标准是《國字標準字體(1998)》,香港推行的标准是《常用字字形表(2012)》。狭义上繁体字又称「传统字」,指的是简化字的原字形,在《通规》的附件《规范字与繁体字、异体字对照表》给出。对于那些未经过简化,在简繁中文均存在的汉字,或称作传承字。特别要注意的是,简化字的笔画未必少于传统字,如「沉」的笔画并不比「沈」少。
后文的简体字繁体字,均使用广义定义;如要指代狭义定义,我将使用简化字传统字

通规

正异之别#

正异之别古已有之,不过由于古代信息传播的局限并未严格执行。进入工业時代後,为方便生产教育,各地都开始推行更严格的正异体标准。
正体即官方规定的标准字形。或许你曾听说过「臺灣正體」,顾名思义其为台湾地区的标准字形,注意在台湾以外的地区不应将其简称作「正体」。而目前大陆官方已不再使用「正体」一词,一般认为《通规》中规定的繁体字为大陆正体。与正体相对的是异体,根据地区的不同,有不同的正异体之分。比如「裏」是大陆正体,「裡」是台湾正体。抛开地区差异的不同,也可说「裏」「裡」互为异体。

新旧之别#

在雕版印刷时代,木板上的字由工匠雕刻而出。由于材质的限制,雕成的汉字往往与手写的楷书有很大的不同,这类印刷体最终演变成我们如今称作宋体(明体)的字形。相较于楷体,宋体的笔画更加笔直硬朗,坊间有诗赞曰:「橫細豎粗撇如刀,點如瓜子捺如掃」。

大陆 1963 年推出的《印刷通用汉字字形表》以手写体为参考,对简繁体的印刷字形都进行大改,自此之后的字形称作新字形。此处列举新字形的几个显著特征:「兌」上方的「八」改为「丷」、「決沖」等字的「氵」改为「冫」、「入」第二笔的「㇝(捺)」不再带钩…… 若想在电子设备上体验旧字形,可安装特里王复原自商务印书馆 61-1 体的京華老宋体

京華老宋体

台湾的国字标准字形亦对印刷字形作一定修改,比如众所周知的另造「⺼」旁代表已讹变作「月」的肉旁。

汉语之外#

日本作为东亚最早步入现代化的国家,最先推出汉字标准与汉字编码标准,其《當用漢字表(1923)》亦有部分新字形与中国大陆推行的简化字相似,现行标准为《常用漢字表(2010)》。常看日本文娱作品的读者应該都知道那些似曾相识的日本新字体,如「沢」之于「澤」、「図」之于「圖」。
由于 JP 的字母序先于 SC、TC,如果不指定本地化,CJK 字体往往会 fallback 到日本字形。不少欧美网站、电子游戏仍会有此问题,最容易察觉的应该是「关门」两字。

遍角次亮采之门

越南在法国殖民之后已逐步废止汉字,民间组织「委班復生漢喃越南」(简称喃复委)致力于恢复漢喃,已于 2023 公布《常用标准汉喃字表》与配套开源字体。
虽然前言说过不评价各地区标准,但我实在忍不住想说两句。很多喃字连提交的越南人自已都搞不明白,却要在 Unicode 里占着(包括即将到来的 CJK-J),开发个形码也要给其编码,真的挺累人的。

韩国 / 朝鲜两地虽仍保留部分汉字,但使用频率相较于日本已属于废止的程度。因两国均未更改过汉字字形,反而成为旧字形的最佳参考。

闲话:学习繁体与使用繁体#

学而时习之#

正如我在如何制作一款字形输入法里所说的「其实一切都不重要」,在学习之前不妨先想想自己学习的目的是什么。

目前网上资源很丰富,我首先推荐 liuhl6 写的新一站式繁体字学习手册,但要注意文中有些用字其实是作者个人的判断。如果需要更详细的资料,可查漢典;如果汉典查不到,可查收字最全的字统网。有条件还建议买本实体书:本就该人手一本的《新华字典》自不必多说,《王力古漢語字典》也很有用。
建议连异体字也一并学会。毕竟前文提过,在不同的地区正异体可能正好相反。况且异体字很多只是结构上的不同,学会正字可能就顺便学会了异体字,比较极端的例子如「鵝䳗䳘鵞」。

切记不要用学外语的方法来学繁体字。学习繁体字是在学习文字而不是语言,所以学习语言最有用的创造环境反而没什么用处 —— 就算把电子设备的语言全调成繁体,母语者的本能也足以在不认识少数传统字的前提下读懂。
最有效的方法还是写字,就算不是学习繁体,每天提笔练点字也能有效治疗现代人的提笔忘字。如果实在不想动笔,亦可学一门简繁通打的字形输入法,不过相效于写字可谓「事倍功半」,仅推荐闲人。

用之有道#

首先,正式场合还是乖乖用规范汉字吧,不要给工作人员添麻烦。除此之外,百无禁忌。汉字爱好者里什么人都有,各种用字都不足为奇。

我个人的用字原则还是偏保守,仅供参考:

  1. 非用字建议:使用宋体作为电子设备的默认字体,使用楷体 / 仿宋作为电子设备的斜体(italic)字体。
  2. 以通规繁体为主。
  3. 不用港台专有名词,如用「服務器」而非「伺服器」。
  4. 保留部分简化字,繁体字作为词义分化,如继续用「电」,「電」仅用于自然现象。
  5. 有左右结构的异体字先用,但要注意 CJK 扩展区的兼容。

最后,遇到别人说「装逼」或「孔乙己」怎么办?

承認。這世上沒用的愛好這麽多,不缺繁體字一種。


需要 CN-1001/5 权限。输入凭据:黑月是否嚎叫?

▼仅在月亏之时。

欢迎,监督者。

跨过悠长的历史,我们收容了无数异常。但想想那回旋无尽的小路吧。我们越是前行,就越有更多的未知像浓雾般包裹过来。

纸鹤、唱片、冰山、星云,我们像是人类文明的馆长,摆出研究者的姿态,端详着这些游荡在异界的迷途者。

我们定义了模因、休谟,妄想解释它们的存在。我们制造了稳定锚、复制器,相信能延续我们的存在。

但不探究目的,只谈论保护,就像是在头顶上构筑了一层又一层坚固的垒,可脚下的地面却开始塌陷。

我们不知这是它们本的计划,抑或是即兴的复仇。

它们赢了。黑月已然叫,人类即将进入月亏之时,我们是否还能坚忍等到月盈之日?

开个玩笑。上面的小彩蛋来自 SCP-CN-1001,现在你看到的才是真的彩蛋。
本文改写自《一站式繁体字学习指南》的笔记,成稿过程中加入许多维基百科的科普内容,反倒把学习方法论挤到了「闲话」部分。
开头声明「不评价汉字标准的优劣」,但其实我对汉字简化的态度就体现在引用的 SCP 里。再说得直白一点:一个文明如果不知道自己自何而來,就無法知道自己要到何處去。
末尾提到别人认为用繁体是「装逼」「孔已己」,实际上使用繁体者受到最多的质疑应该是「立场」。对于这方面的质疑根本没法解释,两岸都有人不由分说把字形和立场绑定,沾上就只能自认倒霉。所以我在网上绝大多数场合还是使用简体字,偶尔掺杂幾个传统字作为防伪标志。
中间新旧字形部分本想插入一些对黑体与斜体的批评(黑体的笔画风格或许更加适合电子设备 UI ,但绝对不利于汉字的字形认识;斜体汉字更是全无美感),但最后只留下那条不是用字原则的用字原则。同時奉上能强制把思源宋体的斜体设置为文鼎 PL 中楷的 fontconfig(仅 Linux,如何使用请自行搜索),祝每个人不用再看到由计算机自动生成的斜体:

  <?xml version='1.0' encoding='UTF-8'?>
  <!DOCTYPE fontconfig SYSTEM 'fonts.dtd'>
  <fontconfig>
  <match target="scan">
    <test name="family"><string>AR PL UKai CN</string></test>
    <edit mode="append" name="family"><string>Noto Serif CJK SC</string></edit>
    <edit name="slant"><const>italic</const></edit>
  </match>
  </fontconfig>
加载中...
此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。