夏目漱石はさむらいよしもつちよしもどっちも使ってたらしいけど,康煕字典によって明朝体の活字が作られて正字も制定された太宰治の時代にもなると,太宰はさむらいよししか使ってなかったそうな。念。
libidn11-devが1.1でlibidn2-0-devが2.0なのかなこの感じは。それでidn-rubyが要求してるのは1.1の方っぽいな。
康煕字典の吉はさむらいよしらしいし,やっぱりさっきも書いたけど康煕字典に従って正字を決めてる今の漢字の字体を考えるとさむらいよしが正字で,つちよしは俗字というのでまあそうだねってなる
でも,古代はつちよしでもさむらいよしでもどっちでも良かったとして,漢の隷書はつちよしのほうがデファクトだったのに説文篆文がたまたまさむらいよしだったばっかりに,さむらいよしのほうが正字になったらしい。 http://tonan.seesaa.net/article/371030379.html
たとえばつしよし(𠮷)は吉野家とかで使われてるから普通に有名だけど JIS にはない。JIS X 0213:2004 にすらない。
こういうの、固有名詞にあるかどうかがひとつのボーダーかなと思っていたけど、法人名に使われていてかつJISに含まれていない外字が490文字もあるらしいからなぁ……
まあ,つちよしやはしごだかは辞書でも一般に俗字,異体字として扱われると思う。表記ゆれではなく。
漢字については計算機の登場によってかなりの情報が削がれてしまってて,戦前はみんな印刷物では旧字使ってただろうけど手記なんかでは俗字や略字みたいな異体字もバンバン使ってて,ちゃんとそれで意思疎通できてたし今の小学校の漢字テストみたいに異体字や表記ゆれをミスとみなされるとかなかっただろうけど,今は略字で書いてもそもそも伝わらないことがある。
もっとも,康熙字典以前に遡ると,俗字とされている字体が実は古い字体では正しい字体として用いられてたとか,秦の始皇帝が小篆を統一の字体として広める前には一は弌だった(古字)地域もあるとか,そういう話してったらキリがない