文法的にはSGMLのサブセットとはいうけれど意味論的には名前空間に対応できないとW3CがXMLに求めたものが表現できないし結局独自パーサーやんけになる
そもそも HTML も SGML 的汚文法への回帰といえるのでは(適当)
でも XML の方がシンプルじゃないですか
処理系実装より足が早い言語、 C++ などがある (?)
そもそもLSは生きて(living)おり、生態としてはブラウザよりも足が速いことが知られている(?)
WHATWG、データがどのようであるべきかではなくアルゴリズムを規定して挙動を統一しようとする傾向があるの、pragmaticといえばpragmaticだけどsuboptimalよなぁという気持ちはある
終了タグ省略とか属性値省略程度ならまだしも、 <script src="hoge.js" /> が動かないのとか完全に仕様の欠陥でしょ
WHATWG LSはバージョニングされてない「HTML」の規定だから「HTML5」はW3C HTML5という解釈もありうるな(?)
unaristさんはW3C TRを参照してて私はWHATWG LSを参照してるのすき(私もかつてはW3Cをcanonicalと考えていたけれど最近は世間に折れてしまった)
HTML 5.2: 4.4. Grouping content
https://www.w3.org/TR/html52/grouping-content.html#elementdef-p
<p> の中に <ul> 書いたつもりでも、暗黙に p が終わってるやつな。こういうところ嫌い
aの中にブロック要素入れられる話、どう定義してるんだろうと思ったら Content model: Transparent, but there must be no interactive content descendant. と書かれていてなるほどねになった。
https://www.w3.org/TR/html50/text-level-semantics.html#the-a-element
div要素はflow content/palpable contentでp要素のcontent modelはphrasing contentなのでp要素の中にdiv要素を含めるのはHTML5でも規定に沿っていない
a タグも(旧)ブロック・インラインどちらも括れるようになってるし