使用remark处理markdown

                                            micromark
+-----------------------------------------------------------------------------------------------+
|            +------------+         +-------+         +-------------+         +---------+       |
| -markdown->+ preprocess +-chunks->+ parse +-events->+ postprocess +-events->+ compile +-html- |
|            +------------+         +-------+         +-------------+         +---------+       |
+-----------------------------------------------------------------------------------------------+

预处理器micromark/dev/lib/preprocess.js将markdown撕成分块（chunk），由单个字符码或者字符串构成。

micromark/dev/lib/parse.js将分块转化为事件。事件是号牌的开始或者结束。号牌可以嵌套。号牌跨一到多个字符码。号牌可以互相链接。

micromark/dev/lib/postprocess.js接收所有的事件，保证所有的内容都被解析。

micromark/dev/lib/compile.js将事件转为HTML。

Examples

Syntax tree

micromark-extension-math可以用katex渲染数学公式。

mdast-util-from-markdown可以给出AST。

Markdown

一开始markdown只是用一个perl文件markdown.pl实现。随后有了CommonMark标准。然后不同的平台又自定义了一些语法，比如Github就有了Github Flavored Markdown，俗称GFM。

Project

Comparison

micromark是底层引擎

remark聚焦在AST

marked是经典的markdown解析器，但是对CommonMark和GFM的支持不够好，默认允许不安全的内容。

markdown-it是经典的CommonMark解析器，措辞上有很多扩展，可以自定义语法，支持不同风格的markdown。

Security

安全性是指https://en.wikipedia.org/wiki/Cross-site_scripting，可能来自于内嵌的HTML或者links/images中的可疑协议。通过allowDangerousHtml 和allowDangerousProtocol 选项可以关闭默认的安全性。

unifiedjs

Github网址是https://github.com/unifiedjs/unified。

用于remark、rehype等等，提供通用的处理接口。

https://github.com/vfile/vfile是其对文件的抽象。

https://talk.commonmark.org/t/why-is-md4c-so-fast-c/2520

prosemirorr base markdown

https://github.com/benrbray/noteworthy
- https://github.com/benrbray/noteworthy/discussions/16讨论了noteworthy为啥使用remark

主页在https://noteworthy.ink/。

其他对比

mentioned unistd/mdast syntax tree

Markdown Editor

https://www.v2ex.com/t/808433

2022-06-19更新：markdown-it

markdown-it是一款老牌的基于JS的Markdown解析器，特点如下：

解析方式基于规则，则不是基于状态机
- 可以方便自定义新的解析规则
中间产物是一个号牌流，而不是AST
具有很多扩展

一些限制：

似乎一次必须解析整块markdown文本

一些参考：

一些思考：

其实并不需要每次都过一堆规则，根据当前的状态，适合的规则其实有限
- 但是需要预先的编译，才能减少不必要的规则匹配
https://github.com/markdown-it/markdown-ast-spec/issues/5对增量处理做了一些讨论
- 如果要增量处理，一方面要能够设置解析器状态，以适配增量解析的开始位置
- 架构上或许需要改变一下，比如像remark那样按输入的字符进行状态变迁，然后通过事件的方式来产生token

（更新完）

使用remark处理markdown

remark

remark github

micromark github

Architecture

Examples

Syntax tree

Markdown

Project

Comparison

Security

unifiedjs

其他markdown parser

markdown-it

marked

prosemirror-markdown

md4c

prosemirorr base markdown

其他对比

Markdown Editor

相关工具

2022-06-19更新：markdown-it

Architecture#

Examples#

Syntax tree#

Markdown#

Project#

Comparison#

Security#

其他markdown parser#

prosemirorr base markdown#

其他对比#

Markdown Editor#

相关工具#

2022-06-19更新：markdown-it#

Architecture

Examples

Syntax tree

Markdown

Project

Comparison

Security

其他markdown parser

prosemirorr base markdown

其他对比

Markdown Editor

相关工具

2022-06-19更新：markdown-it