pandoc初窥

pandoc 是一个使用 Haskell 语言编写的一款跨平台、自由开源及命令行界面的标记语言转换工具,可实现不同标记语言间的格式转换,堪称该领域中的“瑞士军刀。pandoc 支持的输入和输出格式范围广泛,包括但不限于 Markdown、HTML、DOCX、PDF、LaTeX、EPUB 等。

pandoc 不是 python 的库,但是有一个 python 的封装,叫做 pypandoc,可以在 python 代码中调用 pandoc 的功能。pypandoc 可以使用 pip 命令安装,例如:

1
pip install pypandoc

pandoc 的日常用法主要是通过命令行来转换文档,例如:

1
pandoc input.md -o output.html

这个命令就是将 input.md 这个 Markdown 文件转换为 output.html 这个 HTML 文件。pandoc 还有很多其他的选项和参数,可以参考 pandoc 的文档。

pandoc 也可以在 python 代码中使用 pypandoc 来转换文档,例如:

1
2
3
import pypandoc
output = pypandoc.convert_file('input.md', 'html')
print(output)

这段代码就是将 input.md 这个 Markdown 文件转换为 HTML 字符串,并打印出来。pypandoc 还有其他的方法和参数,可以参考 pypandoc 的文档

pandoc 是一个非常强大和灵活的文档转换工具,可以帮助你在不同的文档格式之间进行转换,特别是对于 Markdown 这种简洁易用的标记语言,可以轻松地生成 PDF、电子书、幻灯片等多种形式的文档。

格式转换

刚好今天得提交个Word报告,但是写东西我还是喜欢Vim,于是就打算写完转换成Word。正打算手动转换/网页在线转换的时候想起来了这个玩意——

然后就一行秒了。

1
pandoc -o $(OUTPUT) -f markdown -t docx $(MARKDOWN) 

我直接从Makefile里摘出来的。用Makefile的话,写完敲个make就行。

最让我吃惊的是这玩意速度奇快,转换个快4000字的Markdown到Word,几乎跟我echo个字符串一样快,这还是我在7代intel移动端平台上测试的(?A?)

  • Markdown转Tex,速度也很快
    1
    pandoc -w latex ./test.md -o test.tex
作者

xeonds

发布于

2023-12-09

更新于

2024-10-08

许可协议

评论