alchaincyf/huashu-md-html
alchaincyf/huashu-md-htmlmd/html 双向流水线 · 三个能力一站式:万物→md / md→精美html / html→md。封装 markitdown + Pandoc + html-to-markdown + trafilatura。4 套反 AI slop 主题。Claude Code skill.
From the README
huashu-md-html
「md 是源代码,html 是产物。」
md/html 双向流水线 · 三个能力一站式:万物 → md · md → 精美 html · html → md
把任意文件(PDF / DOCX / PPTX / XLSX / EPUB / 图片 / 音频 / YouTube / 网页 URL)转成干净的 markdown,再用 4 套精挑过的主题加工成出色的 html,或反过来把已发布的 html 拉回来归档成 md。
每个能力都封装成一个命令,每套主题都过了反 AI slop 检查清单——没有紫渐变、没有 emoji 当图标、没有 #0D1117 深蓝底,配色克制,有出版社品位。
npx skills add alchaincyf/huashu-md-html
跨 agent 通用——Claude Code、Cursor、Codex、OpenClaw、Hermes 都能装。
看效果 · 装上就能用 · 三个能力 · 4 套主题 · 一条龙工作流
Demo
▲ 20 秒 · Kenya Hara 极简风格 · md → 入·排·出 → html · 衬线 + 留白 + 一抹赤陶橙 👉 下载 MP4(含 BGM · 850KB)
另一版风格预览(点开看 Pentagram 信息建筑派 · 18 秒)
▲ Pentagram 信息建筑派 · 象牙白 + 墨黑 + 辛辣红 · 大字号 sans + 12 列网格 + tabular nums 👉 下载 MP4(含 BGM · 2MB)
📌 以上两段动画都是用 huashu-design skill 做的——作为本 skill 的宣传短片。 同一个产品,两种视觉哲学,差异不来自模板而来自设计语言。
装上就能用
npx skills add alchaincyf/huashu-md-html
然后在 Claude Code 里直接说话:
「这个 PDF 转成 md」
「把这篇 md 做成精美 html,用 article 主题」
「这个博客 URL 转回 md,去掉导航和侧栏」
「把这份 PPTX 转成 md,再用 reading 主题做成发布版」
没有按钮、没有面板、没有 GUI。
三个能力
| 用户说什么 | 能力 | 底层工具 | 入口脚本 |
|---|---|---|---|
| 「PDF / DOCX / PPTX / XLSX / EPUB / 图片 / 音频 / YouTube / 网页 URL → md」 | 能力 1:万物 → md | microsoft/markitdown | scripts/any_to_md.py |
| 「md → 精美 html / 文章 / 报告 / 阅读模式」 | 能力 2:md → 精美 html | pandoc + 4 套自调主题 | scripts/md_to_html.py |
| 「本地 html 或 URL → md / 归档已发布的博客」 | 能力 3:html → md | html-to-markdown + trafilatura | scripts/html_to_md.py |
决策原则:能力 1 产出的 md 可以直接喂给能力 2,组成「PDF → 精美阅读 html」一条龙。能力 3 用于反向归档。
URL 输入的两条路径
URL 既能走能力 1(markitdown)也能走能力 3(trafilatura),但产出质量差异巨大:
| 页面类型 | 走哪个 | 原因 | |----------|--------|------| | 结构化页面(产品详情、技术文档、API doc、证书页、电商商品页)| 能力 1(markitdown)| 保留 metadata、字段值、链接、标题层级 | | 正文类页面(博客、新闻、Essay、长文)| 能力 3(trafilatura)| 自动去导航/侧栏/相关推荐/广告,只留正文 | | 不确定 | 两个都跑一遍对比 | 看哪个对下游用途更合适 |
判断捷径:URL 里的内容是「读」的还是「查」的?读 → 能力 3(去噪),查 → 能力 1(保信息)。
4 套主题
每套都过了反 AI slop 检查清单。自包含单 CSS,HTML 打开即用,不依赖外部 CDN。
| 主题 | 哲学锚点 | 适合场景 | |------|---------|---------| | article | Tufte CSS 启发 · Pentagram 式信息建筑 | essay、博客、深度阅读、独立文章 | | report | 出版社白皮书风 · 多表格密度型 | 技术报告、调研、白皮书、产品文档 | | reading | Medium 风极简 · 单栏窄体大字 | 公众号转接、纯阅读、轻量分发 | | interactive | 长文档导航型 · 折叠 + 目录 + 边栏 | 橙皮书章节、技术书籍、长教程 |
article · Tufte 风 · 衬线 + 边距笔记 report · 白皮书风 · 宽体多表格
reading · Medium 风 · 单栏极简 interactive · 长文档 · 侧边栏 + 折叠目录
排版底线(所有主题共享)
正文字体(中文) PingFang SC, Source Han Serif, Noto Serif CJK
正文字体(英文) Inter, IBM Plex Sans, et-book
代码字体 JetBrains Mono, Fira Code
行高(中文) 1.75 - 1.85
行高(英文) 1.6
字号(桌面)