序章 · 実例 1

1 つの Markdown から 5 つの形式

序章の主張 ── 「Markdown / JSON / Python / テキストで、Office 以上のものが 作れる」 ── をその場で証明するためのフォルダ。

やること

1 つの source.md(序章の本文そのもの)から、5 種類の出力を生成する。

出力 用途
out/prologue.html Web 公開、ブラウザ閲覧
out/prologue.epub 電子書籍リーダー
out/slides.html reveal.js 講演スライド
out/plain.txt grep / AI への入力
out/prologue.pdf A5 印刷物、入稿可能な体裁

make all 一発で全部できる。

構成

example-1/
├── README.md         ── このファイル
├── source.md         ── ../ja.md のコピー(入力)
├── book-style.css    ── PDF 用 CSS(A5、ページ番号、CJK フォント)
├── Makefile          ── ビルド定義
├── results.md        ── 実行結果(ビルド時間、サイズ、ページ数)
└── out/              ── 生成物(コミット済み)
    ├── prologue.html
    ├── prologue.epub
    ├── slides.html
    ├── plain.txt
    ├── body.html     ── PDF の中間生成物
    └── prologue.pdf

実行

# 必要なツール
sudo apt install pandoc fonts-noto-cjk
pip install weasyprint

# 全形式を生成
make clean && make all

合計 約 11.7 秒。詳細は results.md

なぜこれが「実例」になるのか

Word なら 1 ファイル = 1 形式。フォーマットを変えるなら別途作業が要る。 Markdown は ソース 1 本から、用途ごとに展開できる

しかも全部、コマンドラインで、無料のツールで、十数秒で

これが序章の言う「Pythonとテキストの世界」の最小実演。


計測結果 — 序章 example-1

実行環境: Linux 6.18 / pandoc 3.x / WeasyPrint 68.1 / Python 3.x / Noto Serif CJK JP

make clean && make all の出力を整理。

ビルド時間

形式 コマンド real time
HTML pandoc source.md -o prologue.html --standalone --css=book-style.css 0.056s
EPUB pandoc source.md -o prologue.epub 0.057s
reveal.js スライド pandoc source.md -o slides.html -t revealjs --slide-level=2 0.068s
プレーンテキスト pandoc source.md -o plain.txt -t plain 0.047s
PDF (A5/CJK) weasyprint(body.html) → prologue.pdf 11.502s
5 形式合計 約 11.7 秒

PDF が支配的で、それ以外の 4 形式は合計 0.23 秒。

出力サイズ

ファイル バイト 備考
source.md 7,404 入力(frontmatter 含む)
out/prologue.html 10,568 TOC 付き、book-style.css リンク
out/prologue.epub 9,207 EPUB3、9 ファイル構造
out/slides.html 15,150 reveal.js、13 枚スライド
out/plain.txt 6,505 テキストのみ、grep 可能
out/prologue.pdf 494,258 A5 / 7 ページ / フォント埋め込み

PDF の中身

Title:    序章
Producer: WeasyPrint 68.1
Pages:    7

book-style.css で次を指定:

7 ページに収まる小冊子サイズ。フォント埋め込み済みで、印刷所に入稿できる体裁。

reveal.js スライドの構造

--slide-level=2## 見出し ごとにスライド分割。

$ grep -c '<section' out/slides.html
13

序章本文の ## セクション数と一致。1 つの Markdown が、講演用スライドに変身している。

トークン経済(参考)

文字数で粗い概算:

形式 文字数
source.md 約 7,400 1.00
out/plain.txt 約 6,500 0.88
out/prologue.html 約 10,600 1.43

HTML は Markdown より約 43% 多い。AI に長文を渡すなら Markdown が経済的。

再現手順

# 必要なツール(Debian/Ubuntu)
sudo apt install pandoc fonts-noto-cjk
pip install weasyprint

# このフォルダで
make clean
make all

すべて 12 秒前後で完了する。Office 起動が要らない。GUI が要らない。

ファイル一覧

out/

序章「AIの母国語は、PythonとMarkdown形式のテキスト」に戻る