一発芸:WORDのルビ・太字・縦中横をタグに変換
2014/4/26 [15:30:52] (土) 

この雑記帖でも何度かとりあげていて、「かんたんEPUB3作成easy_epub」https://t2aki.doncha.net/easy_epub では実装済みのワードの .docx ファイルを直接読み込んでEPUB3ファイルにするというネタ。
ついったなどを眺めてると
1)原稿はワードで書いている。
2)kindleだけならワードをそのままでもいいけど、ほかのストアに並べるにはEPUB3というのにする必要がある。
3)WEBサービスがあるのでそれを利用してみたい。
4)HTMLタグが意味不明で面倒くさい。
5)3に戻る。
というケースが見られるので、上記スクリプトからワードの指定をタグに変換する部分だけを抜き出して公開してみました。
ルビ、太字、縦中横に関して、ワードで指定した部分をHTMLタグに変換してテキストにする。
https://t2aki.doncha.net/tmp/docx2text.pl
(※ 一発芸ネタは直リンクできないようになっておりますので、このリンクからご入場ください)
これで変換したテキストは
「EPUB3::かんたん電子書籍作成」 https://books.doncha.net/epub/
「でんでんコンバーター」 http://conv.denshochan.com/
に使える、はず。(でんでんマークダウン対応、かも)
一発芸で未検証、適当な実装なのでネタ程度にご利用くださいませ。

