ひまつぶし雑記帖

doncha.net制作・発行:KindleやiBooks、楽天kobo、BOOK☆WALKERで読む電子書籍

一発芸:WORDのルビ・太字・縦中横をタグに変換

2014/4/26 [15:30:52] (土) 天気

この雑記帖でも何度かとりあげていて、「かんたんEPUB3作成easy_epub」https://t2aki.doncha.net/easy_epub では実装済みのワードの .docx ファイルを直接読み込んでEPUB3ファイルにするというネタ。

ついったなどを眺めてると

1)原稿はワードで書いている。
2)kindleだけならワードをそのままでもいいけど、ほかのストアに並べるにはEPUB3というのにする必要がある。
3)WEBサービスがあるのでそれを利用してみたい。
4)HTMLタグが意味不明で面倒くさい。
5)3に戻る。

というケースが見られるので、上記スクリプトからワードの指定をタグに変換する部分だけを抜き出して公開してみました。

ルビ、太字、縦中横に関して、ワードで指定した部分をHTMLタグに変換してテキストにする。
https://t2aki.doncha.net/tmp/docx2text.pl
(※ 一発芸ネタは直リンクできないようになっておりますので、このリンクからご入場ください)

これで変換したテキストは
「EPUB3::かんたん電子書籍作成」 https://books.doncha.net/epub/
「でんでんコンバーター」 https://conv.denshochan.com/
に使える、はず。(でんでんマークダウン対応、かも)

一発芸で未検証、適当な実装なのでネタ程度にご利用くださいませ。

»電子書籍制作代行についてはこちら

profile

profile

 
doncha.net
contact:
»運営者
@t2aki@tokoroten.doncha.net

ところてんx5

2024/4/24 13:43

pdfをWordで開いてみる手もあるか。空行、1ページの行数とか、pdfのまんまだったら行数表示で問題解決。だけど、実際どうだろ。帰ったら試す

2024/4/24 12:58

空行は目視しか確認方法がない…
windowsで半透明にするフリーソフトを見つけたので、各ページの幅で検知する。
全ページの行数を数えてたんじゃ絶対漏らす。そんな集中力はないわ

2024/4/24 12:55

ルビは変換後のepub xhtmlファイルもチェックツール作ったので、それで抽出して確認

検索
<<2024/4>>
 123456
78910111213
14151617181920
21222324252627
282930

リンク

WINDOWS版サウンドノベル
おかえりください PC WINDOWS版サウンドノベル
『おかえりください』体験版