ひまつぶし雑記帖

doncha.net制作・発行:KindleやiBooks、楽天kobo、BOOK☆WALKERで読む電子書籍

word→textからルビをタグに

2013/8/15 [11:19:37] (木) 天気

WORDのルビに関する小ネタ。

ワード文書を直接読み込んで、電子書籍・EPUB3に変換するソフトもあるみたいだけど、一度プレーンテキストに吐き出しておいた方が何かと使い勝手がいい・使い回しが効く。ただ、ワード文書をプレーンテキストに保存すると、文字装飾やレイアウト情報がすっ飛んでしまう。テキストなので当然といえば当然。

でも、せめてルビは残したいのが人情というもの。

ワードの文書をプレーンテキストに保存すると、
・般若心経(はんにゃしんぎょう)
・超新星(スーパーノヴア)
てな感じ。ルビ対象の文字に続けて半角のカッコの中にルビが入っている。これをEPUB3というかHTMLのタグに変換したい。


以前、何度かこの手のネタで記事に。
『ルビのため perl unicode正規表現』  2013/2/22
『WORD文書(docx)をテキストに』  2013/5/29

このあたりで書いたことは  『EPUB3::かんたん電子書籍作成』  に実装、組み込み済みなんだけど、ルビなどはどこからどこまでがルビ対象なのか・特殊なルビなど、見ながら決めたい。

・東京都千代田区(ちよだく)三崎町
だったら「千代田区」に対してルビがつくし、
・BOZE(ボウズ)バンズ
だったら「BOZE」に対してルビがつく。

ということで、ワードからテキストで保存した場合にエディタで開いて校正しながら
・東京都|千代田区(ちよだく)三崎町
と、ルビの開始位置に半角の「|」を入れておいて、後で一括置換する正規表現が以下。

MacのCotEditorで確認。
WINDOWSのEmEditor や sakuraエディタでもイケるっぽい。→上記の書式中「\」を「¥」に置き換える。

といいつつ。ワードのルビ付き文書を、一太郎に読み込ませてルビ情報がそのまま生きていれば、たぶんそれがワードからEPUB3への一番簡単な方法だと思う

[08/15 14:51:11] 追記。
元ネタ、というか発端はこちら



[08/15 18:03:46] 追記。
https://hirakun.blog57.fc2.com/blog-entry-214.html
↑こちらはルビにタグをつけるワードのマクロを作成・公開されてます。
マクロがわかればこっちのが便利だ。感謝!

»電子書籍制作代行についてはこちら

profile

profile

 
doncha.net
contact:
»運営者
@t2aki@tokoroten.doncha.net

ところてんx5

2024/5/2 05:56

だらだらしててももったいないからとっとと起きて仕事するか…

2024/5/2 05:55

歳食うと二度寝ができん。早朝5時前後に目が覚めたらそれっきり。だるさが抜けないままいちんちがぼーーっと過ぎていく

2024/5/2 05:41

てことはepub本文の順番と目次の比較確認だけで問題はない。
pdfをテキスト化して比較するフローはなくして、目次通りに章立てが並んでるかを確認したほうがベター
中身を読んで段落の入れ替わり検知まではさすがにやってられんのはどっちも同じ

検索
<<2024/5>>
   1234
567891011
12131415161718
19202122232425
262728293031

リンク

WINDOWS版サウンドノベル
おかえりください PC WINDOWS版サウンドノベル
『おかえりください』体験版