WORDをテキスト保存した時のルビの捕捉

いや、あいかわらず雑なネタ。
.docx、ワードファイルではなくて、ワード文書を書式なしテキストで保存したテキストデータがたまにやってくる。基本的にシンプルなものが多くて流れ作業で済む。
…なんだけど、ルビのついたものがたまにあるのでその対応のメモ。
ワードの文書を書式なしtxtで書き出すとルビは
「これは漢字(かんじ)にルビがつく」
などと、ワード文書ではルビのところが、漢字と半角カッコでくくられたルビにわけられて保存されることになる。
そういや、以前もこんなことあったなあと思い出して、この雑記帖を検索したら出てきたのが
青空文庫のルビや傍点をHTMLタグに変換
https://t2aki.doncha.net/?id=1443167217
↑このエントリ。
青空文庫で使われている、青空記法は多くのひとに使われるように、よく練られているなあ、と感心した記事で、やっぱりさきほども改めて感心。
てことで、その時の記事からほぼ流用したのが以下のスクリプト。
perlで、Unicodeブロックを使った正規表現で漢字やかなを拾えるんで大助かり。
ただ、こいつはビミョーで、漢字に続いて半角カッコがあるのは、ワードが吐き出したルビだけとは限らないし、ルビの対象となる漢字の範囲がこれだけだと特定できない。
青空記法では問題にならないんだけど、ワードの吐き出しに多くは求められない。
なので、あくまでも初校作成時の手助け程度、かな。
にしても。
まだ5インチと3.5インチのフロッピーディスクが現役で、MSDOSは3.0が出た頃、NECの98シリーズが人気だった頃だからもう40年近く前の昭和の頃。日本ダービーでシンボリルドルフが皇帝になった頃。
Wizardryというゲームがやりたくてパソコンを買って、その後競馬データをこねくり回すために使いだしたawkやperl、unix環境。言ってしまえば、遊びでやってた当時の余録で、還暦すぎても小遣い稼ぎができるんだから、なにが役に立つのか立たないのかなんて、その時にはわからないもんだわな。
仙人の弟子の雑巾がけ庭掃除のネタは深いものがあるなあ(しみじみ)
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
Chromebookで電子書籍を読む

正規のChromebookはgoogle playからアプリをダウンロードして使うことができる。
デスクトップやノートパソコンでAndroidアプリが使えるということになる。
やりたいことは。
ASUSのChromebook CX1101で電子書籍を読む、というか表示確認をしたい。
今のところ、ChromebookというかChromeOSで制作した電子書籍を確認するためには、
・WINDOWSのノートパソコンを起動して
・電子書籍ファイルを共有フォルダに保存して
・WINDOWS版のKinoppyを立ち上げて読む
これだけっちゃこれだけなんだけど、この「これだけのために」が面倒くさい。
手元のChromebookでそのまま確認できればらくちん。
てことで、ASUSのChromebook CX1101でも電子書籍を読めるように電子書籍リーダーを探してみた。
google play storeで確認したところ。
kindleとkinoppyはChromebookに対応していない。
kindleについてはgoogle play storeではなくて、Amazon アプリストアから直接ダウンロードすれば使えるらしいけど、いくつか手順が必要でそこまでやる?
https://www.itmedia.co.jp/news/articles/2206/15/news181_2.html
↑chromebookにamazon アプリストアをインストールする方法
大日本印刷のhontoがChromebookでも使える
https://play.google.com/store/apps/details?id=jp.co.dnp.eps.ebook_app.android
問題なくgoogle play storeからインストールできた。
すでにhontoで購入済みの本も本棚に同期されていて、すんなり読める。
ローカルの電子書籍、epubファイルを読ませるには、リーダーごとに指定された保存フォルダにepubファイルを保存する必要がある。
Andoroidアプリのhontoの場合は
/storage/emulated/0/Android/data/jp.co.dnp.eps.ebook_app.android/files/epub/
↑ここにファイルを保存する。
chromebookではどこに保存するのか探してみた。
chromebookの「ファイル」アプリで「マイファイル」→「Playファイル」
「すべてのPlayフォルダを表示する」にチェックを入れると出てくる
/mnt/chromeos/PlayFiles/Android/data/jp.co.dnp.eps.ebook_app.android/files/epub/
↑ここにファイルを保存する。
とりあえずはこれでOKかな。
ほんとは本体に保存するのではなくて、作業しているSDカードをlinkしたいところだけど、
ln -s
で権限がないとはねられる。Playファイル以下にあるフォルダ側の権限の問題っぽい。
最終的に納品前にkindle previewerでの確認も必要なので、WINDOWSを立ち上げることになるんだけど、途中途中のちょっとした確認はこれで手間がずいぶん省ける。
電子書籍を自分が読む時はスマホなんだけどね。
昭和の書籍の文字サイズは老眼には厳しいんで、古本ではなくて、文字サイズを変更できる電子書籍がありがたいんだよなあ(ポンコツ)
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
WORDの小ネタ

ワード(MS WORD 2010)についての小ネタ
毎度毎度検索して探すのも面倒なので、ここにメモ。
傍点(圏点)のついた箇所を検索
・「ホーム」→「検索」
・検索窓の右にある小さな▼をクリック
・「高度な検索」→「書式」→「フォント」
・「すべての文字列」の項目にある「傍点」を選択(ゴマ)して「OK」
・ひとつ戻ったところで検索窓を空欄にして「次を検索」
「書式」の先の「フォント」から設定する…て、気づかないだろ
ルビを検索
・「Alt+F9」を押して「ルビをフィールドコードで表示させる」
・検索窓の右にある小さな▼をクリック
・「高度な検索」→「オプション」
・「あいまい検索」のチェックを外す
・「特殊文字」→「フィールド」
・検索文字に「^dEQ」を入力(「^d」はデフォルトで入っている)
・「検索する場所」を「メイン文書」にする
ルビの数をかぞえるだけなら置換に適当な文字を入れて実行。置換された数が出るので確認できる。
↓以下のサイトを参考にさせていただきました。多謝!
小ネタ集 - 成城大学文芸部 萬屋夢幻堂
Word2010-2016: ルビの検索(一括書式変更など) - 教えて!HELPDESK
オフィスソフトについて検索してるといろんなTipsが掲載されていて助かるんだけど。
んなTipsが必要とされるってだけでオフィスソフトはクソだ。
デフォルトがほんと余計なお世話だらけでかえって使い勝手を悪くしてるだろ。うんざり。
ワード、エクセルは滅んでくれろ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
winmergeという神ツール

バージョン管理ツールというのがある。
バージョン管理ツールというのは「テキスト」の変更履歴を管理するツールのこと。
今日時点だとネットではgitが決定版と言われていて、ほかにもCVSやsvnなんてのもある。
このあたりは、ひとつのプロジェクトをチームで動かしているようなケースでは必須のツールだろう。実際にFreeBSDやlinuxなどOSのソースコードはこの手のツールで管理運用されている。
ただ、個人で、ひとりの作業で使うにはどうだろう。
これからはgitだ、というんでインストールしてみたものの、個人でちまちまやってる分には大袈裟すぎて管理のための管理作業が発生して面倒なだけだった。仕事で他の人が管理しているツリーにメンバーとして参加、コミットしたりとか程度でがっつり使ったこともないし、実際のところはよくわかってない。
とはいえ、
「納品20210110.zip」
「納品20210110b.zip」
「納品20210110-修正1.zip」
「納品20210110-修正0115.zip」
ということもよくあって、変更履歴の管理はさすがに痛感しているので、納品後の修正や差し戻しがあったら(って、なんでやねん、という話だけど)ディレクトリごと別ディレクトリとしてコピーして作業するようにしている。
こういう時に、もう10年ぐらい重宝しているのが、winmergeという差分確認、マージ(差分擦り合せ)のためのツールだ。
https://winmerge.org/
これがなければ仕事にならないし、これのためにWINDOWSを使い続けている、といっても言いすぎじゃない。
神ツールとはまさにwinmergeのことを言う。
2つのファイルの差分をチェック
百聞は一見に如かず。
ふたつのファイルで違いのある箇所が左側のルーラーの黄色の部分。
メインの左右画面では違いのある箇所が赤く表示される。
差分、変更箇所がすぐに目視できる。差分のある箇所を個別にどちらかに合わせることもこの画面ですぐ、だ。編集されて上書き保存されたら元ファイルは拡張子が.bakになって保存される。
これはeasy_epubという電子書籍作成スクリプトのソースコード。
左側がオリジナルのリフローEPUB用、右側がハイブリッド対応版
無駄に機能追加したり、つぶしきれないバグフィックスをするたびに、別フォルダにコピーして修正。修正したらwinmergeで修正箇所、修正漏れの確認をして動作確認。動作が意図どおりじゃない時などもwinmergeのおかげで修正箇所の洗い出しが一発なので楽チン。
ディレクトリごとの比較
winmergeにファイルではなくてディレクトリを指定して読みこませると、ディレクトリ内で違いのあるファイルがこれまた一目瞭然。
違いのあるファイルが黄色くハイライトされている。
これはdoncha.netのサイトの一部。スクリプトやhtml、css、javascriptなどいろんなファイルがてんこ盛り。
webの場合、デザイン変更ひとつ取ってもhtml、構造の変更なのか、css、見た目のデザイン変更なのか、そのためにスクリプトやデータベースの変更は必要なのか、などなど、いろいろ絡んでくる。どのファイルを変更しなきゃいけないのか、実際どのファイルを変更したのか。
winmergeが一目で教えてくれる。
差分のあるファイルを選んでクリックすると2つのファイル比較となり編集更新ができる。
テキストの変更箇所、差分を教えてくれる、直感的で超絶便利なツールがこのwinmergeだ。
ということは。
プログラムとかエンジニアだけのものじゃなく、webのソースとかデザイナーだけのものじゃなく、テキストを扱うすべてのひとにとっての神ツールということだ。
小説書き、モノ書きのひとにとっても、語尾や用語を合わせる前後や、追加エピソードやセリフの確認とその比較に使える。
一太郎やワードはさらにモノ書きに特化した機能満載だから、それで間に合っているかもしれないけど、一太郎もワードも入っていないパソコンもあるしね。
gitやsvnのように更新、変更履歴を追うことはできないけど、winmergeさえあれば、個人でやる仕事については、万全磐石の安心感。
だがしかし、めちゃくちゃ残念なことにwinmergeはWINDOWS版しかない。macにもchromebookにも当然ない。
わたしの弁当箱macはすでに最新のOSアプデ対象外となっていて、今はただの鉄の箱だからいいとしても、去年末あたりから使い始めたchromebookで使えないのは致命的。このchromebook化したASUSのvivobookで委託のWEB運用、請負の電子書籍制作をやっていて、特に電子書籍の方はwinmergeでの作業がはいる。
原本、底本の元データと電子書籍化したEpubデータの差分チェックは欠かせない。
作成中にルビを取りこぼしたり、全角の空白を潰したりしてしまうこともあるし、修正依頼に対応したら修正の必要がない箇所に影響したり、などなど確認項目は多岐に渡る。
そのためだけに、WINDWOS機を起動してwinmergeで確認してたんだけど、さすがにどうにかせんといかんなあ、と必死のぱっちでぐーぐる先生。
「漢」ならdiffで頑張れ
とか言われてるんだけど、いくらなんでも無茶すぎ。そこでvimの出番となった。
エディタのvimがほぼ万能で、こいつもできないことを探すほうが難しいやつ。
vimdiffという差分チェックができるモード(?)がある。見た目もwinmergeとほぼ同じ、ていうか、vimdiffの方が先だろう。これで、ディレクトリ内のファイルの比較もできればなあ、と。
たぶん、いや、間違いなくvimだけでできると思うんだけど、わたしにそんなスキルも時間もないので、diffでディレクトリ比較した結果を適当に整形して読みこんで画面分割してやってみることにした。
winmergeほど便利じゃないんだけど、やりたいことはほぼこれでできることとなった。
ちなみにvimについては
https://knowledge.sakura.ad.jp/23018/
↑こちらのサイトがおすすめ。
しかしなあ。
21世紀にもなって、ラクをしようとするな、ツールなんか信用するな、というクズな仕事場もあって心の底から呆れるばかり。どうぞそのまま滅んでくださいとしか。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
電書協準拠easy_epub暫定版

EPUB電子書籍の最低限の条件は、epubcheckでエラーや警告の出ないきれいなEPUBファイルであること。
…んで、以前にも言ったように、これは最低限。
kindleや楽天kobo、ibookstore、角川BOOK WALKERなどの電子書籍ストアは各々独自のレギュレーションがあってそれに合わせる必要がある。
特に画像まわり。サイズや解像度がデバイスの進歩(?)にともなってレギュレーションも変わっていく。レギュレーションに合わないものはリジェクトされたり審査に通らなかったりする。
つまり、EPUB3でエラーのないファイルでも、電子書籍ストアのレギュレーションに合ってないと、店頭に並べられないことになる。
…てなことも、以前言ってるのでこのへんで。
これとはまた別の要件というかリクエストで、
「電子書籍協会のEPUB3制作ガイドに準拠」したEPUBファイルにしてほしい。
というのがある。
epub3ファイルとしてエラーも警告もないし、ストアのレギュレーションも最低のところに合わせてクリアしてるのに、さらにまたなんで電書協ガイドに準拠しなきゃいけないのか、いまいち意味不明なんだけど…現状、電書協の制作ガイドが広く使われているので、安心できるというところなんだろう。
『日本電子書籍出版社協会>各種勧告・資料|電書協EPUB3制作ガイド』
http://ebpaj.jp/counsel/guide
ただ、何をもって電書協「準拠」というのかよくわからない。
・ファイルやフォルダの構成と命名規則
・スタイルシート群
だとは思うんだけど、クライアントによって命名規則やフォルダが微妙に違ってることがある。
とりあえず、ファイル分割やxhtmlのヘッダの記述、全体のおおまかなclass指定なんかをスクリプトでやっておいて、後から微調整している、というのがわたしの現状。
『かんたんEPUB3作成easy_epub』http://t2aki.doncha.net/easy_epub
↑これの「電書協準拠」版を暫定で作って使っている。
「暫定版」としたのは、上記したように結局クライアントごとの微妙な違いを修正するのに、EPUBファイルを直接編集する必要があって、このスクリプトだけで完結しないから。
ダウンロードはこちら → http://t2aki.doncha.net/release/easy_epub-denshokyo.zip
※フリー(無料)ですのでご自由にどうぞ。
使いかたはeasy_epubとまったく同じ。原稿に「小見出し」などのキーワードを埋めこんでスクリプトに流しこむだけです。
詳しくは「http://t2aki.doncha.net/easy_epub」のページでご確認ください。
easy_epubオリジナルは「FUSEe」(フリーウエア版) http://fusee.fusenetwork.co.jp/ を元に作ったもので、たぶんフォルダ名なんかが一世代前のepub2で使われているものだと思う。
easy_epubオリジナルと電書協準拠版の大雑把な違い
easy_epubオリジナル | 電書協準拠暫定 | OEBPS | item |
---|---|
・images/ ・style/ ・text/ | ・image/ ・style/ ・xhtml/ |
OEBPS/content.opf | item/standard.opf |
OEBPS/text/nav.xhtml | item/navigation-documents.xhtml |
OEBPS/text/contents00.xhtml 「contents」がプレフィックス | item/xhtml/p-001.xhtml 「p-」がプレフィックス |
フォルダ構成、OPFファイル名、ナビゲーション文書(目次)ファイル名、本文xhtmlファイル名が違っている。
電書協ガイドの肝はスタイルシート群。必要とされそうなスタイルがすべて記載されていてかなりデカイ。
easy_epubオリジナルのスタイルシートはほんと最低限のものだけなので、電書協準拠版はガイド資料にあったスタイルシートをそっくりそのまま利用させてもらっている。
電書協ガイド準拠の必須条件はパッケージファイル(standard.opf)のメタデータ部分。
ここはよくわからんけど、呪文みたいなもんで、そのまま転記すれば大丈夫。
この暫定版ですが、微調整の手作業が必要なものなので、バージョンアップの予定はいまのところありません。
ところで。twitterで教えてもらったんだけど。
easy_epubの改造版があって、どうもあまり筋のよろしくない改造をされているらしい。
なんか変だなあ、と思ったらウチのオリジナルをお使いください。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
2016年ふりかえり

2016年のふりかえり…などと言ったところで、無職初老のフリーターだ。ふりかえったところで特に何があるわけでもない。とはいえ、そろそろ真剣にボケを気にしなきゃいけない年齢。この一年なにも思い出せなかったりするとちょっと悲しいので、メモていどは残しておこう。
・電子書籍の制作仕事がちょびっと増えた。
6月頃にそれっぽいところにメールで営業してみたら定期的に仕事が落ちてくるようになった。
時代小説と官能小説。書店に並ぶほとんどの本は「品切れ絶版」で放置されるというのに、電子書籍にするためのコストをかけても採算がとれるのはこのジャンルということかな。
・システム運用というIT蟹工船のパート仕事にありついた。
週末限定。…って、ほかの業務委託とカブらないように、探したらそりゃ週末限定になるわな。
にしても「運用の仕事」てのはシビア。うまくやって当たり前で、100点満点からのひたすら減点式。ハゲが進行するぞ。
・ポケモンGoでウォーキングを再開した。
Ingressが終わって、あまり歩かなくなってたんだけど、ポケモンGoのおかげでウォーキングの再開。
内科のセンセからウォーキングはメタボ対策になるから、と言われ、整体のセンセからウォーキングは顎関節症腰痛対策になるから、と言われて、その効果も実感していた。ポケモンGoが中高年に人気なのもよくわかる。
この一年、コミケ、コミティア、文学フリマ(東京)とサークル参加。
特に昨日のコミケでは、家人の本はたくさん手に取っていただいた。やはりコミケはイベント参加者の熱量が高いなあ。
ありがとうございました。
また、年末にKindleUnlimited(アマゾンの読み放題サービス)に日野裕太郎の電子書籍を投入したところ、それなりに読まれていてちょっと驚き。アマゾン一強は来年も続くんだろう。
日野裕太郎の本は商業・同人誌・電子書籍すべて、こちらにまとめてあるので覗いてみてやってください。手前味噌の身内誉めですが、Kindleの12月新刊『淀んだ川で待っている』『うそつき、祈祷師になる』はオススメ!
→『日野裕太郎/さつきの本』http://hino-yutaro.doncha.net/
来年2017年、皆さんにとって、健康で良い年でありますように!
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」