WORD文書をEPUB3に変換

2013/4/5 [11:47:36] (金) 天気

文書ファイルを電子書籍のEPUB3ファイルにコンバートするケース。元ネタになる文書は、サイト用に作られたHTML文書だけではなくて、当然WORD文書もある。


って、わたしはプログラマではないので、アプリが出力するバイナリデータを直接触ってごにょごにょするのは無理。


「テキストデータに変換したものをもらえば対応できますのでゼヒゼヒ」と営業してきたけど、先方はライターから上がってくるWORD文書をそのままEPUB3にして欲しいに決まってるしなあ。と。


調べてみたら、最新バージョンのWORDで保存する、拡張子が .docx の文書はzipで固められたものらしい。unzipで解凍したものが以下。

image

xmlで保存されていて吃驚。

全部きちんと調べてないんだけど、どうやら「document.xml」が本文。これならAWSのAPIと同じ。XMLなら中身を見ることができるので、ざっくり文章を抽出することはできた。

perl の定番、 XML::Simple と Data::Dumper でデータを眺めると、位置情報やフォントサイズなどの属性も入ってるっぽい。画像も同様。WORD文書に見出しタイトルなどがついていれば、それを目次に登録してEPUB3文書にできる。


とはいえ、やはり検索してみるとすでにWORD文書をEPUB電子書籍に変換=コンバートするアプリは無料有料があるし、一太郎のEPUB3出力エンジンは定評のあるFUSEeなのでWORD文書を一太郎に読み込んでコンバートというやりかたもある。たぶん凝ったレイアウトなどもうまく再現できる、はず。


わたしが作るとしたら、大量にあるWORD文書をひとつひとつソフトに読み込んで、ひとつひとつ出力していく手作業よりも、WORD文書が入ってるフォルダをボトっとドロップしたらそれっぽいEPUB3文書にする。という大雑把なシロモノになるんだろうなあ。

スクリプトは手順どおりのことをさせるだけなので、面倒くさいけど難しいことはない。必要に迫られたら作ってみよう(本当だったらXMLの公式の仕様書を見ないとメンテができないけど。ね)


XMLってこんなところに使われてたのか。

https://twitter.com/dokusyo2/status/320721573483016192


[04/05 20:28:06] 追記。

ということで 『かんたん電子書籍作成』 に組み込んでみた。

ワードのファイル(.docxなので2010以降かな)をそのままアップロードできるように。ただ、レイアウトやフォントなどのデザイン情報は無視します。挿絵があったら、ダミーの画像を一枚差し込むようにしてみました。

ちなみに、ルビはワードそのまま大丈夫。縦中横もそれっぽいところは自動で指定しています。

(つむぎゆう・『わたし、おねえちゃんの犬になる』より)

image



[2014/02/14 14:25:34]

こちら、『かんたんEPUB3作成easy_epub』 にもWORDの文書を流し込んでEPUB3にする機能を追加。縦書き・横書き、ルビ、縦中横はワードの情報を生かします。



いつも何かとふぁっくなMSだけど、XMLで保存はイカしてるぞ!


[更新]2014-02-14 14:25:34

電子書籍周辺請負仕事

2013/4/4 [11:42:20] (木) 天気

電子書籍がどうやら本当に立ち上がりつつある。kindleやkoboといった電子書店や、個人出版などとはまた別のところ。


電子書籍が認知され出して「電子書籍というのにすればいいのか」「EPUBというのがあるのか」「うちも電子書籍にしておこう」という話。


例えば、今までアプリで出していたものを電子書籍化することになったとか、今までPDFで作ってた社内文書をEPUBの電子書籍にすることになったとか、そこに需要があるっぽい。過渡期限定。

(あまり具体的に言うとNDAもあるのでテキトーにぼかすけど)

先日打診があって、ちょっとその手の文書と画像をワンセットもらってEPUBにした。


やることは単純で。

・文書をXHTMLに流し込み所定のフォルダにおさめる。

・画像をXHTML文書のファイル名と関連づけてリネームして所定のフォルダにおさめる。

・opfファイルやナビゲーション文書を作る。

ざっくりスクリプトを書いて処理したら、epubcheckでエラーがだぁーっと流れて吃驚。


見てみると。元の文書データはプログラムで動的に出力したもののはずなのに意味不明のパターン外の記述が散見。これ、たぶんうまくいかない文書があったので、個別に手作業を入れたに違いない。スクリプトで一発というワケに行かず、一度スクリプトでコンバートしたものに対して、エラーを手がかりにやっぱり個別手作業、となった。予想外に手こずった。


文書の構造化なんて意識しない方が多いだろうし、今後この手の個別対応された文書が大量に出てきて、制作現場の悲鳴が聞こえるようだ。


以前に書いたように、クライアントはたぶん今までと同じ見た目を求めるはず。でもリフローの電子書籍では難しいところもある。


「これをそのまま電子書籍にするだけでいいんだよ」


というリクエストがキツイよなあ。



とはいえ、粛々と仕事はありがたくいただいて行きます。

[更新]2013-04-25 18:41:05

電子書籍WEBサービスは自費出版と同じか

2013/4/2 [10:11:34] (火) 天気

無理難題かも知れないけど、作家、クリエイターから金を取るなよ、と思う。


パブープロ版の料金

http://p.booklog.jp/about/pro

BCCKSのエキスパートプランの料金

http://bccks.jp/about/bccks_expert


出版社が信用できるところは、作家に原稿料を払って本を作り、本を売るところまで作家と一緒。売りたい気持ちは作家と同じ。というか会社がかかってる・生活がかかってるので大のおとながみんな必死で売る。


「饅頭本」と揶揄される自費出版は昭和の昔からあって

・プロの編集者が校正、アドバイスしますよ

・プロのデザイナーが装丁しますよ

・(一部の)一般書店に並びますよ

ということで頼む側も納得してやる分にはかまわないと思う。

(問題になったのは、押し売りというか、新人賞を募っておいて本にしませんかと話を持ちかけ、100万前後の費用がかかると後だしが増えたから、だった、かな…記憶曖昧)


とはいえ。自費出版を業としている会社組織などの信用しきれないところは、作家の金で本を作って、あとは売れようが売れまいが関係ないから。会社の収益は作家からの金。売れたらラッキーで「売りたい」という意識に差があるだろう。


WEBのサービスって、これと同じ構図に見える。


Amazon、KindleストアのKDPや、Apple、iBookstoreのiTunesconnect といった海外の個人出版サービスは「作家から金を取らない」(今のところ)


「コンテンツありき」「作家、クリエイターが最初」というのがわかってるんだと思う。


それと比べたときに、冒頭にあげたようなWEBサービスはどうなんだろうか。

無料で始めてもらって、有料へ誘導。「いやいや有料なんてほとんど会員いないし微々たるもの」「この金額じゃ採算合わない」という話だったとしても、作家側からも金を取ろう、というのは違和感を覚える(余計なお世話だろうけど)



虚構、物語を生み出す・求めるのは人間の本能のようなものでなくなることはない。


映画になったりグッズになったり、巨大なビジネスになるようなものも、最初は個人の頭の中から生み出される。それを大きく育てて、次へ次へ繋ぐのがコンテンツビジネスというやつだよなあ。


パトロン、出版社と形態は変わっても作家、クリエイターには投資できてたはず。ネットになって、作家、クリエイターからも金を取らなきゃやっていけなくなったってことだとしたら、寂しいというかさもしい話。


[04/03 21:49:36] 追記。

売上からのマージンはappleもAmazonも取るじゃないか、という的外れなツッコミを見かけたけど、彼らは売れないと金にならないという点ではまだ作家側だろ。上記したサービスは売れようが売れまいが、作家からランニングを取ってるというのが大きな違い。


[更新]2026-02-02 07:45:24

EPUB3リフローレイアウトで扉ページ

2013/4/1 [00:31:49] (月) 天気

ここで過去に何度もEPUB3のリフローレイアウトで扉ページ(左右中央にタイトルを配置したページ、縦ページ内でのセンタリング)は無理だと書いてきたけど、実現する方法があった(嘘書いててすみません)


twitterで教えていただき、

https://twitter.com/nakanotaito/status/318340868715196416

CSSとHTMLのコードまでいただいた。本当にありがとうございます。

(ツイートにもあるように、iOS版Kindleでは意図通りにならないとのこと)


上の「猫神の場所」が教えていただいた中央揃えの方法、下の「猫神の時間」今まで使っていた右に余白25%指定したもの。比較してみると、中央揃えになっているのがわかる。

image

ポイントはふたつ。

中央揃えにしたいタイトルがあるページは文字方向を水平にして、タイトルを入れるブロック要素の中の文字方向を縦にする。

image

【赤部分】

bodyに指定してこのページ全体の文字方向を水平=横にする。


【青部分】

左右の余白をauto=自動にすることでタイトルの入るブロックが、このページの左右方向中央に配置されることになる。

そして、タイトルの入るブロック要素の文字方向を垂直=縦にすれば、縦書きの扉ページとなる。


↓タイトルを中央配置するには固定レイアウトでなきゃいけない。

↓EPUB3では。リフローと固定は混在できるが。

↓現状のリーダーで混在したEPUB3を読めるものはほとんどない。Kindleも混在できない。

↓よって、文字を中央配置した扉ページを作るのは無理。

と思い込んでいた。


リフローレイアウトと固定レイアウトの混在は無理だけど、横書きと縦書きの混在は可能、ということがすっかり抜け落ちてしまっていた。まさに目から鱗。


https://twitter.com/nakanotaito/status/318348734771630080


これは本当にいろいろ応用できるなあ。

ということで 『EPUB3::かんたん電子書籍作成』の扉ページ生成に取り入れた。



[04/03 10:13:09] 追記。

https://twitter.com/nakanotaito/status/319118539170643969

iOS版kindleでも中央配置できる。これは裏技ですね。


[更新]2013-04-15 08:47:35

日野裕太郎kindle版無料キャンペーン

2013/3/31 [13:22:23] (日) 天気

日野裕太郎の電子書籍[kindle版]無料キャンペーン情報です。


【4月7日】※ 終了しました


ホラー 『でもほら繁殖するしかないの』(日野裕太郎)

約42ページ(39字x18行) スプラッタホラー中編

※ 血まみれスプラッタが苦手な方にはオススメできません。ご注意ください ※


↓期間中無料です。Amazon、Kindleストアへは、こちらからどうぞ。


・kindle版と同じ内容の同人誌版への感想をtwitterでいただいてます。

https://twitter.com/jumperjungle/status/279773731218411525

https://twitter.com/c_cecile/status/270924800153759744

https://twitter.com/iori8250/status/271078227647287296

https://twitter.com/unyue/status/320835999557111808



【4月1日〜4月3日】※ 終了しました


ファンタジー 『猫神リスペクト』(日野裕太郎・てぃるよし)

約77ページ(39字x18行)ファンタジー連作短編集

https://twitter.com/yomogicat/status/300219684450603009



『猫神リスペクト』は短編集、『でもほら繁殖するしかないの』は中編。どちらもボリューム的に手頃ですので、この機会にぜひよろしくお願いします。


※ ツイートなど使わせていただきました。感想ありがとうございます。

[更新]2026-02-02 07:45:49

<<2026/3>>
       
1234567
891011121314
15161718192021
22232425262728
293031

【最近の10件】

日常読書映画アニメゲーム健康料理グルメカメラ写真ネタ仕事パソコンインターネットperlEPUB3電子書籍ActivityPub還暦生活
検索: