ひまつぶし雑記帖

WORD文書(docx)をテキストに

2013/5/29 [11:56:45] (水) 天気

EPUB3制作の下準備として、渡される元データ、WORD文書を大雑把にテキストに変換。

(WORDの文書(2010以降の拡張子がdocx)をEPUB3にするネタでは、以前『WORD文書をEPUB3に変換』https://t2aki.doncha.net/?id=1365130056 に少し書いた)

スクリプトをappにして、Dropboxに保存して客先にいても使えるようにした。
https://dl.dropboxusercontent.com/u/10033521/_epub/CheckDocx.app.zip
(↑mac OSX10.8で確認。デスクトップにでも解凍。ワード.docxをドロップするとデスクトップにテキストファイルができる)

ワード原稿からEPUB3にするために、まず最初にやる作業として以下3点。
・ワードのファイルをテキストデータに変換する。
・テキストデータをxhtmlファイルに流し込んで配置する。
・見出しやキャッチなど適当なクラス(CSS)を指定する。

原稿のワードファイルはいわゆるマークアップされているわけでもなく、小見出しはボールドだったり、キャッチは背景色が黄色だったり、囲みは背景色が赤だったり、その時々でいろいろ。特に決まりもなく原稿ごとでばらばら。

わかっているのは色や文字装飾で指定されてくる、ということだけ。
image
こんな感じ。
このワード文書をxhtmlに流し込むためにワードでテキスト保存すると、色情報や文字装飾情報などがなくなってしまう。

xhtmlに流し込んだ後。ワードで文書を開いてそれを見て色指定などされている該当箇所を、テキストの方で探して確認してクラスを指定していく、なんて二度手間はしたくない。そもそも、ガサツな性格のわたしはほぼ確実に見落とす。
色や文字装飾がされている箇所を(大雑把でいいので)「文字、テキストで指定」しておけば、エディタの置換やスクリプトで一括処理対象にできる。見落としはない。

ということで、ワードの色情報、文字装飾情報を可視化した形でテキストデータにコンバートするスクリプトを作った。
image
こんな感じ。
文字指定にしておけば、スクリプトやエディタでクラスを置換するなり検索して埋め込むなり、かなり扱いやすいものとなるので作業効率があがる。後は、ワードの文書を見ながら、またはデザインガイドラインに沿ってスタイルシートを作れば本文のできあがり。

制作単価が下がってきてるので、少しでも効率よく回さないと、悲しい時給になってしまうんだ。よね。

»電子書籍制作代行についてはこちら

B級グルメにてんやも追加

2013/5/26 [18:07:16] (日) 天気

わたしの地元は、モツ焼き屋が並び、一本80円程度でチューハイは290円程度。いわゆるセンベロ(1000円でべろべろ)地域。相撲の本場所のある時期など、早いところでは4時半開店におじいちゃんたちがカウンターに並んでテレビを観ながらパラダイスだ。

『昭和が残る街、かも。』  あたりに書いた店以外にも、モツ焼きの名店「ぶうちゃん」はレバーの美味さが半端じゃない。ミディアムレアのレバーを塩でいただくとほろほろとした食感、甘みと苦みが同居して口いっぱいに広がる。焼酎で口の中を洗ってさらにもりもりいただける。

てのはともかく、天丼チェーン店の「てんや」だ。
twitterで見かけたライターの安田理央さん( @rioysd )のブログで初めて知った。
『吉野家で飲む・てんやで飲む』https://rioysd.hateblo.jp/entry/2013/04/26/140455

記事を読むだけでヨダレもの。吉野家やてんやといった「ファストフードのチェーン店で飲む」というのがツボだ。目から鱗というか、これも「あり」だよなあ、と。

地元の吉野家はもろ駅前で、カウンターだけだし狭いのでちょっと難しい。近場のてんやを探して行ってみた。

image
「生ビールセット」550円也。生ビール中ジョッキと、天ぷらは海老、イカ、インゲン、ナスの4品。食事としてはボリュームが足りないけどツマミには最高だった。(電卓を叩くと。生ビール中ジョッキは390円なので、天ぷらは4品で160円)

揚げたて熱々さくさくの天ぷらだ。
不味いワケがない。さくっとかじってビールを飲む。これで550円だから文句なし。街の天ぷら屋で食べると美味いのも「揚げたて」だからという理由が、たぶん8割だろう。作り置きの総菜の天ぷらとは次元が違う。

日を改めて、今日はビールセットではなくて、普通に野菜天丼と生ビール。
image
これはちょっと難しい。というのも野菜天丼はレンコン、舞茸、インゲン、ナス、カボチャ、サツマイモが乗っている。
サツマイモとカボチャのキャラがかぶっていてビールを飲みながらだとボリューム的に多すぎ。もう爺なので半分ぐらい食ったところでお腹がいっぱいになってしまった。

次は天ぷら盛り合わせとそばにして日本酒でいってみよう。

古い記事だけど
『ファーストフードでビールを飲もう』https://portal.nifty.com/kiji/111114150599_1.htm
こんな記事もあったのか!

»電子書籍制作代行についてはこちら

めも:Windows7でunixコマンド他

2013/5/26 [06:57:30] (日) 天気

unixのコマンドをWINDOWSでも使いたくて、10年以上前はCygwinをWINDOWSにインストールして使っていた。当時はFreeBSDを普段使っていて、仕事でWINDOWSやMac。

仕事の方でもホームページ(当時はWEBサイトではなくホームページ)を立ち上げたり、進行管理のためのCGIを作るようになってActive perlをインストール。となるとコマンドラインでいつものように cp ls grep diffなんてのを叩いてしまう。そのたびに見つからないと叱られるので、Cygwinをインストールして使うようになった。

で、今。普段使うMac OSXはもともとBSDで、unixのコマンドがそのままある。rubyやapacheまである。FreeBSDのGUI環境の X がたまたま Mac になっただけ。

請負仕事の電子書籍制作。
現状では、元のテキストやワードに合わせて、perlの使い捨てスクリプトを書き散らかしている。現物合わせのやっつけ仕事で、Mac OSX のターミナルでコマンドをガシガシ叩いている。

たとえば制作途中のものをWINDOWS7のネットブックに移して続けるにはunixのコマンドが必要になる。非力なネットブックにCygwinはつらいなぁと思ってたところ、unixの主要コマンドを使えるようにしたGOWというプロジェクトがあった。

https://github.com/bmatzelle/gow/wiki

awk ls cp vim grep zip bash など普段使いのコマンドが一通り入っていて大助かり。多謝。
これでネットブックのコマンドラインがストレスなく使えるし、使い捨てスクリプトから使うcp などのコマンド表記をそのままでOKなのでいちいちWINDOWS用に書き換える手間がなくなった。


*****


ワードの .docx ファイルから取り出したdocument.xmlを読むのに重宝しているperl の Data::Dumper 
便利なんだけど、日本語(ユニコードの文字)が文字化け(ではなく、16進数表記)になって出力されるので読めない。気になる該当箇所がどこなのかぱっと見ただけではわからない。
(ord(あ) → 文字コードにして → sprintf %x → 文字コードを16進数にしているらしい)

前から困ってたんだけど、なんとなくその場その場で解決したので放置。
ここにきてWORDの文書をEPUB3にすることが増えてきたので、さすがに検索した…ら、みな困っているのかスグにヒット。

ふたつ方法があるらしく、まずは自分のわかりやすい方を採用。


いろいろ。ちょっと快適。image 

»電子書籍制作代行についてはこちら

Google Play Booksで個人出版

2013/5/23 [09:56:45] (木) 天気

『酒を片手に庭に出る』をGoogle Play Booksでも販売開始(無料ダウンロード)

Google Play でも個人出版ができる。

Now On Sale! (無料)  『酒を片手に庭に出る』(日野裕太郎)
image
同じく個人出版ができる、 Kindle KDPやiBookstoreと違って、EINやW8BENは不要で銀行口座も手数料のことは考える必要はない。すっかり日本でのビジネス。

ということで登録してみた。

【アカウント開設 銀行口座登録】

・Google ブックス パートナープログラム(β版)
 https://books.google.com/partner/

アクセスしてアカウント開設といっても、普段使いのGoogleアカウントでOKだった。
(入力項目に関しては、アドセンスやアドワーズをやってれば見当がつく)
登録するのは「住所」「氏名」「電話番号」、有料販売もしたいのでアカウントは「ビジネス」に設定。

「電子書籍の支払い設定」で、振り込み銀行口座とNNNN円以上だったら振り込みという設定をする。銀行口座確認のため、Googleから小額振り込みされるので、その金額を入力して銀行口座の登録完了。

【本の登録】
※ 今日時点、管理ページはベータ版なので、スクリーンショットは撮りません
アカウントなどの登録が済むと、本やベンダーなど各種登録のページに行く。

・シリーズ/ブランド設定

サンプルとしての閲覧率や販売対象エリアの設定などここでデフォルト値の設定をする

・デフォルトの設定

ここでも、各国でのデフォルト設定をする。
さらに、ここでDRMやデフォルトの価格、ISBNがない場合の設定などをする。

・書籍の追加/更新

ここで本を登録する。罠がひとつ。
登録フォームにISBNを入力する項目がある。個人出版でもISBNを取得している人もいるけど、わたしは取っていないので空欄…だとエラーで先に進めない(このフォームはISBNを持って流通している書籍が前提)

・書籍のアップロード/郵送

まず最初にEPUB3ファイルをアップロードすればISBNがなくても大丈夫。
ファイルの命名規則とあるけどPDF前提のようで、EPUB3の場合はそのまま(ねんのため、ファイル名は半角英数字だけにした)アップロード。

たぶん、次の日。Google Play でのコードが振られてアップロードした本が管理ページの一覧にリストアップされていた。

・書籍の管理

ステータス異常を起こしてる項目があった。著者名が空欄になっていたので、そこに著者名を入力したら、ステータスが「処理中」となった。

ここで5日程放置されたので、メールで問い合わせしたら、翌日返信がきて「掲載中」となった。

え?まだ価格設定もしてないのにどういうこと?とメールに記載のURLにアクセスすると、たしかにサンプルが読める状態になっているけど「電子書籍がありません」という表示も。
また、Google playのストアで検索しても出てこない。販売されてるようには見えない。

再び問い合わせメールをしつつ、管理ページを見ると。
Google eブックスのタブに「書籍の管理」ではなくて「電子書籍の管理」というリンク。

・電子書籍の管理

該当する本の鉛筆アイコンをクリックすると本の細かな設定画面に移る。

以下の項目のチェックボックスにチェック。
「この書籍の Google eブックスでの販売を有効にする」
「送信した ePub 内にフロー テキストがある場合にのみ、フロー テキストを表示します。」

以下の項目のチェックをはずした。(たぶんPDFのための設定)
「元のページを含めます」

価格設定などはこっちのページだった。

以上の手順で、登録から放置期間を経て、6日ぐらいで公開となった。


*****


現状の管理ページはβ版というだけあって、ひどいありさま。どこに何があるのか意味がわからないし、クリックして良いんだか悪いんだか何が起こるんだか、とてもわかりにくい(管理画面ひどいですよ、メールベースのやりとりが必要で、今かなりリソースを割いて改良してるという話です、と事前にちらっと某社で聞いていた)

憶測だけど。
ベースがPDFのアップロードか印刷本の郵送。そこに電子書籍(EPUB)を登録するクチを増改築したもんだから、わけわかめ状態になった、と思われる。

image
紙印刷本と電子書籍のタブが別にあって、その下に並ぶ項目は内容としては紙も電子も同じようなことをするためのものなので、混乱の元。

Googleのことだからスグに改良されてほぼ全自動CMSになると思う。なので、この記事はあくまでもβ版の今日時点の話。改良されて使いやすくなってから登録したほうがきっとらくちんです。


*****


Nexus7のGoogle Booksでのスクリーンショット。
image

既刊一覧は、Amazon Kindleストアの販売ページ=本の詳細ページへのリンクへとなっている。
image
image
iOS版は、KindleもGoogleBooksもAmazonへのリンクは殺されるんだけど、AndroidのGoogleBooksはAmazonへリンクしてChromeで開いてくれる。
読者・ユーザーのことを考えるとこれが正しい動作。

このリンクが生きるなら、kindle本の販促に使える。
(もっとも、Google Play Booksの集客力は、もれ聞く限り期待できないんだけどね)

»電子書籍制作代行についてはこちら

論理目次と視覚目次を別にする

2013/5/22 [15:36:21] (水) 天気

先日「目次にルビをつけてください」というリクエストにのけ反った。

『電子書籍の目次が難しい』https://t2aki.doncha.net/?id=1366594374
この時、教えてもらって、論理目次と視覚目次を別に作って対応。忘れないうちにメモしておこうと、すっかり忘れてたので改めてメモ。

EPUB3の目次は2種類。
・デバイスやアプリで使うための「論理目次」
・画面に表示するための「視覚目次」

たぶん、ひとつの目次ファイルを両方に使うことが多いと思う(って、 『EPUB3::かんたん電子書籍作成』  が、ひとつの目次ファイルを論理目次と視覚目次に使っている)

でも、論理目次は使えるタグが限られていて、ルビタグなどはエラーになる。

そこで、論理目次とは別ファイルで視覚目次用のファイルを作る。こっちは本文のページと同じくxhtmlファイルとして使われるので、ルビタグも使える。

・パッケージファイル content.opf

manifestで視覚目次も指定しておいて、spineでは視覚目次を入れて、論理目次を外してしまう。

・ナビゲーション文書 nav.xhtml

ナビゲーション文書の目次部分(toc)には、視覚目次を入れておく(目次に「目次」という項目があるのはイヤなので display:none として、ここでは表示させないようにした)
landmarks 部分に視覚目次を指定しておく。

・視覚目次 display.xhtml
視覚目次はナビゲーション文書のtoc部分(olタグ)だけのファイルで、ルビなどのタグが使える。

クライアントからのリクエストはこれで解決だった。

こうすることで、レイアウト・デザインが自由にできる目次が可能だけど、目次をふたつ持つことで間違いの元がひとつ増える。本当はひとつで済ませたいところだったなあ。

»電子書籍制作代行についてはこちら

ibookstoreで無料販売

2013/5/21 [09:49:35] (火) 天気

image
【iBookstoreで無料公開】『酒を片手に庭に出る』(日野裕太郎)
格安家賃の庭付き一軒家。引っ越したその夜にひとりで酒を飲んでいると、家賃が格安である理由がそこにいた!?
少し不思議な怪異譚。

5分で読める掌編です(38字x18行一般的な文庫サイズで7ページほど)

iBookstore → https://itunes.apple.com/jp/book/jiuwo-pian-shouni-tingni-churu/id649219629?mt=11

image

『日野裕太郎掌編をEPUB3で無料配布』
↑dropboxでも配布中のものと同じです。
ibookstoreで無料ダウンロードすると、本棚機能、同期などが使えるので便利かもしれません。


iBookstoreは、kindleのKDPのように無料販売するための制約がなくて、価格設定でゼロ円(Tier 0)にすればOKだった。
無料頒布を気楽にできるなら、他の無料頒布したものもiBookstoreで公開するのがいいかも(販売力、周知など、現状はたぶんkindleがダントツで次が確かiBookstoreという記事もあった)

»電子書籍制作代行についてはこちら

profile

profile

 
doncha.net
contact:
»運営者
@t2aki@tokoroten.doncha.net

ところてんx5

2024/4/25 00:49

だめだ。PDFをWordで開いたらレイアウトが微妙にくずれて行数が正しくない。かえって間違いのもとだ。

2024/4/24 13:43

pdfをWordで開いてみる手もあるか。空行、1ページの行数とか、pdfのまんまだったら行数表示で問題解決。だけど、実際どうだろ。帰ったら試す

2024/4/24 12:58

空行は目視しか確認方法がない…
windowsで半透明にするフリーソフトを見つけたので、各ページの幅で検知する。
全ページの行数を数えてたんじゃ絶対漏らす。そんな集中力はないわ

検索
<<2013/05>>
   1234
567891011
12131415161718
19202122232425
262728293031

リンク

WINDOWS版サウンドノベル
おかえりください PC WINDOWS版サウンドノベル
『おかえりください』体験版

[3 Page] »
1 2 3

TOTAL:2982

2024 (5)
1 (2)
2 (2)
3 (1)
2023 (53)
1 (1)
2 (5)
3 (1)
4 (1)
5 (3)
6 (9)
7 (9)
8 (6)
9 (5)
10 (3)
11 (2)
12 (8)
2022 (16)
1 (1)
3 (2)
6 (2)
7 (1)
8 (4)
9 (2)
10 (1)
11 (2)
12 (1)
2021 (12)
1 (3)
2 (1)
6 (1)
8 (2)
9 (1)
10 (1)
11 (2)
12 (1)
2020 (18)
1 (2)
2 (6)
4 (1)
6 (1)
7 (2)
8 (2)
12 (4)
2019 (17)
1 (3)
2 (4)
3 (2)
4 (2)
5 (1)
6 (1)
8 (1)
10 (1)
12 (2)
2018 (21)
1 (3)
2 (2)
3 (2)
4 (1)
5 (1)
6 (6)
8 (1)
9 (1)
10 (2)
12 (2)
2017 (32)
1 (2)
2 (1)
4 (2)
5 (1)
6 (6)
7 (3)
8 (5)
9 (3)
10 (2)
11 (2)
12 (5)
2016 (41)
1 (5)
2 (5)
3 (2)
4 (3)
5 (4)
6 (6)
7 (2)
8 (2)
9 (3)
10 (1)
11 (4)
12 (4)
2015 (99)
1 (11)
2 (12)
3 (9)
4 (6)
5 (8)
6 (8)
7 (3)
8 (5)
9 (16)
10 (6)
11 (1)
12 (14)
2014 (112)
1 (16)
2 (5)
3 (6)
4 (12)
5 (16)
6 (19)
7 (9)
8 (6)
9 (4)
10 (8)
11 (6)
12 (5)
2013 (145)
1 (24)
2 (15)
3 (18)
4 (23)
5 (14)
6 (11)
7 (7)
8 (11)
9 (5)
10 (4)
11 (6)
12 (7)
2012 (103)
1 (1)
2 (1)
3 (4)
4 (3)
5 (7)
6 (26)
7 (17)
8 (5)
9 (8)
10 (10)
11 (11)
12 (10)
2011 (54)
1 (4)
3 (7)
4 (4)
5 (14)
6 (6)
7 (3)
8 (3)
9 (1)
10 (4)
11 (2)
12 (6)
2010 (70)
1 (12)
2 (7)
3 (6)
4 (6)
5 (3)
6 (10)
7 (6)
8 (4)
9 (3)
10 (4)
11 (3)
12 (6)
2009 (144)
1 (15)
2 (12)
3 (12)
4 (6)
5 (15)
6 (6)
7 (10)
8 (9)
9 (17)
10 (12)
11 (14)
12 (16)
2008 (148)
1 (10)
2 (6)
3 (10)
4 (11)
5 (13)
6 (10)
7 (13)
8 (19)
9 (18)
10 (12)
11 (13)
12 (13)
2007 (106)
1 (7)
2 (5)
3 (3)
4 (7)
5 (5)
6 (9)
7 (8)
8 (13)
9 (18)
10 (11)
11 (8)
12 (12)
2006 (158)
1 (28)
2 (28)
3 (25)
4 (7)
5 (9)
6 (7)
7 (12)
8 (13)
9 (10)
10 (7)
11 (6)
12 (6)
2005 (350)
1 (31)
2 (26)
3 (26)
4 (27)
5 (29)
6 (30)
7 (32)
8 (30)
9 (30)
10 (32)
11 (29)
12 (28)
2004 (292)
1 (24)
2 (24)
3 (29)
4 (27)
5 (28)
6 (25)
7 (26)
8 (24)
9 (12)
10 (19)
11 (26)
12 (28)
2003 (318)
1 (22)
2 (25)
3 (21)
4 (28)
5 (28)
6 (28)
7 (28)
8 (29)
9 (26)
10 (29)
11 (28)
12 (26)
2002 (317)
1 (29)
2 (26)
3 (26)
4 (25)
5 (28)
6 (30)
7 (27)
8 (21)
9 (25)
10 (27)
11 (28)
12 (25)
2001 (277)
1 (17)
2 (21)
3 (23)
4 (20)
5 (31)
6 (18)
7 (26)
8 (25)
9 (29)
10 (19)
11 (24)
12 (24)
2000 (53)
6 (9)
7 (4)
8 (2)
9 (3)
10 (1)
11 (15)
12 (19)
1999 (3)
7 (1)
10 (2)
1998 (18)
9 (9)
10 (7)
11 (2)