AIでテキストから画像を生成

いま話題の画像生成AI「Stable diffusion」を使ってみた。
ローカルにダウロードしてPython環境、Anacondaとかを作ったりGitからStable Diffusionのソースコードを持ってくるのは大変なので、とりあえず、googleのcolabで使ってみた。
ほんとだったら、ローカルに構築するのがいいんだけど。
とりあえずアカウントが2つ必要。
・googleのアカウント
→gmailのアカウントで、ほとんどの人はすでに持ってるのでは?
・huggingfaceのアカウント
→これは持ってるひとが少ないと思うけど、簡単に作れる。
https://huggingface.co/settings/profile
わたしのようなド素人のヨタじゃなくて、以下のサイトがオススメ。
Google Colab で はじめる Stable Diffusion v1.4
https://note.com/npaka/n/ndd549d2ce556
[Stable Diffusion] AIでテキストから画像を生成する[Python]
https://www.12-technology.com/2022/08/stable-diffusion-aipython.html
とはいえ、自分メモ。
・huggingfaceでの作業
huggingfaceのアカウントを作ったらhuggingfaceのプロフィールページの左メニューからアクセストークン(ACCESS TOKEN)をクリックしてアクセストークンのページを開いてひとつ新規に生成して取得する。
権限にreadとwriteがあるけど、readで大丈夫だった。
・google colabでの作業
https://colab.research.google.com/?hl=ja
↑ここにアクセスしたらまずは下準備
「ノートブックを新規作成」
素っ気ないページになる。これ、古のターミナルみたいだな。
てのはともかく、やることは以下の4ステップだけ。
1)
「編集」→「ノートブックの設定」→「ハードウェアアクセラレータ」を「GPU」に設定。
2)
次にこの▶のところに以下のコマンドを入力。
!pip install diffusers==0.2.4 transformers scipy ftfy
▶をクリックするとコマンドが実行される。
3)
インストールが済んだら、「+コード」をクリック。
次のコマンドを入力欄を追加してライブラリのインポート…これをしないと、次のフェーズで403エラーになって止まってしまった。
from diffusers import StableDiffusionPipeline
import matplotlib.pyplot as plt
4)
そして以下で準備完了となる。
TOKEN="Huggingfaceで取得したトークンをコピペ"
from diffusers import StableDiffusionPipeline
pipe = StableDiffusionPipeline.from_pretrained("CompVis/stable-diffusion-v1-4", use_auth_token=TOKEN)
pipe.to("cuda")
準備が済んだらいよいよ画像を生成だ。
▶のところに
prompt = "Japanese Bobtail Cat on the Moon" #@param {type:"string"}
image = pipe(prompt)["sample"][0]
image.save("test01.png")
とやってできたのがこの画像
promptがキモ。ていうかAIにどんな画像を作らせるのかAIと話し合いになる。
今回は最初だし「Japanese Bobtail Cat on the Moon」とやってみたけど、そんなに面白い画像がすぐに出てくるわけでもなく、これにしても4回目ぐらい、だったかな。
デフォルト状態で1枚生成するのに20秒ほどだった。
「AIと話し合い」と書いたのはこのリクエストがすべてで、どんな画像を出せるかは話し合い次第。プロンプトをリクエストするひとの腕次第という意味もある。たぶんこの分野、こんな画像が欲しい、というのを翻案して噛み砕いてAIのわかる言葉で伝えるニーズがあるだろうな。
創造とか創作というのは人間や神様だけのものという聖域感がある。
だけど、神様については知らないけど、人間の創造もまったくゼロからというものではなく、いろんなもののインプットの坩堝があって初めてアウトプットが出てくる。
てことはこのAIもやってることは同じ、大量のデータをインプットされて学習したモデルから適当と思しきものを引っ張り出してそれらで合成して作り上げてアウトプットとする。
一部界隈が騒がしいのもわかる気がする。
ほんと、これはひととAIの棲み分け、区別というか、倫理の話にもなりそうだし、SFのネタが現実になりそう。
ちなみに生成した画像は権利関係的にはフリーなので(著作人格権とか肖像権にぶち当たることもありそうだけど)商用利用もOKとのこと。
とりあえずgoogleで使ってみたけど、いろんなパラメータをいじれるはずなのでローカルで構築してみたいとこだなあ…て、今うちで使ってるパソはグラフィックが弱いからパソコン買い替えになるだろうし、当分無理、か。ビンボはつらいぜ、ちくしょう。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
ポケモンGo:宵越しの砂は持たない

レイドバトルが中心となると、高火力・高CPのポケモンが必要となってくる。
砂と飴で強化するんだけど、レベル30ぐらいは最低必要と言われている。強化のための砂が5000必要となって、そこからさらに一度強化するとレベル30らしい。
だけど、わたしは避けスキルがヘボだし、スマホのスペックもしょぼい。となると、レベルをできるだけ上げてHPも上げておきたい。
強化したいポケモンというのが。
バンギラス3体、エーフィ2体、フーディン1体、ゴローニャ1体、カイリュー3体…その他ゲンガーやラプラスなど挙げだすとキリがない。砂がいくらあっても足りない。一日が終わってみれば殘ってる砂は3ケタほどだ。
砂集めがもう大変。
てことで、今日は地元の水元公園を2時間、1万歩ほど徘徊してポケモン狩りをしてきた。
68匹捕獲して、そのうち3匹が青リーダーの評価が「驚異的、芸術的」個体。砂5000(レベル29か30)のミニリュウがそのうちの一匹で即戦力を捕獲できたのが今日唯一の収穫…って、これ以上砂を投入する対象を増やすのは無理なのでしばらく塩漬かなあ。
68匹捕獲→砂6800に、卵孵化の砂も合わせると砂が14000ぐらいになったけど、上記したように1体強化するのに砂が5000以上必要だったりするんで、あっという間。2体強化したら終了。
砂に関しては効率の良い集めかたはなくて
・ポケモンを捕獲する
・卵を孵化させる
・自チームのジムに木の実を配る
この3つを地味地道にやるだけ。歩きまわるだけ。
まだ暑さが酷いけど、これから涼しくなってきたらちょっとはラクになるかなあ。
メタボ解消のウォーキングを兼ねてるんで、歩くのがいいと思いつつ、大人用キックボードなんてのを検索する怠惰な無職初老フリーターだ。
今日収穫のポケモン68匹。
2ページ以降もポッポコラッタパラスコイキングオタチイトマルなんかがぞろぞろ並ぶ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
物書きの執筆道具

テキストでいただけると助かります、ということで、WORDの.docファイルをいただいて、あ、えーと別名保存でですね、ということが1度や2度じゃなくあったりなかったりするし、WEBの表示が妙なので管理ページのソースを確認したらどうやらWORDの文書をコピーして管理ページのビジュアルエディタにペーストしてたり、WORDで書いた小説やエッセイをEPUBにしたいんですけど、という問い合わせはそれこそざらにあるし。
ああ、世間一般、やっぱMSのくそビジネスソフトに使われてるんだなあ、とtwitterにぼんやり書きこんだら。
んなこたぁねえよ、ワードなんぞ使わんよ、たこ。というレスをいただいた。
みなさん、商業作家さんだったり同人作家さんだったり、物書きのかたがた。速攻でレスがついたのは、やはり書き物の道具に関してはこだわりがある、ということだろう。
わたしも初めて知ったエディタなんかもあるんで、ざっくり引用、紹介してしまいます。
ツイートの引用はやめてくれ、ということでしたら遠慮なく気軽におっしゃってください(@t2akii)。また、該当ツイートを削除すればこちらでは表示されなくなります(※キャッシュしてるのですぐには消えません)
(レスをいただいた順に)
野間みつねさん
使用エディタ:
「秀丸」 http://hide.maruo.co.jp/software/hidemaru.html
WEB: 「千美生の里《ちみぶのさと》」
最新刊: 『はたとせ -「千美生の里」20周年自選蒐-』
伊東麻紀さん
使用エディタ:
「秀丸」 http://hide.maruo.co.jp/software/hidemaru.html
縦書き http://hide.maruo.co.jp/software/hidemaru8/edit.html
最新刊: 『崖の上に住む女』
くまっこさん
使用エディタ:
「mi」 http://www.mimikaki.net/mi/introduction/index.html
WEB: 「くまっこにっき」
最新刊: 『綺羅星と星屑』
つむぎゆうさん
使用エディタ:
「OS-Editor」 http://ospage.jp/soft/oseditor2/oseditor2.html
縦書きなどスタイル http://ospage.jp/soft/oseditor2/oseditor2style.html
WEB: 「懐中天幕 楽屋」
最新刊: 『TOKYO SWEET ROOMS(1)』
猫春(にゃんばる)さん
使用エディタ:
「terapad」 http://www5f.biglobe.ne.jp/~t-susumu/
「iText」 http://www.jp-lightway.com/iText.html
WEB: 「ばるけん」
最新刊: 『クッキー・トラベラー』
犬吠埼一介さん
使用エディタ:
「VerticalEditor」 http://kumacrow.blog111.fc2.com/blog-entry-733.html
WEB: 「犬吠崎一介のホームページ」
最新刊: 『割られよ凍てついた王冠よ』
みなさん縦書きのできるものを利用してるんですね(miは縦書きはできないですが、インデザ直打ちという無茶なことをしてるということなので、縦書き認定)
それにどうやらカスタマイズして使っている様子。
「手に馴染ませることができる」のはポイントですねえ。脳内から文字に直結させるためには必須でしょうか。
つけくわえると[08/25 09:54:24]
物書きとしてのキャリアは10年以上、20年以上といったひとたちが辿りついた、使い続けている道具(エディタ)
それだけ、上記したエディタは使い勝手など信用できると思います。
これでは、あまりにワードの立場がなさすぎなので、最後にたぶん世間一般
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
停滞中

電子書籍アプリを app storeにとりあえず公開したものの、文字の滲み・ボケがあったので修正して、再度審査申請中。一週間経ってもまだ絶賛放置プレイ中。今の状態でHappyReadingにバナーをつけたり、twitterなどで告知しても「わ、読みにく!」と思われるので、人通りの少ないこの雑記帖で告知してるだけ。次の収録作品も準備中で、文字のボケを直したものが公開されたら、またすぐに作品を追加して審査申請する予定。
にしてもなあ。年会費を取られてるわけで、審査に10日もかかったひにゃ、文字通り無駄に時間が費やされてしまう。OSのバージョンアップや、新iPhoneなどでリソースが割かれて大変なんだろうけど、もう少しスピーディにやってもらいたい、うううむ。
そういや。いつの時代も同じことの繰り返しには違いないだろうけど。
twitterなどを見ていて唖然としたのが。自分たちで本を作れば粗利が!とか個人で本を作って出せばすばらしい!とか、今、まさに今これが新しい!という記事。おいおい、そんなもの、同人誌じゃ30年以上も前からやってることだぜ、と呆れてしまう。ちょっと調べればわかること。従来の同人誌と今その新しいものが、どこが違っていて、ここが新しい、というのなら面白い・参考になる記事、ツィートにもなるだろうけど、ただただ、語彙貧困、凄いとしか言ってない。薄っぺらで、ただの周回遅れをゲームの先頭ランナーとして持ち上げている。それでキュレーターとかアルファブロガーというらしい。恥ずかしくないのかねえ。
んなこんなで、この一週間は請負仕事の打ち合わせをして、そのための資料を漁ったりしただけで、実際に生産的なことをしてないよなあ。どんなことでも、なにかカタチにしていないと焦燥感にかられる小心者だ、おれ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
満腹のタコ焼き

ふと思いついて、今日はウチでたこ焼き。うまく作れるのか、不安をかかえつつ、とりあえず不恰好でも食えるシロモノにできあがる。ヨメとふたりでふーふーいいながら食い、ふたりともタコ焼きで満腹になった。タコが美味いし、小エビ、揚げ玉、紅しょうがとの相性も抜群で、たこ焼きを考えたひとはエライ、としみじみつくづく。いや、本当に美味かった。こういうのもシアワセというのかもしれんなあ。 FED2 Industar-26M CENTURIA 200
土曜に行った麻布十番納涼祭り。街全体が祭りで舞い上がっている中、ひっそり営業中の喫茶店だかレストランだか。天井が低くて年代モノの建物だった。六本木なんてのが近いせいで、バブリーでチャラいイメージがあったけど、麻布十番そのものは古い街、らしい。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
麻布納涼祭り

ケータイメモでパチっとメモ。
http://holeinthewall.jp/~butch/cgi-bin/ktview.cgi?id=1219471133
土曜は去年も行った麻布納涼祭りにヨメとぶらぶらでかける。雨模様だというのに、街全体が屋台村と化して浮かれまくり。ひとでごった返す中、日本酒を飲んだりパエリアを食ったり、フィッシュ&チップス食ったり、サザエのつぼ焼き食ったり日本酒飲んだり、おでん食ったり地ビール飲んだり、さくら肉のフランク食ったり。ずーっとニマニマ顔が緩みっぱなし。楽しかった。ためしに新しいおもちゃのVivitarウルトラワイド&スリムをもっていったけど、ASA200で曇り空、たぶん写らないだろうと、2~3枚シャッター押しただけ。残念。しかしサザエのつぼ焼きと十四代の組み合わせは神域だった。絶品。来年もきっと行こう。
てな調子で昼間っからずーっと飲んでたので、今日はどんより体調が吐き気る。まいったなぁ。
とりあえず。
Ajaxな「非同期」じゃなく、javascriptで「同期」通信させて、それが済んだら、Ajax「非同期」で取得させて、というのは意図どおりに動きそうな予感。
ただ、「同期」中はページが固まるので、データ更新に時間がかかるようなところには使えない…。データ更新中、とか、表示させないといけないかな。
[08/24 18:55:48]
ダイヤテックのキーボード
Majestouch Tenkeyless 「マジェスタッチ テンキーレス」Nキーロールオーバー・茶軸・かなあり
というのをamazonでポチっと。どうやら明日には届くらしい。
いや、ヨメがつい最近使い出したんだけど、こいつのキータッチが心地よい、てか良すぎ。キーボードとかディスプレイとかインターフェイス部分は好みのものを選んでおいて損はないしね。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」