【生成AI】StableDiffusionが公開されてから1年と4ヶ月。みんなで遺伝的アルゴリズムにキャッキャしてたあの頃に戻りたい [792931474]
■ このスレッドは過去ログ倉庫に格納されています
画像生成AIが爆速で進化した2023年をまとめて振り返る
https://ascii.jp/elem/000/004/174/4174570/
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。
初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。
つづく 生成AIのまとまってるサイトなりYouTubeなりいいの教えてくれ
>>1
つづき
https://ascii.jp/img/2023/12/09/3653084/original/fbba3ff6ffe93650.png
Stable Diffusionを使って同じキャラクターを多数の方向から作る技法は、今年の前半には確立されてきました。しかし、Stable Diffusionは確率によって画像が生成される仕組みである以上、データの仕上げに向けて何度も出力して修正を重ねる必要があり、とても面倒だったんです。
ところが、リアルタイム修正ができるようになったことで、画像に一貫性を持たせたまま修正作業ができるようになりました。
何が言いたいかというと、次々に開発される新技術によって、制作者側が目指す意図に合わせて、狙った画像を作れる余地が広がった1年だったということなんです。
「LoRA」と「ControlNet」の衝撃
まず、去年11月に登場した追加学習技術「LoRA(ローラ)」が普及しはじめたのが今年1月のこと。LoRAは自分が生成したい画像を追加学習させる仕組みです。さまざまなモデルデータが登場し、アニメタッチから実写風まで、様々な画風の画像が登場するようになったのもこの頃です。
当時は画像から画像を生成する「image 2 image」しか制御する方法がなかったため、「AIトレパク」も問題になっていました。ただし、低ノイズimage 2 imageによる模倣のトラブルや、LoRAによる特定画家の画風の模倣の問題はいまだに続いています。
2月にはOpenAIのサム・アルトマンCEOが来日。赤松健議員を初めとして、自民党内で生成AIについて本格的に議論されるようになってきたのもこの頃でした。
この頃、画像生成AIにとって何よりも大きかったのがStable Diffusionを様々な方法でコントロールするツール「ControlNet」の登場です。ここから、Stable Diffusionの入力方法としてはテキストプロンプトよりも画像のほうが強力だということが知られるようになってきました。制御という意味では革命を起こしたと言ってもいいですよね。
ControlNetの登場により、構図をコントロールしたり、特定のキャラクターの位置を制御して生成できるようになりました。5月にControlNet追加機能「ReferenceOnly」が登場したことで、画風やタッチも制御可能になり、画風は同じだけどまったく違う絵が生成できるようになりました。
つづく
遺伝的アルゴリズム(2021年1月ごろ公開?)
https://gamingchahan.com/ecchi/exhi/
>>4
つづき
https://ascii.jp/img/2023/12/09/3653086/original/1dce6ec9bec78d1a.png
葛飾北斎「神奈川沖浪裏」をReferenceOnlyで読み込ませ、サーファーを追加した画像(「画像生成AIに2度目の革命を起こした『ControlNet』」より )
https://ascii.jp/elem/000/004/137/4137393/
アドビの台頭と「AIグラビア」問題
画像生成AIが話題になるなか、大手企業として本格的に入ってきたのがアドビ。3月22日に「Adobe Firefly」のベータ提供を開始し、話題になりました(一般提供開始は9月)。
いまだにFireflyの課題としてあるのは、1024×1024ピクセルでの画像しか生成できないこと。大きな画像サイズの場合は生成した画像をアップスケールしているようで、レスポンスは早いものの、画面の端がぼやけてしまうという難点があります。実際にプロが使いはじめると、スケールが小さすぎて使いものにならないことが課題になっています。
おそらくアドビは今後、毎月付与される有料ポイントを使うとディテールを高めるといったオプションを作るのではないかと予想されています。
とはいえ、現状でも削除機能は非常に優秀で、業務のなかでは頻繁に使う機能になりました。要らないものをまとめて消したり、画面の端に足りないものを足したりするのは非常に便利です。
長いので以下ソース
(おわり) やいのやいの言われるの避けて個スレに篭ってるんだよなぁ 生成物を見せられないからな
品評会できないと楽しみも半減だろ 結局お宝フォルダにしまって1人で楽しむのがベストなのよ この記事書いてる奴昔はド地雷のゲームライターだったよな 任天堂贔屓しまくってデマもやらかしまくり
よくAI専門家みたいな面出来るよな 半年まえくらいにはまってた
あの頃はまだloarいれてもちょい似てる程度だったけど今はかなり進化したね
SDのverはあがってるのかな 公開当初はこの辺が限界だろなって思ってたら
どんどん改良されて予想以上の進化を遂げてるわ 未だにchilloutなんだけど最新の環境にしたら奇形出るのは改善されるのか? 動画版Stable Diffusionの論文かなんか最近出てたけどあれどうなったんだよ >>19
majicMIXてモデルが個人的にchillの上位互換かな ブラックアウトしてファンが全開で強制終了するしかなくなる
ドライバまだ治らない どっちがエッチか選択させてエロ画像作るサイトあったよな >>10
これただのモーションセンサーじゃん
お前はただStable Diffusionの延長線がそういうのにつながったから
スゴイスゴイって一人でわめいてるだけで
それと同じ技術自体は
ゲーム制作会社が演者にピンポン玉のセンサー体につけて
ゲームのキャラ動かす何十年も前からやってた技術まんまで
少しもすごいと思わない ■ このスレッドは過去ログ倉庫に格納されています