神絵を描くAI「Midjourney(ミッドジャーニー) 」がV5にアップデート、注目ポイントまとめました

実写との区別はほぼ不可能なレベルに

文字で画像を生成できるMidjourney(ミッドジャーニー)が、5度目のアップデートを実施し、最新バージョンV5アルファ版をリリースしました。

Midjourney V5では、まるで実在するかのような、リアルな仕上がりや質感が話題となっています。「指や歯などがうまく描写できない問題」も、解決されているようです。

肌などの質感がぐっと上がったv5アップデート
肌や目などの質感、きれいな歯並びも改善された(クリックで拡大)

Midjourney V5を実際に使うことで分かった、押さえておきたい新機能や注目ポイントを、備忘録メモ的にまとめています。

何を生成するかは、入力する文字次第(クリックで拡大)

Midjourney 5はサブスクユーザー限定の先行リリース

Midjourney V5を利用できるのは、現在サブスクユーザーのみ。有料プランの特典として、プロンプトをまとめた雑誌を無料で一冊プレゼント中。クーポンコード「SUBSCRIBER」と入力すれば、$4がタダに。

有料プランでは、midjourney雑誌を一冊無料プレゼント中
クーポンコード「SUBSCRIBER」で無料に

Midjourney 5の使い方

最新バージョンV5を使う方法は2通り。ひとつはプロントの最後に、–v 5と直接入力し、画像生成を行う方法。もうひとつが以下のコマンドを入力し、現在の設定を確認、変更する方法。

「バージョンを4に戻したい」、そんなときにもおすすめ。

/settings
how to change settings for midjourney
使っているバージョンを確認したいときにも便利

ミッドジャーニーの使い方ガイドで紹介した、ボットとのダイレクトメッセージ対話による画像生成とは他に、便利な使い方がもうひとつ。

サブスクユーザー限定となりますが、自分のDiscordサーバーを作成し、Midjourney botを招待することもできます。これなら用途別にチャンネルを振り分け、利用することが可能。

Midjourneyのプロンプトに関するよくある質問は、Discordサーバーチャンネル「#prompt-faq」にまとめられています。

Midjourney V5アップデートについて

今回のアップデートで変更された仕様のなかで、注目ポイントをいくつかピックアップしています。すでに次のアップデートも言及されており、V6は2ヶ月後にリリース予定となっています。

すべての画像が高画質で生成される

ミッドジャーニーで生成する画像が、すべて高解像度になりました。これまで1分ほどかかっていた画像拡大Upscaleも、ボタンを押すと同時に完了です。

生成される画像は、4枚ともすべて高解像度に

よりリアルな画像が表現できるように

多すぎる指や歯なども、最新バージョンでは限りなく正確に生成できるようになりました。

このアップデートでもっと変化した点として、肌の質感がリアルなほど忠実に再現できるのも特長でしょう。

肌の質感がとてもリアルな印象になったバージョン5
歯の並び方や指の数なども正確に生成されるようになった

プロンプトの文字入力にも変化

自然言語処理(Natural Language Processing)が改善したことで、生成したい画像に関連するキーワードを、「,(カンマ)」で区切って生成していた、これまでのプロンプトの書き方では、残念な結果になってしまうことも。

学校で習うような英文、英作文を意識してプロンプトを入力するようにしましょう。

生成したいキーワードは区切るのではなく、よりナチュラルな英文法が好まれる
Hummer H1 standing dirty in the jungle, moisture and haze in the air, professional vibrant grading, soft shadows, no contrast, clean sharp, focus, commercial photography --ar 6:4  --v 5

前バージョンも利用可能

ミッドジャーニーのバージョン5では、これまでと同じプロンプトでもスタイルが変わってきます。用途や好みによっては、「バージョン4のスタイルが表現したい」というときもあるでしょう。入力するプロンプトの最後に、–v 4を追加することで、旧バージョンをいつでも利用できます。

V4はデジタルイラストっぽい見た目、V5はよりリアルな写真のような仕上がりに

ディテールを詳しく表現するプロンプトが必要に

バージョン4までは「8K」や「Unreal Engine」などを、プロンプトに追加することで、よりリアルな質感を表現していました。しかしバージョン5では、「Cinematic Lighting(映画のような照明)」といった、より詳しい描写が必要になります。

「ロサンゼルスを見下ろす、崖の上にあるミッドセンチュリーのモダンな家で、雑誌Dwellに掲載されているようなエディトリアル写真。」というプロンプトで生成された画像

自由なアスペクト比が利用可能に

これまでは生成する画像の縦横比に制限がありましたが、バージョン5からは自由になりました。これによって「1:3」など、ポスターのような魅力的な構図にも対応できます。

「1:10」といった、細長い線のようなレイアウトを試しているユーザーも。インフォグラフィクスの作成などにはいいかも。

縦に長細い構図なども生成できるようになり、アスペクト比は自由に

継ぎ目のないパターンが作成できるように

ミッドジャーニー最新版では、継ぎ目のないパターンが作成できるようになりました。プロンプトの最後に、–tileを入力するだけで、シームレスな画像が生成できる、覚えておきたいコマンドのひとつ。

継ぎ目のないパターンテクスチャも生成できるように
a colorful galaxy tiled with stars, planets, and spaceships --tile  --v 5

意味不明な文字はまだあります

ミッドジャーニーでの画像生成の精度は上がっていますが、生成される文字テキストにはまだまだ改善の余地がありそうです。表示される文字列はでたらめですし、日本語テキストにもまだ未対応なので、これからのアップデートが楽しみ。

「道路脇にあるリアルな道路標識と警告テキスト」というプロンプトでは、意味不明な文字列が生成された

絵文字もいけます

プロンプトに絵文字を入力するだけで、画像生成もできます。以下は、「🌈🏟」と入力した場合。

絵文字のみで生成された画像(Midjourney V5)

以下は同じプロンプトを、バージョン4で生成した場合。好みはありますが、バージョン5は本物の写真のようなリアルさが、これまでとは全く異なります。

Midjourney V4はデジタルイラストっぽい雰囲気

Midjourney 5 x ChatGPT-4の合わせ技

ユーザーの中には、こちらも先日アップデートされたばかりのGPT-4で、Midjourneyのプロンプトを考え、画像を自動生成するという合わせ技も披露する人も。GPT-4にまず、Midjourneyの仕組みを学習させることで、プロ写真家が撮影したようなプロンプトを実現しています。

GPT-4にプロンプトを考えてもらい、画像を自動生成を行います

Midjourney利用ガイドをまるっとコピーし、GPT-4に読み込ませることで、プロンプトの生成方法を学習させます。実際に試してみたところ、「美味しそうなパスタ」というテーマで生成された画像がこちら。

「美味しそうなパスタ」をテーマにGPT-4が生成したプロンプトを利用

まるでプロのカメラマンが撮影したような、AIが自動で生成したとは思えないほどのクオリティー。これまでコストがかかっていた料理の写真も、だれでも手軽に作成できる時代がくるかもしれません。

奥には本物そっくりなオリーブオイルやパセリなども生成された本格的なつくり

GPT-4が生成したプロンプトを使った画像をもう一枚。「1930年代の女性インフルエンサー(1930’s Female Influencer)」をテーマに。

1930年代の女性インフルエンサーをテーマに作成した画像
GPT-4は明言していない時代背景も、見事に反映したプロンプトを出力

GPT-4にMidjourneyについて適切に学習させることで、時代背景にもあったクラシックカーを前に、美しい女性がポーズをとる姿が生成されました。

最後は「バレリーナ」という、シンプルなキーワードで生成されたプロンプトを利用したケース。照明の当たり方などにも注目です。

指先や足も見事に生成されたバレリーナ

現在Midjourney V5はテスト段階で、サブスクユーザーのみが利用可能となっています。

Midjourney関連の最新情報は、Discordサーバーで公開されています。

Midjourneyのキホンの使い方はこちら。

Midjourney(ミッドジャーニー)で思い通りに画像生成できる徹底ガイド

Midjourneyのウェブ制作での活用術もまとめています。

画像生成AIでウェブサイトやUIデザインを生成するコツ

Midjourney x ChatGPTでWebページ作成も試してみました。

Chat GPTをつかってWebランディングページを作成するコツ