
「midjourney」とは?
テキストから画像を生成する、画像生成AIの先駆け。
AI(人工知能)による画像生成は、コンピュータが与えられたテキストと学習モデルに基づいて新しい画像を生成する技術です。簡単な命令でも、非常に整った高品質の画像を生成できます。
その中でも「midjourney」は、高品質でリアルな画像生成を可能にする先進的なAIモデルです。
midjourneyの初期の設定については以前の記事で解説しています。まだ作成環境が整っていないようであれば、Midjourney初心者向けガイドからご覧ください。
この記事ではもう一歩進んで、希望の絵を出力するための命令「プロンプト」の書き方について解説していきます。
「midjourney」の基本操作
midjourneyでの画像生成は、入力フォームに目的の画像を表す「テキスト」を入力して作成します。
まずは画像生成を行える「チャットルーム」に入りましょう。
Midjourneyのサーバーにはいったら、左に並ぶ文字の中から『newbies-〇〇』と書かれたチャットルームを探してください。(〇〇には数字が入ります。どこでも好きな場所でOK)

クリックして入ると、世界中の人が生成している様々な画像と、プロンプトを見ることができます。

画像の上部に書かれたテキストが、画像を生成するために使用した命令文「プロンプト」です。
入力フォームから命令してみよう

midjourneyの使い方は簡単。
一番下の入力ウィンドウに[ /imagine ]と入力。
すると、上にコマンドが表示されるのでクリック。
[Prompt]と表示されるので、続けて生成したい画像のテキストを英語で入力します。

なんでもいいので何か言葉を入力してEnterキーを押してみましょう。
Midjourneyがテキストに合わせた画像を生成してくれます。
ダイレクトメッセージを設定する。
画像は生成されましたか?
生成される前にチャットが流れて命令を見失ってしまった(;´∀`)
という方も多いのではないでしょうか。
Midjourney有料プランに契約している人ならばMidjourney Botと1対1でチャットできる『ダイレクトメッセージチャット」を利用することができます。

チャット内の[midjourney Bot]をクリックするとBotのウィンドウが開きます。
一番下のウィンドウになんでもいいので一言入力すると、専用のダイレクトメッセージチャットが開き、他の人に邪魔されることなく画像生成を行うことができます。
**注意**
ダイレクトチャット上では、ほかの人が発言することはできませんが、入力したプロンプトや生成された画像は誰でも見ることが可能です。
誰にも見られないように生成を行うには、最も高いプロプランを契約し「ステルスモード」を使用する必要があります。
Pronptの基本

ダイレクトチャットが開けたら本格的に生成に取り組んでいきましょう。
midjourneyは非常にクオリティの高い画像を簡単な言葉で生成してくれます。
日本語の命令でもそれなりの画像は作れますが、すべての単語を理解できてはいないようなので、基本は英語での入力を行います。
英語と言っても難しく考えることはなく、単語だけの入力でも作成は可能です。またGoogle翻訳などを利用すればだれでも問題なく命令文を作ることができます。

猫のような簡単な単語なら日本語でも生成可能です。
ですが、例えば『女子高生』と『high school girl』ではこんなにも違う画像が生成されてしまいます(;´∀`)

女の子ってだけは理解できてるのかな??
画像の精度を上げる方法

命令を実行すると、一度で4枚の画像が生成されます。
生成された画像が気に入った場合、下のU1~4を押すと、選択された画像が1枚ずつにアップグレードされて再生成されます。
もし気に入った画像がなければ、右端のリサイクルマークを押すことで、もう一度最初から生成をやり直してくれます。
4枚の画像の中に同じテイストでもう少し変化が欲しい場合は、V1~4を押すことで、元の画像のイメージを残しつつ、新たに4枚の画像を生成してくれます。

high school girlのV4を実行した画像。元の絵を残しつつ微妙に変化のある4枚が新たに生成されます。
ちょっと手を加えられる[Remix mode]
入力ウィンドウに[ /prefer remix]と入力すると、Remix modeに入ります。
Remix modeでは、リサイクルボタンやV1~4(バリエーション)を押した際に、プロンプトを書き換えることができるようになります。
不要な命令を消したり、逆に追加することでよりイメージに近い画像に近づけることができます。

日本人(Japanese)を追加すると、もとのイメージを残しつつ、顔つきが日本人風に修正されました。
Remix modeは、もう一度[ /prefer remix]を入力するか、[/setting]画面からも変更することができます。

Pronptの文法
命令文は思いつくままに単語を並べるだけでもそれなりの画像は生成されますが、ある程度のルールも存在します。
文節は[,]で区切る
単にスペースだけでは一つの文節として理解してしまうため、必ず半角の[,]で区切るようにします。
全角の「、」は理解できないようなので半角を使用しましょう。
よりしっかりと二つの文節を区別する場合は[ ABC :: XYZ ]のように[ :: ]を使って区別するとよりしっかりと意味が伝わります。
前に書かれたものが優先される
promptの内容は基本的に前に書かれた内容が優先されます。
命令文を書く場合は重要なものほど前に記述するようにすることで生成の精度を高めることができます。

前に「孤独な女子高生」という命令が入っているため、後ろにある「孤独な男子高校生」の命令は無視されました。
優先度の調整
命令文によってはその部分だけが強調されてしまったり、逆になかなか反映されない場合があります。
その場合、単語の後に[ :: (数値)]を加えることで、テキストの影響を調整することができます。


ロボットと女子高生が共存していたものが、ウェイトを変えることで全く違う画像が生成されました。
ただし、ウェイトの利き方は内容や文脈によってもかなり変化するので、語順の調整や割合の数値を調整しながらいろいろ試すようにしましょう。
体感的にプロンプトの優先度は
「語順 > ウェイト」
のように感じます。
まずは順番を意識してテキストを考えるようにしましょう。
画像の表現を変える
写真のような画像を生成したい場合は、[high resolution photography]など写真画質で生成する命令を加えるようにします。

同じように水墨画風や漫画風なども可能。

イメージする画風の指定は重要なので、必ず入れるようにしましょう。
画像生成を助けるパラメーター
Midjourneyにはテキストのプロンプトのほかに、画像生成の仕様を変更するパラメーターがあります。
今回は特に利用の多い代表的なものだけを紹介します。
今回紹介するのは以下の3つです。
- --no ○○ :ネガティブプロンプト
- --ar A:B :アスペクト比
- --v 1~5.1 :バージョン
画像に反映させたくない情報を取り除くネガティブプロンプト
[ --no ○○ ]
通常のプロンプトとは反対に反映させたくない情報をテキストで記述します。
指の本数が増えてしまう場合や、部分的に取り除きたい要素などを記述します。
記述方法は、通常のプロンプトの後に[ --no ]に続けて記述していきます。複数の単語の場合、プロンプトと同じように[,]で区切って記述できます。

--no tie でネクタイのない女子高生の画像が生成できました。
画像の縦横比を指定する
[ --ar A:B ]
画像の縦横比をA:Bの比率で作成します。
何も指定しない場合1:1の正方形で作成されます。

きれいに生成できるのは3:2や16:9など、
バナーサイズなどのように極端に比率が違う画像を作るとクオリティは低下します。
バナーで利用したい場合は白背景で生成し他画像を、photoshopやCanvaなどほかのサービスを使って組み合わせるようにしましょう。
Midjourneyだけでバナーやロゴを作成するのはかなり困難です(*_*;。
バージョンを指定して生成できる
Midjourneyはバージョンアップするたびにクオリティが上がっています。
だから、基本的には一番新しいものを使用すればいいんだけど、画像によっては前のバージョンのほうが雰囲気に合ったものが生成されるという場合もあります。
日本の女子高生をバージョンごとに生成してみました。


( ゚Д゚)
V1、V2は完全にバランスが崩壊してます・・・
V3でも違和感。
V4になるとかなり改善されるけど、まだ不気味の谷を越え切っていない感じ(^^;)
しかし、V5、V5.1になったら、もう違和感を探す方が難しい。
全く写真と区別がつきません( ゚Д゚)
二次絵に特化したnijiバージョンもある

Midjourneyでは、画像表現を指定することでイラスト調の絵を描くことも可能だが、二次絵に特化した『ニジジャーニー』という派生サービスも存在する。
ニジジャーニー
ニジジャーニーはmidjourneyの派生サービスで、二次元のイラスト生成に特化している。
Midjourneyの有料プランに加入していれば追加で料金を支払うことなく利用することができる。
利用方法はhttps://nijijourney.com/ja/からDiscordのサーバーにアクセスするか、パラメーターで[ --niji4] [ --niji5 ]をつけることで利用できるぞ。

例では英語でテキストを書いているが、ニジジャーニーは日本語で命令することができるのも大きな違い。
詳しくは要望があれば別に紹介しますコメントくださいね。
まとめ
このほかにも細かいテクニックはいろいろあるが、基本的な作り方は同じ。
はじめは公開chatで、ほかの人が利用しているプロンプトを研究したり、ツイッターなどで紹介されているプロンプトを利用して始めるのがおすすめ。
少しずつ作り方のコツを学んでいくことである程度は重い道理の画像が作れるようになります。
まずは思い描くプロンプトで画像を生成して楽しんでみましょう。