MidjourneyでAIアートを作る: 機能、比較、法的考察

David Holz(Leap Motionの共同創業者)率いるMidjourney AIは、プロンプトと呼ばれる自然言語記述を用いてビジュアルを作成するジェネレーティブAIサービス。2022年7月12日にカリフォルニアで設立され、2022年2月に最初のモデル「V1」を発表。V1は、同社が正式に法人化し、要素を開始する前に、アーリーアダプターがAIアートジェネレーターを試すことを可能にしました。2023年11月現在、Midjourneyのユーザー数は1,640万人を超え、デイリーアクティブユーザーは120万人と250万人。しかし、AIジェネレーターの競争が激化しているため、Midjourneyの成長はここ数カ月で鈍化しています。

Midjourneyは OpenAIのDALL-E やStability AIのStable Diffusionに似ている。ユーザーは、キャラクター、画像、描写などのユニークなアートワークを生成することができる。

Midjourney AIは、クリエイティブな表現の新たな可能性を開き、予測不可能なクリエイティブな要素を示すアウトプットを生み出す。Midjourneyは、Stable DiffusionやDALL Eと異なり、インストールすることはできません。代わりに、Discordを通じてのみアクセスすることができます。

Midjourney (旅の途中)とは?

Midjourney (旅の途中) は2022年7月12日からオープンベータ版となっている。ユーザーはDiscordのボットコマンドでテキストベースのシンプルなプロンプトを使用して高品質のアートワークを生成することができる。利用にはDiscordのアカウントが必要だが、ソフトウェアやハードウェアは必要ない。Midjourneyのウェブサイトには、”新しい思考媒体を探求し、人類種の想像力を拡大する独立した研究所 “と説明されている。

ミッドジャーニーは、新しいバージョンで画質とユーザー・コントロールを改善し続けている。V5.2は2023年3月にリリースされたミッドジャーニーの最新モデルである。V5から3ヵ月後、V5.2のインクリメンタルアップデートからわずか1ヵ月半後に登場した。ある報告によると、Midjourneyユーザーの50%が主にMidjourneyのためにDiscordにアクセスしており、このアートAIジェネレーターに興味を持つ新規ユーザーを引き込む能力があることを示唆している。

MidjourneyとDALL-E 3の比較

DALLE 3もMidjourneyもAI画像を生成します。しかし、品質、使いやすさ、パワーとコントロールに関しては、両者には大きな違いがあります。

DALLE 3が卓越した画像を生成するのに対して、旅の途中はプロンプトの詳細が時折欠落するものの、同様の画像を生成する。DALLE 3はOpenAIから直接アクセスできますが、旅の途中で画像を作成するにはDiscordにアクセスする必要があります。DALLE 3は1024×1024の解像度の画像を生成しますが、旅の途中は1792×1024の画像を生成できます。

Midjourneyは、ユーザーがパラメータを設定し、画像を編集し、アップロードされた複数の画像の「コンセプトと美学」を組み合わせることができる、より強力なものです。DALL-E3には同様の編集機能はありません。ChatGPTに編集を依頼しても、新しいプロンプトで新しい画像を生成するだけです。ChatGPT Plusの一部として、ユーザーは月額20ドルのサブスクリプションでDALL-E3にアクセスできます。しかし、DALLE 3はBing Image Creatorを通して無料で利用できます。Midjourneyは月額10ドルからのベーシックプランで、200分のGPU時間を利用できる。ユーザーは、バリエーションを作成し、画像をアップスケールすれば、GPU時間をより早く消費できるかもしれない。

Midjourneyの使い方  

Midjourneyへのアクセスは、Discordアカウントからのみ可能です。Midjourneyを使ってユニークなAI生成画像を作成する方法は以下の通り。

Discordにサインアップする

Discordは元々、多人数のゲーマーとゲームの戦術を調整したいゲーマーのために設計されました。これは、ゲームグループや趣味のコミュニティ、その他の芸術の間で人気があります。これがMidjourneyがDiscordを使う理由です。Midjourneyを利用するには、Discordアカウントにサインアップしてください。

Discordアカウントを持っているユーザーは、https://www.midjourney.com/、”Join the Beta Button “をクリックするか、Discord | Your Place to Talk and Hang Outにアクセスしてください。Discordアカウントを持っていない場合は、登録して無料アカウントを作成し、Midjourney Discordサーバーに参加してください。Midjourney Discordはウェブ、モバイル、そしてデスクトップアプリケーションからもアクセスできます。

サブスクリプションプランを選択

Discordアカウントの準備ができたら、Midjourneyのウェブサイトに行き、”Join the Beta “をクリックします。MidjourneyのDiscordチャンネルへの招待状が届きます。招待を受け入れる」をクリックしてください。

その後、ユーザーはMidjourneyのいずれかのプランに加入する必要があります。MidjourneyのようなDiscordボットとやりとりするには、スラッシュ(/)コマンドを入力する必要があります。プランを選択するには、メッセージ欄に「/subscribe」と入力してエンターキーを押す必要がある。

2022年7月のローンチ時には、ユーザーは無料で25枚の画像を生成できた。しかし、Midjourneyは2023年4月に無料トライアルを一時停止した。現在のところ、短期間のプロモーション期間を除き、無料では利用できない。

料金プランは10ドル、30ドル、60ドル、120ドルから。加入すると、ユーザーは新人ルームのひとつに向かうことができる(例:#newbies-14、#newbies-44)。

最初の画像を作る

初心者チャンネルで、”/”の後に “imagine “と入力すると、Midjourneyが必要な画像を生成します。

例 /imagineプロンプト: 「着古した服装の美しい若い女性が、部分的に水に浸かり、ゴミに囲まれている、詳細でリアルな写真。プロの500px写真を彷彿とさせるような複雑なポーズであること。”

ユーザーが有料プランにサインアップしていて、他の人が常にプロンプトやリクエストを投稿するカオスを望まない場合は、Midjourneyボットにダイレクトメッセージを送ることができる。

画像の編集と保存

生成された画像には、その下に8つのボタンがあります。

  • 最新モデルは1024 x 1024 pxのデフォルト解像度で画像を生成し、Uボタンは主にこれらの画像をさらに修正したり、簡略化して保存するために切り離すために使用されます。
  • V ボタンは、選択した画像のスタイルと構図を維持したまま、4 つの新しいバリエーションを生成するように設計されています。- さらに、”Re-roll “ボタンは、元のプロンプトを再実行することで、4つの新しい画像を再生することができます。

Midjourneyの最新バージョンでは、Uボタンを使用することで、追加機能がアンロックされます。主な機能は以下の通り:

  • Midjourney5.2から導入された “Vary (Strong) “と “Vary (Subtle) “は、選択した画像の4つの新しいバージョンを作成します。
  • 「ズームアウト2倍 “と “ズームアウト1.5倍 “は画像の表示を拡大し、オリジナルの入力とMidjourneyの既存の作品に基づいた追加コンテンツを作成します。
  • 「カスタムズーム “は、ズームアウトしながら、補助的なプロンプトを組み込むことができるユニークな機能を提供し、画像を壁に額装されたアートワークとして表示するようなシナリオを可能にします。
  • 4つの方向矢印で表される「パン」機能は、コンテンツと最初のプロンプトに従いながら、指定した方向に画像を拡大します。ある方向にパンを開始した後、後続のパンも同じ方向のパスに従わなければなりません。
  • “正方形にする “は、パンされた画像を正方形に変換するように設計されています。

これらのツールを試すことで、生成された画像を広がりのあるシーンに変換することができます。ただし、「パン」は1024×1024pxを超える画像を生成できますが、「ズーム」は1024×1024pxを超える画像を生成できないため、元の画像よりも解像度の低いズームアウト画像が生成されることに注意が必要です。

効果的なMidjourneyプロンプトを書くには?

AI生成ツールから良い結果を得るための本当のコツは、効果的なプロンプトの書き方を学ぶことです。Midjourneyでは、優れた想像力だけでなく、完璧な「プロンプト」を指定する技術も習得する必要があります。Midjourneyのプロンプトを書くためのテクニックをいくつか紹介しよう。

具体的に書く

プロンプトを書くときは、詳細かつ具体的に書きましょう。量や参考文献を指定する際には、強く強調する言葉を使いましょう。プロンプトで使われるキーワードは、AIが意図するテーマやコンセプトに焦点を合わせるためのものです。

さまざまなアートスタイルを知る

イメージのスタイルをよく理解することで、それに応じてプロンプトを調整することができます。イメージスタイルには、シュルレアリスム、キュビズム、リアリズムなど、さまざまなものがあります。印象派を深く理解することで、豊かなテクスチャーを持つ高品質の画像を作成することができます。高度なプロンプトとアートスタイルを知ることで、創造性とテクノロジーを融合させましょう。

被写体を描写する

鮮明な出力画像を作成するために、すべての被写体の詳細を記述します。カメラのタイプ、レンズ、設定、アスペクト比、あるいは推奨事項まで指定してください。被写体ごとにテキストで説明することで、AIモデルが画像の各要素の本質を確実に捉えます。

参照画像プロンプトの提供

Midjourneyの”/describe “機能は、画像を新しいビジュアルを生成するためのテキストプロンプトに変換します。参照画像や”/describe “からのプロンプトを使用することで、コンセプトと実行のギャップを埋め、AIにクリエイティブなビジョンの明確な方向性を提供することができます。この方法は、テキストだけではアイデアが十分に伝わらない場合に特に有効で、ユニークなイメージをより正確に実現することができます。

AIアートの法的・倫理的考察

AIアートは法的に認められているが、創造性、所有権、偏見、社会的影響などを含む複雑な倫理的問題がある。議論の中心は、AIが芸術的創作を支援する一方で、インスピレーションや方向性は人間のインプットに由来するという事実であり、帰属や所有権に関する明確なルールの必要性を強調している。

商業目的のためにAIを使って芸術を生み出すことは、衡平な報酬や盗作のリスクに関する議論を促す。AIと関わるアーティストにとって、伝統的なアートコミュニティの基準の中で、そのような創作物を収益化する倫理的な側面を熟考することは極めて重要だ。

さらに、AIアルゴリズムは、性別、人種、文化など、既存のバイアスを反映する可能性のあるデータセットで訓練されているため、不注意に偏った結果を生み出し、ステレオタイプやバイアスを永続させる可能性がある。クリエイターや開発者は、このような潜在的なバイアスに留意し、それらに対処する努力をする必要がある。

さらに、MidjourneyやDALLE 3のような洗練されたAIモデルのトレーニングや運用が環境に与える影響(二酸化炭素排出量など)は、AIアートをめぐる倫理的議論に新たなレイヤーを追加し、大規模なAIの実践における持続可能性への配慮の必要性を浮き彫りにしている。

結論

Midjourneyは、その機能性、コスト、DALL-E 3のようなツールとの比較について詳しく説明し、AI主導の画像制作に新たな局面を導入するものである。その能力と限界を理解することは不可欠だが、MidjourneyがアートにおけるAIの探求を目指す人々に貴重な機会を提供することは明らかだ。Midjourneyは提供するものが多く、さらに探求する価値のあるツールです。

よくある質問 (FAQs)

Midjourneyは何をするツールですか?

Midjourneyは、1分以内にテキストプロンプトから画像を生成し、書かれた説明をビジュアルアートに変換することができるAIツールです。

Midjourneyは有料ですか?

Midjourneyは利用上限を定めたサブスクリプションモデルで運営されており、上限を超える利用を希望するユーザーにはプレミアムプランへのアップグレードが必要です。

Midjourneyのアート作品を売ることはできますか?

あなたのアートワークを商品化したり、ビジネスで使用するには、Midjourneyの有料サブスクリプションが必要です。無料プランもご利用いただけますが、無料アカウントで作成した画像を販売することは、使用権によって制限されることにご注意ください。