OpenAI、テキストから動画を作成するモデル「Sora」をChatGPT PlusおよびProユーザーにリリース

2024年12月9日、OpenAIは、12日間にわたって行われた「ship-mas」製品リリースシリーズの一環として、革新的なテキストから動画を作成するAIモデル「Sora」を正式にリリースしました。このリリースは、本日より米国およびその他の多くの国々でChatGPTの購読者向けにSora.comで利用可能となり、テキストの指示から直接動画を作成するという画期的な方法を紹介しています。Soraとともに、OpenAIはさらに進化したSora Turboを発表し、画像のアニメーション化、動画のリミックス、テキストのシーケンスからの動画生成などの機能強化を提供しています。

Soraは、2段階の価格設定により、ChatGPTの契約者が利用できます。ChatGPT Plus Subscriptionは月額20ドルで、最大解像度720p、動画の長さは5秒以内で、優先動画を最大50本(1,000クレジット)生成できます。一方、月額200ドルの「ChatGPT Pro Subscription」では、生成数無制限、優先動画500本まで、解像度1080pまでの高解像度、動画の長さは最長20秒まで、透かしなしのダウンロードや最大5本の動画を同時に生成できるなどの追加特典が提供されます。

OpenAIは、Soraにクリエイティビティの可能性を広げるいくつかの高度な機能を備えました。 ストーリーボード機能では、ユーザーは一連の指示に基づいて動画を生成することができます。 また、静止画像をアニメーションクリップに変換する画像から動画へのアニメーション機能、テキストベースの指示を使用して生成された動画を修正するリミックスツール、2つのシーンを1つのまとまった動画にシームレスに結合するブレンド機能などがあります。

Soraで作成されたすべての動画には、AI生成であることを示す透かしとC2PAメタデータが表示されます。さらに、ユーザーはOpenAIのコンテンツガイドラインに同意する必要があり、アップロードする動画には露骨な表現、暴力的なコンテンツ、著作権で保護された作品、18歳未満の個人の描写を含まないことが保証されます。違反した場合は、アカウントが一時停止または停止される可能性があります。

Soraのプラットフォームの重要な要素は、ユーザーコミュニティからAIが生成した動画のフィードを表示する「探索」ページです。本日のライブストリーム中、OpenAIは、ストーリーボードの指示を使用して動画を作成し、写真をダイナミックな動画コンテンツに変換するSoraの機能とともに、この機能に焦点を当てました。Soraの製品リーダーであるローハン・サハイ氏は、創造性を育むことと倫理基準を維持することのバランスについて述べました。

「私たちはOpenAIとして大きな目標を掲げています。違法行為を防止したい一方で、創造的な表現を促進したいとも考えています。」とサハイ氏は述べました。「これは現在進行中の課題であり、初日から完璧にできるとは限りません。私たちは少し控えめなスタートを切りますので、私たちのモデレーションが完璧でなかった場合は、フィードバックをいただければと思います。」

Soraは現在、米国およびその他の多くの国々で利用可能ですが、OpenAIのCEOであるサム・アルトマン氏は、オンライン・セーフティ法、デジタル・サービス法、GDPRなどのコンプライアンス要件により、欧州および英国での展開が遅れる可能性があると警告しています。「Soraを欧州および英国に展開できるようになるまでには、しばらく時間がかかるかもしれません」とアルトマン氏は指摘しています。非購読者向けには、探索ページは引き続きアクセス可能であり、ユーザーはAI生成コンテンツを閲覧したり、それらと関わったりすることができます。

テクノロジー評論家のMarques Brownlee(MKBHDとしても知られる)は、本日早くにSoraの感想を共有しました。「結果は恐ろしいと同時に、インスピレーションを与えてくれるものでした」とBrownleeは語りました。彼は、風景やスタイル効果におけるSoraの有効性を称賛しましたが、現実的な物理や時折発生する視覚的欠陥の問題を指摘しました。Soraをプレビューした映画制作者も同様の結果を報告し、一部の出力で奇妙な視覚異常が発生したことを指摘しました。これらの課題は、生成型AIツールに必要な継続的な改良を強調しています。

Soraの発表は、論争の渦中で行われた。先週、アーティストグループが、アルファテスト段階で「無報酬の研究開発およびPR」に利用されたとして、この製品の詳細をリークした。Hugging Faceに投稿された声明で、このグループは「Sora PR Puppets」と名乗り、OpenAIが「アートウォッシング」を行い、アーティストの生活を脅かしていると非難した。

Soraのリリースは、偽情報、詐欺、ディープフェイクへの悪用を懸念する声も引き起こしました。批評家たちは、ウクライナ大統領ヴォロディミール・ゼレンスキーと米国副大統領カマラ・ハリスを題材にしたディープフェイク動画など、過去の事例を挙げ、この技術が欺瞞的なコンテンツを生み出す可能性があると警告しています。これに対し、OpenAIは厳格な安全対策を実施し、ユーザーにフィードバックを提供して、そのモデレーションシステムを改善するよう促しています。サハイ氏は、これらの対策の重要性を強調し、「Soraの違法行為を防止したいが、同時に創造的な表現とのバランスも保ちたい」と述べた。

OpenAIによるSoraのリリースは、同社のChatGPTや画像生成ツールDALL-Eの成功を基に、生成型AIの進化における大きな一歩となる。Soraは、ChatGPTの機能群に統合され、動画ストーリーテリングの限界を押し広げ、新たな創造性を刺激することを目指しています。「この初期バージョンのSoraが、世界中の人々が新たな創造性を追求し、ストーリーを語り、動画ストーリーテリングの限界を押し広げることを可能にすることを願っています」と、OpenAIはブログ投稿で述べています。