Google が AI による画像生成ツール ImageFX を発表、MusicFX と TextFX を強化

2024年2月1日、Googleは画像生成ツールImageFXのリリースを発表した。これは、DeepMindの最新のテキストから画像へのモデルであるImagen 2を搭載したGoogleのもので、魅力的なビジュアルを生成する。 ImageFXは、高速な画像生成探索のためのダイナミックで安全なプラットフォームを提供し、Googleは、より良い創造性のために、ジェネレーティブAIツールであるMusicFX、およびTextFXを強化した。

ImageFXはLabsの新しいツールで、簡単なテキストプロンプトで画像を作成することができます。Labsでの初期の実験では、ジェネレーティブAIツールの新しいユーザーにとって、創造的な探求がいかに重要であるかが浮き彫りになりました。人々は、さまざまなプロンプトやコンセプトを繰り返しテストすることで、新しいアイデアを発見することがよくあります。さらなる創造性を刺激するために、ImageFXには「表現力豊かなチップ」を特徴とするプロンプト・インターフェイスが含まれており、創造物やアイデアの隣接する次元を素早く試すことができます」とGoogleはブログで述べている。グーグルはブログで次のように述べている。

MusicFXは、昨年発表されたテキストを音楽に変換するジェネレーティブAIの試みで、ユーザーは最大70秒の曲やループを作成することができる。導入以来、1,000万曲以上が作成された。ユーザーからのフィードバックとMusicLMモデルの強化により、Googleは音質の向上や生成時間の短縮といった機能を導入した。初期のテストによると、これらのアップデートで作成された音楽サンプルは、以前に作成されたものより3倍好まれている。

昨年、Googleはルーペ・フィアスコとTextFX作詞家や作家がテキストや言語を創造的に試すためのジェネレーティブAIツールで提携した。発売以来、ユーザーがTextFXを活用して文章を充実させる革新的な方法は刺激的だった。最近、Googleはユーザビリティとナビゲーションを強化するアップデートを行い、ユーザーエクスペリエンスのさらなる向上を目指している。

Googleは本日、同社のAI原則に沿った責任ある技術開発へのコミットメントを強化した機能を発表しました。Imagen 2は、暴力的、攻撃的、または露骨なコンテンツの生成を防止するための重要な安全トレーニングと技術的対策に裏打ちされた、写実的な画像を作成する機能を提供します。Googleはまた、有害なコンテンツを抑制するための包括的な敵対的テストを実施しています。

さらに、ImageFXとMusicFXによって生成されたすべてのコンテンツには、Google DeepMindによるSynthID 透かしが施されており、目に見えないが追跡可能であるため、コンテンツの信憑性が保証されている。さらに、ImageFXの出力には、透明性を高めるためにIPTCメタデータが含まれています。現在進行中の取り組みは、モデルの安全性とプライバシーの強化に重点を置いている。これらのイノベーションは、米国、ニュージーランド、ケニア、オーストラリアでGoogle Labs を通じてアクセス可能であり、ユーザーをこれらの実験やその他の実験に招待している。