JetB株式会社

マルチモーダル生成AI「OmniFlow」がパナソニックHDより発表

#AI

マルチモーダル生成AI「OmniFlow」のアイキャッチ

パナソニック ホールディングス株式会社およびパナソニックR&Dカンパニーオブアメリカは、マルチモーダル生成AI「OmniFlow」を2025年6月4日に発表しました。

OmniFlowの登場により、今後の生成プロセスの効率化や生産性の向上に期待ができます。

AI Switchの無料体験バナー

異なるデータ形式を自由に変換可能

OmniFlowの特徴は、さまざまな種類のデータ形式(文字・画像・音など)を、入力にも出力にも使える生成AIモデル「Any-to-Any」手法にあります。

文字・画像・音などを自由に相互変換

従来の生成AIモデルは、「文字→文字」や「文字→画像」といったように、特定の入力と出力に特化したものがほとんどでした。

しかし、Any-to-Anyに基づいたOmniFlowは、

  • 文字と音から、ぴったりの絵を描く
  • 文字から、それに合った絵と音楽を作る
  • 写真と音を文字で説明する

など、複数の異なるデータ形式を横断的に理解して生成します。

OmniFlowは人間とAIのインタラクションをスムーズにし、コンテンツの作成をはじめとする幅広い分野での活躍に期待ができるでしょう。

学習データ作成のコストを大幅に削減

従来のマルチモーダル生成AIの課題は、すべてのデータ形式の入手が難しく、入手コストがかかりすぎることでした。

ですが、OmniFlowは「文字→画像」「文字→音」など、それぞれの変換を得意とする生成AIの組み合わせにより、少ないデータからでも高精度のAny-to-Anyモデルの学習を行えます。

学習データの作成コストを大幅に減らせるため、マルチモーダルAIの活用を加速させるきっかけとして期待されています。

高いマルチモーダル性能を獲得

OmniFlowは既にあるAny-to-Any手法やスペシャリスト手法との評価実験により、その高いマルチモーダル性能が裏付けられました。「文字→画像」「文字→音」の生成能力を比較したところ、OmniFlowが最も優れた性能を示したとしています。

また、この評価実験において、OmniFlowの優れた性能が確認されただけでなく、少しのデータで十分な出力が行えることも判明しました。OmniFlowの学習に必要なデータサイズは、他のAny-to-Any手法に比べて、最大で1/60まで削減できたと発表されています。

先進性が国際的に評価

OmniFlowの画期的な技術は、その先進性から世界中で高く評価され、2025年6月11日〜2025年6月15日に行われる、AIやコンピュータビジョン分野におけるトップカンファレンスである「CVPR2025」に採択されました。

同カンファレンスの論文採択率は非常に低く、採択される論文は最先端のものばかりです。また発表される技術は、その後の業界や製品開発に与える影響が大きく、OmniFlowが今後の研究開発を形づくる可能性を秘めていることが伺えます。

最先端のAI技術を業務に活用

AISwitchのバナー

ここまで紹介したOnmiFlowのような、AI技術の急速な発展は今後も継続して行われると予測できます。同時に、AIがより一般的なものとして日常生活や仕事において浸透し、社会のさまざまな場面で新たな常識を生み出すでしょう。

AI過渡期のいま、AIについてのリテラシーを高めておくことは、事業の中長期的な成長や企業価値の向上に必要不可欠です。

そこで弊社では、AIリテラシーを高めるためのAI研修サービス「AI Switch」の実施をスタートしました。

AIに関する知識やスキルを習得すると、実務の効率化を行えたり、新たな活用アイデアを生み出したりできます。またAIが持つ危険性についても理解し、適切に対応する能力も身につきます。

生成AIの導入や活用でお困りの企業・団体様は、お気軽にご相談ください。