MediaCentral-AIで創造性を促進する
2023.11.2
クリエイティブな世界における人工知能(AI)の「リアルさ」とは?誰もがその質問の答えを探しているようです。先日のIBCでAvidは、Avid MediaCentral とAIを使用した機能を含め、既存の機能と、冗長なタスクに費やす時間を最小限に抑えてクリエイティブな体験を向上させるようデザインされた新たな探求分野の両方を紹介し、さまざまな可能性を明らかにしました。
オープン性とコラボレーションの精神に基づき、『Machine Learning Applied to Media Libraries for Insights, Search, and Segmentation(メディア・ライブラリのインサイト、検索、区分けに応用する機械学習)』というテーマでSMPTEジャーナルなどに論文を発表しました。また、10月にハリウッドで開催されたSMPTEメディア・テクノロジー・サミットなどの業界会議にも参加しました。同イベントでは、Avidスタッフが今後の開発に関するさまざまな論文を発表するほか、Media ComposerやMediaCentralなどの製品に搭載された最新のAI機能のデモンストレーションも行いました。
Avidのお客様は、数年前からAvidのポートフォリオの中で、Cognitive(コグニティブ)サービス・プロバイダーとの統合により、下記のようなメタデータ・エンリッチメントを提供するAIを使用してきました。
システム構成によって、このメタデータ・エンリッチメントを手動でトリガー、または自動的に実行することができます。
加えて、Media Composer ScriptSyncやPhraseFind、MediaCentralの音声検索などの機能もAIを利用しています。しかし、これらすべては何年も前から存在しています。つまり、どういうことでしょう?
こういうことです!
Avidエンジニアは、ビデオ、オーディオ、アセット管理のさまざまなソリューションにAI強化機能を作るための研究・実験のフレームワークを確立しました。Research and Advanced Development Lab(RADラボ)は、Avidにいる私たちだけでなく、Avidのお客様にも潜在的なメリットをもたらしています。この取り組みによって、9月にアムステルダムで行われたIBC 2023で紹介されたように、可能性の大きな流れが加速しました。
Avidは最初に、WebベースMediaCentral | Cloud UXの概念実証を2つ公開しました。
それぞれの例をもう少し詳しくみてみましょう。まずは、レコメンデーション・エンジンから。
ノートにテキスト入力すると、システムが関連する動画候補を自動的に表示
どこで、いつ、何が起きているかを理解することが重要です。
ノートにテキストを入力すると、ローカルのセマンティックAIエンジンが読み込んでその内容を理解します。次に、システムに含まれる映像と比較します。システムにある映像は、ローカルのAIイメージ・セマンティック・インデクサーによってすでに解析、インデックス化されています。つまり、テキストだけでなく、文脈の中でテキストの意味も理解したうえで、イメージは提案されていきます。
Aロールは、AIがセマンティック・コンテンツ・ディスカバリー技術を使用してテキストを解析し、提案します。この技術は、文字どおりの単語を探すだけでなく、テキストの文脈上の意味を使用して関連するメディアを探します。
Bロールは、若干異なります。Avid独自のAIモデルは、スクリプトに基づいて生成する文章を使用して、検索結果を広げ、より関連性の高い映像を提供します。また、要約・文字起こしエンジンの概念実証では、音声プロキシを作成して、独自のオンプレミスの文字起こしサービスに送ります。
次に、その文字起こしテキストをMicrosoftのクラウド・サーバーへアップロードし、Open AI技術を活用して要約を作成します。
要約エンジンは、短文の要約、中程度の要約、包括的な要約を作成可能
次に、ローカル・サービスはタイムコード情報付きの文字起こしテキストを生成します。加えて、文字起こしテキストを、自動的に他言語へ翻訳することができます。タイムコード情報も保存されるので、文字起こしテキストをマーカーとして、ソースクリップに簡単に加えることができます。これらのマーカーは、検索可能なだけでなく、Avid Media ComposerでMediaCentral | Cloud UXパネルから使用することもできます。
文字起こしテキストは、クリップにマーカーとして追加可能
重要なのは、これが安全に行われることを理解しておくことです。
プロンプト(入力)と完了(アウトプット)、埋め込み、およびトレーニング・データは、
調整されたお客様のAzure OpenAIモデルは、お客様だけが利用できます。Azure OpenAIサービスは、Microsoftがすべて管理しています。Microsoftは、MicrosoftのAzure環境でOpenAIモデルをホストしています。このサービスは、OpenAI(ChatGPTやOpenAI APIなど)とは相互作用しません。
またAvidは、同展示会においてAI駆動型チャットボットのデモンストレーションも行いました。このチャットボットは、Avidナレッジベースやユーザー・ドキュメントの情報を基に、ユーザーのタスクの実行方法に関する質問に答えることができます。チャットボットは、問題に対して、段階的な解決策を提案することや、ドキュメントの中で関連する章や段落をユーザーに案内することができます。
MediaCentral | Cloud UXのAvid Adaチャットボット
これらのAvid MediaCentralとAIの展開に加えて、AvidはMedia ComposerとPro ToolsのAI機能も紹介しました。
人工知能は、クリエイティブ空間において、間違いなくエキサイティングで手ごわい分野です。Avidは最前線で、メディア制作コミュニティが、視聴者の求める最高品質の作品提供ができるよう、クリエイティブなソリューションを促進しています。
AvidとAI、過去、現在、そして未来にご興味はおありですか?
クレイグ・ウィルソン
クレイグ・ウィルソンは、放送業界で30年以上の経験を持つニュースルームのスペシャリストです。クレイグはAvidで様々な職務を経て、現在はグローバル・メディア&クラウド製品エバンジェリストであり、Making the Mediaポッドキャストのホストを務めています。
Eメール設定 | © 2025 Avid Technology, Inc. | 利用規約 | プライバシーポリシー