33
VLC、60億ダウンロードという新たなマイルストーンを達成し、AI生成字幕のデモを実施
VLCメディアプレーヤーでのAI生成字幕のデモ
(画像提供:VLC)

VLC Media Playerを開発する非営利団体VideoLANは、CES 2025でのプレゼンテーションで、この人気のオープンソースマルチメディアツールが60億ダウンロードという節目を迎えたと発表しました。この成果は非常に大きなものですが、サードパーティからのダウンロード数は除外されている可能性が高いため、この数字は控えめな可能性があります。また、VideoLANの開発者は、次なる目玉機能であるAI搭載字幕と100言語対応のリアルタイム翻訳を披露し、今後の計画を発表しました。この機能は現在開発中で、オープンソースの人工知能(AI)モデルを用いてリアルタイムで字幕を作成するように設計されています。

興味深いことに、VLCの今後予定されているAI搭載字幕機能は、音声をテキストに変換する自動音声認識(ASR)システムであるOpenAIのWhisperなどの先進技術からインスピレーションを得ているようです。Whisperは、大規模なデータセットを用いて学習させることで、様々なアクセントや方言に対応できることが高く評価されています。

VLC の自動字幕生成と翻訳は、ローカルおよびオープンソースの AI モデルに基づいており、オフラインでマシン上で実行され、多数の言語をサポートしています。デモは、ユーレカ パークの #CES2025 ブースでご覧いただけます。pic.twitter.com/UVmgT6K4ds 2025 年 1 月 8 日

しかし、VLCは異なるアプローチを採用しており、AIモデルはVLCアプリに直接組み込まれ、オフラインで動作します。この機能は、プライバシーを重視するユーザーにとって懸念事項となるインターネット接続やクラウドベースのサービスへの依存を排除​​する点で特に注目に値します。

この新機能について、VideoLAN社長のジャン=バティスト・ケンプ氏は次のように述べています。「同時に、字幕をユーザーの言語に自動翻訳する機能も搭載しています。重要なのは、この機能がクラウドサービスを使用せずに、ユーザーのマシン上でローカルかつオフラインで実行されることです。実行ファイル内で直接実行されます。」

AI字幕生成機能は様々なメディアフォーマットに対応しており、外部ソフトウェアを使わずに多言語コンテンツを楽しみたいユーザーにとって必須のツールとなります。同社によると、このAIは100以上の言語で動画の字幕と翻訳を生成できるため、VLCは世界中の視聴者にとってより使いやすくなるとのことです。

VideoLANは新機能の公式リリース日をまだ発表していませんが、近い将来に無料アップデートとしてリリースされる予定です。詳細は同社ブログで随時公開されます。

AIを活用した字幕と翻訳機能の追加はVLCにとって大きな前進ですが、ユーザーエクスペリエンスに悪影響を与える可能性のある、AI生成の不正確な字幕に関するよくある問題に開発者がどのように対処するのかについては疑問が残ります。PC Magが指摘しているように、このメディアプレーヤーがどのようなオープンソースAIモデルを利用するのか、そしてこの機能のシステム要件が大幅なリソース消費につながるかどうかが注目されています。専用のNPU(ニューラル・プロセッシング・ユニット)を搭載したPCが必要になる可能性が高いでしょう。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Kunal KhullarはTom's Hardwareの寄稿ライターです。長年、PCコンポーネントと周辺機器を専門とするテクノロジージャーナリスト兼レビュアーとして活躍しており、PCの組み立てに関するあらゆる質問を歓迎しています。