Lightricksは、最新の音声付き動画生成AIモデル「LTX-2.3」を発表しました。これは、2026年1月に登場した「LTX-2」のアップデート版にあたり、プロ品質の動画をローカル環境で生成できるだけでなく、商用利用も可能となっています。
「LTX-2.3」は、その性能の高さから注目を集めており、Webベースで利用できる「LTX Studio」も提供されています。
LTX-2.3の主な進化点
新モデル「LTX-2.3」は、前モデル「LTX-2」の基盤をさらに強化し、エンジンの根幹から改良が加えられています。これにより、映像のディテール、動きの自然さ、音声のクリアさ、そしてプロンプトへの忠実度が大幅に向上しました。
- 高品質な映像生成: DiT(Diffusion Transformer)ベースの音声・動画基盤モデルとして、より高品質なデータでトレーニングされた最新のVAE(変分オートエンコーダ)を使用。細部がシャープになり、動きが格段に安定し、画像から動画を生成する際の一貫性が向上しています。
- プロンプト理解度の向上: テキストコネクタが従来の4倍に拡大されたことで、プロンプトの理解力が大幅に向上しました。複数の主語、空間関係、文体指示といった複雑なプロンプトも、カメラの動き、シーンの構図、キャラクターの細かなアクションなど、より正確に反映できるようになっています。
- クリアな音声同期: 新しいボコーダーの導入により、ノイズが低減され、映像と緊密に同期したクリアなオーディオを生成します。
- 縦型動画への対応: 学習段階から縦型データを用いたネイティブなポートレート動画生成に対応しており、最大1080×1920の解像度で高品質な動画を作成できます。
- 柔軟な生成オプション: 用途に応じてスピード重視の「Fast Flow」と品質重視の「Pro Flow」を選択可能。最長20秒、最大4K解像度、24から50FPSでの生成に対応しています。
LTX-2.3の生成例は、開発元のXアカウントでも公開されています。ぜひその品質をご確認ください。
https://x.com/ltx_model/status/2029612455874416732
ローカル利用と商用利用の自由度
「LTX-2.3」は、フルコード、モデルの重み、トレーニングコード、APIアクセスが公開されており、ユーザーはローカル環境でモデルを動かしたり、独自のファインチューニングを行ったり、既存のワークフローに直接組み込んだりすることが可能です。
さらに、WindowsとmacOSに対応したWebベースの生成ツール「LTX Studio」も提供されており、より手軽に動画生成を試すことができます。
特筆すべきは、個人利用はもちろん、年間収益が1000万ドル未満の企業であれば、モデルの利用、改変、再配布、商用利用も含めて無料で自由に行える点です。これにより、多くのクリエイターや中小企業がプロ品質の動画生成AIを活用できるようになります。
公式情報:LTX-2.3 Model
公式情報:LTX Studio Desktop

