LTX-2.3は大幅なアップグレードです。 これは生産可能なマルチモーダルエンジンで、さらに発展させることを前提に設計されています。 新しい🧵点をご紹介します 1/7
本日の発送: → フルコード、モデルの重み付け、トレーニングコード → 本番統合のためのAPIアクセス → ウェブベースの生成用LTX Studioです ローカルで実行してください。微調整しろ。それを直接ワークフローに統合しましょう。 2/7
最大のアップグレードは視覚的な忠実度と動きの安定性です。 新しいビデオVAEと洗練された潜在空間により、よりシャープな細部と安定した動きを実現します。 映像から映像への変換はより一体化し、小さなテクスチャも圧縮に耐え、最後のフレームの補間はエンディングを意図的に感じさせます。 また、より積極的なデータフィルタリングとデータ処理の改善を施し、細かい視覚的ディテールを直接改善しアーティファクトを減らしました。 3/7
迅速な理解も大きな前進となりました。 より大きなテキストコネクターは、モデルがカメラの動き、シーン構成、キャラクターの行動を解釈する方法を改善します。 予測可能な結果を得るためにプロンプトを過剰に設計する必要はもうありません。 内部では、適応的な正規化とゲート付き注意が複雑さを増すことなく制御を強化しています。 4/7
キーフレームと構造化されたコントロールはより深く統合されています。 LTX-2.3は、画像から動画への変換、再撮影、キーフレームなど、事前学習段階からマルチタスク目標で訓練されています。 これにより、トランジション、制御されたシーンの進化、マルチショットのワークフローがより一貫性があり信頼性が高まります。 5/7
音質も全体的に向上しました。 新しいボコーダーにより、セリフの明瞭さとリアリズムが高まりました。音声と映像のクロスモーダルの整合性はより厳密です。 より強力なフィルタリングとデータ処理の改善により、ノイズの多い出力が減り、全体的な音質が向上します。 6/7
190