LTX-2.3 é uma atualização importante. É um motor multimodal pronto para produção - projetado para ser construído. Aqui está o que há de novo 🧵 1/7
Envio hoje: → Código completo, pesos do modelo e código de treino → Acesso à API para integração em produção → LTX Studio para geração baseada na web Execute localmente. Ajuste fino. Integre diretamente nos seus fluxos de trabalho. 2/7
A maior atualização é a fidelidade visual e a estabilidade de movimento. Um novo vídeo VAE e um espaço latente refinado oferecem detalhes finos mais nítidos e um movimento mais estável. A conversão de imagem para vídeo mantém-se melhor, pequenas texturas sobrevivem à compressão, e a interpolação do último quadro faz com que os finais pareçam intencionais. Também aplicámos um filtro de dados mais agressivo e melhorámos o processamento de dados, o que melhora diretamente o detalhe visual fino e reduz artefatos. 3/7
A compreensão do prompt também deu um verdadeiro passo em frente. Um conector de texto maior melhora a forma como o modelo interpreta o movimento da câmera, a composição da cena e as ações dos personagens. Você não precisa mais sobrecarregar os prompts para obter resultados previsíveis. Por trás das câmeras, a normalização adaptativa e a atenção controlada apertam o controle sem aumentar a complexidade. 4/7
Os keyframes e o controlo estruturado estão agora mais profundamente integrados. O LTX-2.3 é treinado com objetivos de múltiplas tarefas desde a fase de pré-treinamento, incluindo imagem-para-vídeo, regravação, keyframes e mais. Isto torna as transições, a evolução controlada de cenas e os fluxos de trabalho de múltiplas tomadas mais consistentes e fiáveis. 5/7
A qualidade do áudio também melhorou em todos os aspectos. Um novo vocoder aumenta a clareza do diálogo e o realismo do som. O alinhamento entre áudio e vídeo é mais preciso. Filtragem mais forte e processamento de dados melhorado reduzem saídas ruidosas e melhoram a fidelidade geral do áudio. 6/7
195