Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
LTX-2.3 este un upgrade major.
Este un motor multimodal gata de producție – conceput să fie construit pe el.
Iată ce e nou 🧵
1/7
Livrare astăzi:
→ Cod complet, greutăți de model și cod de antrenament
→ acces la API pentru integrarea în producție
→ LTX Studio pentru generarea pe bază de web
Rulează-l local. Ajustează-l. Integrează-l direct în fluxurile tale de lucru.
2/7
Cea mai mare îmbunătățire este fidelitatea vizuală și stabilitatea mișcării.
Un nou VAE video și un spațiu latent rafinat oferă detalii fine mai clare și o mișcare mai stabilă.
Imagini-video se menține mai bine împreună, texturile mici rezistă compresiei, iar interpolarea din ultimul cadru face ca finalurile să pară intenționate.
Am aplicat, de asemenea, o filtrare a datelor mai agresivă și o procesare îmbunătățită a datelor, ceea ce îmbunătățește direct detaliile vizuale fine și reduce artefactele.
3/7
Înțelegerea promptă a reprezentat, de asemenea, un pas real înainte.
Un conector de text mai mare îmbunătățește modul în care modelul interpretează mișcarea camerei, compoziția scenei și acțiunile personajelor.
Nu mai trebuie să supra-proiectezi prompturile pentru a obține rezultate previzibile.
Sub capotă, normalizarea adaptivă și atenția blocată strâng controlul fără a crește complexitatea.
4/7
Keyframe-urile și controlul structurat sunt acum mai profund integrate.
LTX-2.3 este antrenat cu obiective multi-sarcină încă din etapa de pre-antrenament, inclusiv imagine-to-video, retake, cadre cheie și altele.
Acest lucru face tranzițiile, evoluția controlată a scenei și fluxurile de lucru cu mai multe cadre mai consistente și mai fiabile.
5/7
Calitatea audio s-a îmbunătățit și ea pe toate planurile.
Un nou vocoder crește claritatea dialogului și realismul sonor. Alinierea cross-modală între audio și video este mai strânsă.
O filtrare mai puternică și o procesare îmbunătățită a datelor reduc ieșirile zgomotoase și îmbunătățesc fidelitatea generală a sunetului.
6/7
176
Limită superioară
Clasament
Favorite
