Bytedance только что перестал переводить голос в реальном времени в 3 раза быстрее, чем раньше, с задержкой всего в ~3 секунды! Seed LiveInterp 2 — это полнодуплексная модель преобразования речи в речь с точностью >70%. Когда это доходит до видеозвонков, открываются ранее невозможные соединения.
Источник: Пост:
122,46K