一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

添加 top-k + 錯誤反饋，並從 DiloCo 中移除外部 Nesterov（因此大約是外部普通 SGD）。我仍然很驚訝它能工作/可以替代 Nesterov :0 很棒的工作！

4.84K