Сегодня мы выпускаем обновление к книге JAX TPU, на этот раз о GPU. Как работают GPU, особенно по сравнению с TPU? Как они соединены в сеть? И как это влияет на обучение LLM? 1/n
341,45K