la mayoría de la gente no se da cuenta de que la temperatura es solo ajustar la velocidad del ventilador en el clúster de GPU que le sirve
gojo
gojo15 ago, 23:20
literalmente estaba hablando con este "investigador de LLM" sobre el ajuste de la temperatura en los LLM y le pregunté por qué bajar o aumentar la temperatura da como resultado resultados más deterministas o aleatorios, ¿verdad? Y dijo que sí, cambia la forma en que se representan los tokens. chico, la gente EN el maldito campo no tiene idea de las estadísticas de botzmann o incluso softmax. Voy a llorar.
297