Je zábavné, jak 99 % lidí, kteří se snaží vysvětlit LLM, zapomíná, že negenerují další token, ale generují rozdělení pravděpodobnosti v celém prostoru slovní zásoby, ze kterého může koncová aplikace volně vzorkovat Velmi často vám není předložen nejpravděpodobnější token
Gergely Orosz
Gergely Orosz4. 9. 21:46
Je zábavné, jak 99% lidí používajících LLM zapomíná, jak tyto věci fungují: Jsou to pokročilé stroje na pravděpodobnost. Vygenerují další nejpravděpodobnější token (slovo) na základě vstupu a svého trénování. Pod kapotou je to obrovské násobení matic, které má děsivě dobrý výstup.
848,13K