Det er morsomt hvordan 99 % av folk som prøver å forklare LLM-er glemmer at de ikke genererer det neste tokenet, de genererer en sannsynlighetsfordeling over hele ordforrådsrommet som sluttapplikasjonen er gratis å prøve fra Du blir ofte ikke presentert med det mest sannsynlige tokenet
Gergely Orosz
Gergely Orosz4. sep., 21:46
Morsomt hvordan 99 % av folk som bruker LLM-er glemmer hvordan disse tingene fungerer: De er avanserte sannsynlighetsmaskiner. De genererer det nest mest sannsynlige tokenet (ordet) basert på inndataene og opplæringen deres. Under panseret er det en gigantisk matrisemultiplikasjon som har uhyggelig god utgang.
848,14K