următoarea generație de LLM-uri sunt cu adevărat vulnerabile la spionajul corporatist. Funcțiile de recompensă care funcționează, în special cele care ajută la convergența mai rapidă, se potrivesc într-un singur fișier python. Ideea poate fi spusă la o conversație la cafenea. Acest lucru nu a fost cazul în regiema de dinaintea trenului
7,52K