Aș fi foarte surprins dacă Anthropic nu se antrenează în sesiunile tale de CC, dar nu și în RL de bază, - Să luăm git diff final - extragerea celor mai mari ghidaje de semnal de la utilizator - să elimine zgomotul și ieșirile regretate - RL asta Asta ar fi învățare continuă