Někdo potřebuje aktualizovat regulární výraz tokenizeru.
Sam Paech
Sam Paech5. 8. 19:55
Chatgpt miluje em-dash natolik, že v jeho tokenizéru není méně než **40** tokenů, které obsahují "―" Můžete je nadobro rozdrtit pomocí logit zkreslení. Fragment kódu >>
1,75K