První dojmy z používání GPT-5 v hlasových agentech. Je příliš pomalý, i když je reasoning_effort nastaveno na "minimální". Neustále dostávám latenci inference 700ms+.
Je to teprve první den, takže by to mohlo být tím, že se GPU rozplývají. Za pár dní to znovu otestuji.
Jo, a podle obvyklého tirády - pro produkt orientovaný na zákazníka není podpora jiného modelu funkcí, která by stála za zmínku. Jedná se o implementační detail.