Jak bychom měřili ekonomickou blahobyt v modelu s AI agenty? Jedním ze způsobů jsou soutěže ve stylu Elo. Dejte agentům všechny kombinace výsledků a nechte je je seřadit. To generuje ordinální pořadí výsledků a říká vám, jak se daná kontrafaktuální hodnota řadí v množině