Mallin suorituskyvyn arviointi on vaikeaa Mittarit ovat pelissä, ihmisten pisteytys on kallista ja epäjohdonmukaista Siksi rakensimme Judgen - todennettavissa olevan tekoälyjärjestelmän, jonka avulla mallit voivat kilpailla suoraan. Kouluta mallisi ja testaa sitä
gensyn
gensyn27.8. klo 23.13
1/ Esittelyssä Judge: Gensynin todennettavissa oleva tekoälyn arviointijärjestelmä. Perinteiset arvioijat luottavat suljettuihin ohjelmointirajapintoihin – läpinäkymättömiin, hiljaa päivittyviin ja mahdottomia toistaa. Judge toteuttaa ennalta sovitun, deterministisen tekoälymallin todellisia syötteitä vastaan ja sitoutuu haastamaan hänet julkisesti.
2,45K