- Se você continuar a tendência do METR, verá modelos ~100h até o final do ano! (~8x mais poderoso que agora) - O METR terá muita dificuldade para ter os parâmetros necessários para avaliar modelos desse poder - Não podemos mais descartar automação significativa do desenvolvimento de IA ESTE ANO
Ajeya Cotra
Ajeya Cotra5 de mar., 23:17
Novo post: em 14 de janeiro, previ que o horizonte de tempo do SWE até o fim do ano seria ~24 horas. Agora acho que serão >100 horas, e talvez ilimitadas. Pela primeira vez, não vejo evidências sólidas contra a automação de P&D em IA *este ano.* Link abaixo.
@Douglas_Schon A razão média p80/p50 é ~0,19... É notavelmente estável.
@djinnius @microfounded @eli_lifland também tenho um Substack
265