- Si continúas con la tendencia de METR, ¡verás modelos de ~100h para fin de año! (~8x más potentes que ahora) - METR realmente tendrá dificultades para tener los estándares necesarios para evaluar modelos de ese poder - Ya no podemos descartar una automatización significativa del desarrollo de IA ESTE AÑO
Ajeya Cotra
Ajeya Cotra5 mar, 23:17
Nueva publicación: el 14 de enero, predije que el horizonte temporal de SWE para fin de año sería de ~24 horas. Ahora creo que será >100 horas, y tal vez sin límites. Por primera vez, no veo evidencia sólida en contra de la automatización de I+D en IA *este año.* Enlace abajo.
@Douglas_Schon La relación media p80/p50 es ~0.19... es notablemente estable.
@djinnius @microfounded @eli_lifland También tengo un Substack
159