- Si sigues con la tendencia METR, ¡verás ~100h modelos para finales de año! (~8 veces más poderoso que ahora) - METR realmente tendrá dificultades para tener los puntos de referencia necesarios para evaluar modelos de esa potencia - Ya no podemos descartar una automatización significativa del desarrollo de IA ESTE AÑO
Ajeya Cotra
Ajeya Cotra5 mar, 23:17
Nueva publicación: el 14 de enero predije que el horizonte temporal de SWE para el final de la fecha sería de ~24 horas. Ahora creo que serán >100 horas, y quizá no ilimitadas. Por primera vez, no veo pruebas sólidas en contra de la automatización de la investigación y desarrollo con IA *este año.* Enlace abajo.
@Douglas_Schon La proporción media p80/p50 es ~0,19... Es sorprendentemente estable.
@djinnius @microfounded @eli_lifland también tengo un Substack
185