- Если вы продолжите тренд METR, вы увидите модели ~100h к концу года! (~8 раз мощнее, чем сейчас) - METR действительно будет испытывать трудности с получением необходимых эталонов для оценки моделей такой мощности - Мы больше не можем исключать значительную автоматизацию разработки ИИ В ЭТОМ ГОДУ
Ajeya Cotra
Ajeya Cotra5 мар., 23:17
Новый пост: 14 января я предсказал, что временной горизонт SWE к концу года составит ~24 часа. Теперь я думаю, что это будет >100 часов, и, возможно, без ограничений. Впервые я не вижу убедительных доказательств против автоматизации ИИ НИОКР *в этом году.* Ссылка ниже.
@Douglas_Schon Среднее соотношение p80/p50 составляет ~0.19... этоRemarkably стабильно.
@djinnius @microfounded @eli_lifland У меня тоже есть Substack
189