- Jeśli kontynuujesz trend METR, zobaczysz modele ~100h do końca roku! (~8x bardziej wydajne niż teraz) - METR naprawdę będzie miało trudności z uzyskaniem benchmarków potrzebnych do oceny modeli o takiej mocy - Nie możemy już wykluczyć znaczącej automatyzacji rozwoju AI W TYM ROKU
Ajeya Cotra
Ajeya Cotra5 mar, 23:17
Nowy post: 14 stycznia przewidziałem, że horyzont czasowy SWE do końca roku wyniesie ~24 godziny. Teraz myślę, że będzie to >100 godzin, a może nawet nieograniczone. Po raz pierwszy nie widzę solidnych dowodów przeciwko automatyzacji badań i rozwoju AI *w tym roku.* Link poniżej.
@Douglas_Schon Średni stosunek p80/p50 wynosi ~0,19... jest niezwykle stabilny.
@djinnius @microfounded @eli_lifland Mam też Substacka
117