Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
To jest w rzeczywistości bardzo silny głos na rzecz Grok. Sprawdziłem i wydaje się, że tak, rzeczywiście poprawiło to dolną granicę w poważnym artykule o prawdopodobieństwie na 2025 rok. Multi-agent z wyszukiwaniem i wykonaniem kodu, ale po co ograniczać się, jeśli można faktycznie korzystać z narzędzi?
DS (tylko w sieci) nie udaje się/poddaje się.

18 lut 2026
Grok 4.20 (Beta) poprawia dolną granicę o 9,1% na obwodzie Gaussa zbiorów wypukłych w ciągu dwóch minut.
To coś, co zwrócił mi uwagę Xinyuan Xie. W 1993 roku Keith Ball pokazał, że obwód Gaussa ciała wypukłego w n-wymiarowej przestrzeni euklidesowej jest ograniczony z góry przez 4n^{1/4}. Jeśli chodzi o dolną granicę, Ball pokazał, że dla sześcianu (o odpowiednich rozmiarach) obwód może rosnąć jako \sqrt{\log(n)}. Przez jakiś czas istniała luka co do tego, która granica jest ostra, aż do 2003 roku, kiedy to w pięknym artykule Fedor Nazarov pokazał, że na przykładzie losowego wielościanu (przecięcia wielu losowych półprzestrzeni) dolna granica może rosnąć jako C n^{1/4}, przy C=\exp(-5/4)=0.286…. Poza tym, Nazarov również poprawił stałą 4 w górnej granicy (zastępując ją 0.64), gdy n jest duże. Te granice pozostały niepokonane aż do niedawna, kiedy w 2019 roku Martin Raic zdołał poprawić górny współczynnik graniczny z 0.64 do 0.59.
Grok 4.20 (Beta), poprzez bardziej staranne optymalizowanie konstrukcji Nazarova, zdołał poprawić dolny współczynnik graniczny z 0.286 do 0.3126. Uważam to za zaskakujące, nawet jeśli to tylko zabawa w ramach technik z artykułu Nazarova, ponieważ bardzo niedawno Nadimpalli--Pascale (2025) opublikowali preprint, w którym, przy użyciu innego podejścia, odzyskali dolną granicę Nazarova z tym samym współczynnikiem 0.286….
Grok był bardzo hojny w swojej odpowiedzi: powiedział, że poprawa, którą dostarczył, wynika z tego samego argumentu Nazarova „linia po linii”, podczas gdy gdy zapytałem inne modele (oprócz Groka) o weryfikację twierdzenia Groka, zgodziły się we wszystkim oprócz tej części; powiedzieli, że poprawa nie jest naprawdę „linia po linii” :D.
Na koniec, nie powiedziałbym, że Nazarov przegapił tę poprawę. Znając go od dłuższego czasu, jestem dość pewny, że to dla niego normalne, aby poświęcać optymalne stałe na rzecz elegancji algebraicznej.
Dlaczego to wszystko jest interesujące? Posiadanie kontroli nad obwodem Gaussa pozwala kontrolować ogony Fouriera funkcji charakterystycznych tych zbiorów, co prowadzi do kontrolowania złożoności czasowej algorytmów uczenia PAC i agnostycznego dla tej rodziny (zob. Klivans--O’Donnell--Servedio).
Bibliografia:
Link do czatu z Grok 4.20 (Beta).
Keith Ball. Odwrotny problem izoperymetryczny dla miary Gaussa. Geometria dyskretna i obliczeniowa, 10:411–420, 1993.
Adam Klivans, Ryan O’Donnell i Rocco A Servedio. Uczenie się koncepcji geometrycznych za pomocą powierzchni Gaussa. W Proc. 49. Sympozjum IEEE na temat podstaw informatyki (FOCS), strony 541–550, 2008.
Shivam Nadimpalli, Caleb Pascale. O maksymalnym obwodzie Gaussa zbiorów wypukłych, ponownie. Preprint (2025)
Fedor Nazarov. O maksymalnym obwodzie zbioru wypukłego w R^n względem miary Gaussa. W Geometric Aspects of Functional Analysis (2001-2002) strony 169–187. Notatki wykładowe w matematyce, tom 1807, Springer, 2003
Martin Raicz. Wielowymiarowe twierdzenie Berry’ego–Esseen’a z wyraźnymi stałymi. Bernoulli 25(4A), 2019, 2824–2853

Aby było jasne, jeśli powiem DS, aby NIE poddawał się, myśli znacznie intensywniej, 12 minut tutaj, i proponuje pomysł, jak można poprawić stałą. Ale kod, który generuje, zawodzi. Po namyśle się poddaje. Właściwie, jakościowo wydaje się być "poprawny", ale uzyskuje 0.3116, <Grok

Jeśli kod DeepSeek zostanie naprawiony (nawet przez DeepSeek), produkuje wynik, który zbiega się z wartością Groka. Więc przypuszczam, że z dość trywialnym REPL również by "odniósł sukces". Tak czy inaczej, wyższa użyteczność dla Groka tutaj.
133
Najlepsze
Ranking
Ulubione
