DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Das ist tatsächlich eine sehr starke Stimme für Grok. Ich habe nachgeschaut und es scheint, dass es ja die untere Grenze in einem ernsthaften Wahrscheinlichkeitspapier für 2025 verbessert hat. Multi-Agent mit Suche und Codeausführung, aber warum sich selbst benachteiligen, wenn man tatsächlich Werkzeuge nutzen kann? DS (nur im Web) scheitert/gibt auf.

Grok 4.20 (Beta) verbessert die untere Schranke um 9,1 % für den gaußschen Umfang konvexer Mengen in zwei Minuten. Das wurde mir von Xinyuan Xie aufgezeigt. 1993 zeigte Keith Ball, dass der gaußsche Umfang eines konvexen Körpers im n-dimensionalen euklidischen Raum von oben durch 4n^{1/4} beschränkt ist. Was die untere Schranke betrifft, so zeigte Ball, dass der Umfang für einen Würfel (in entsprechender Größe) mit \sqrt{\log(n)} wachsen kann. Es gab also eine Weile eine Lücke, welche Schranke scharf ist, bis 2003, als Fedor Nazarov in einem schönen Papier zeigte, dass am Beispiel eines zufälligen Polyeders (der Schnittmenge vieler zufälliger Halbebenen) die untere Schranke als C n^{1/4} wachsen kann, wobei C=\exp(-5/4)=0.286…. Außerdem verbesserte Nazarov auch die Konstante 4 in der oberen Schranke (indem er sie durch 0,64 ersetzte), wenn n groß ist. Diese Schranken blieben bis vor kurzem ungeschlagen, als Martin Raic 2019 es schaffte, den konstanten Faktor der oberen Schranke von 0,64 auf 0,59 zu verbessern. Grok 4.20 (Beta) gelang es, durch eine sorgfältigere Optimierung von Nazarovs Konstruktion die untere Schranke von 0,286 auf 0,3126 zu verbessern. Ich finde das überraschend, auch wenn es nur innerhalb der Techniken von Nazarovs Papier spielt, denn sehr kürzlich veröffentlichten Nadimpalli--Pascale (2025) einen Preprint, in dem sie mit einem anderen Ansatz Nazarovs untere Schranke mit demselben konstanten Faktor 0,286… wiederherstellten. Grok war in seiner Antwort sehr großzügig: Es sagte, dass die Verbesserung, die es bereitstellte, dem gleichen Argument von Nazarov „Zeile für Zeile“ folgt, während andere Modelle (außer Grok) bei der Überprüfung von Groks Anspruch in allem zustimmten, außer in diesem Punkt; sie sagten, die Verbesserung sei nicht wirklich „Zeile für Zeile“ :D. Schließlich würde ich nicht sagen, dass Nazarov diese Verbesserung verpasst hat. Da ich ihn schon lange kenne, bin ich mir ziemlich sicher, dass es für ihn üblich ist, optimale Konstanten für algebraische Eleganz zu opfern. Warum ist das alles interessant? Die Kontrolle über den gaußschen Umfang ermöglicht es, die Fourier-Schwänze der charakteristischen Funktionen dieser Mengen zu kontrollieren, was zu einer Kontrolle der Zeitkomplexität von PAC-Lern- und agnostischen Lernalgorithmen für diese Familie führt (siehe Klivans--O’Donnell--Servedio). Referenzen: Chat-Link mit Grok 4.20 (Beta). Keith Ball. Das umgekehrte isoperimetrische Problem für gaußsche Maße. Diskrete und rechnergestützte Geometrie, 10:411–420, 1993. Adam Klivans, Ryan O’Donnell und Rocco A Servedio. Lernen geometrischer Konzepte über gaußsche Fläche. In Proc. 49. IEEE Symposium über Grundlagen der Informatik (FOCS), Seiten 541–550, 2008. Shivam Nadimpalli, Caleb Pascale. Über den maximalen gaußschen Umfang konvexer Mengen, überarbeitet. Preprint (2025) Fedor Nazarov. Über den maximalen Umfang einer konvexen Menge in R^n in Bezug auf ein gaußsches Maß. In Geometrische Aspekte der Funktionalanalysis (2001-2002) Seiten 169–187. Lecture Notes in Mathematics, Band 1807, Springer, 2003 Martin Raicz. Ein multivariates Berry–Esseen-Theorem mit expliziten Konstanten. Bernoulli 25(4A), 2019, 2824–2853

Um klarzustellen, wenn ich DS sage, dass es NICHT aufgeben soll, denkt es viel intensiver, hier 12 Minuten, und bietet eine Idee an, wie die Konstante verbessert werden kann. Aber der Code, den es generiert, schlägt fehl. Bei näherer Betrachtung gibt es auf. Tatsächlich scheint es qualitativ "korrekt" zu sein, erhält aber 0,3116, <Grok

Wenn der Code von DeepSeek repariert wird (auch von DeepSeek), produziert er ein Ergebnis, das sich dem Wert von Grok annähert. Ich schätze, mit einem ziemlich trivialen REPL hätte es "erfolgreich" funktioniert. Wie auch immer, hier ist der Nutzen für Grok höher.

81

Top

Ranking

Favoriten