Google-Chef-Wissenschaftler Jeff Dean: Wir stehen kurz davor, dass Systeme in bestimmten Bereichen eigene Durchbrüche erzielen. Es funktioniert, wenn eine vollständig automatisierte Schleife Ideen generieren, diese testen und schnelles Feedback über große Suchräume erhalten kann. "Klare Belohnungen und schnelles Feedback machen RL effektiv." In den nächsten 5-20 Jahren könnte dies Wissenschaft und Ingenieurwesen beschleunigen.
25,95K