Главный ученый Google, Джефф Дин: Мы близки к тому, чтобы системы делали свои собственные прорывы в определенных областях. Это работает там, где полностью автоматизированный цикл может генерировать идеи, тестировать их и получать быстрые отзывы по большим поисковым пространствам. "четкие вознаграждения и быстрый обратный связь делают RL эффективным" В течение следующих 5-20 лет это может ускорить науку и инженерию.
40,46K