"Предстоящий момент GPT-3 для RL" Интересный пост от @MechanizeWork о переходе к массовому обучению в тысячах разнообразных сред. "Аналогично, мы подозреваем, что момент GPT-3 для RL будет в значительной степени обеспечен парадигмой, которую мы называем обучением репликации. Эта предложенная парадигма включает в себя задачу для ИИ по дублированию существующих программных продуктов или конкретных функций в них. Простые инструменты командной строки, которые реализуют неясные алгоритмы хеширования и шифрования, являются простыми начальными целями, но этот подход можно легко расширить на более сложное программное обеспечение, такое как веб-сайты, профессиональное программное обеспечение и игры."
Связь:
830