大多數人並不總是正確 解決方案聚合的強化學習訓練