все, кто упоминает «непрерывное обучение» как проблему, обычно просто говорят о эффективности выборки. очевидно, вы должны «непрерывно учиться», постоянно обучая траектории обратно в модель! в этом нет никакой тайны: это просто не работает с низкой эффективностью выборки.
77,72K