Обучение с подкреплением на основе модели (Model-based RL) - агент строит внутреннюю модель окружения и на ее основе решает задачу.
Обучение с подкреплением на основе обучения без учителя (Unsupervised RL) - агент самостоятельно изучает закономерности в окружении без привлечения внешнего учителя.
Глубокое обучение с подкреплением (Deep RL) - агент использует нейронные сети для обработки входных данных и принятия решений.
Иерархическое обучение с подкреплением (Hierarchical RL) - агент строит иерархию задач и решает их последовательно на разных уровнях.
Мультиагентное обучение с подкреплением (Multi-agent RL) - несколько агентов взаимодействуют друг с другом и учатся на основе получаемого подкрепления.
Обучение с подкреплением на основе модели (Model-based RL) - агент строит внутреннюю модель окружения и на ее основе решает задачу.
Обучение с подкреплением на основе обучения без учителя (Unsupervised RL) - агент самостоятельно изучает закономерности в окружении без привлечения внешнего учителя.
Глубокое обучение с подкреплением (Deep RL) - агент использует нейронные сети для обработки входных данных и принятия решений.
Иерархическое обучение с подкреплением (Hierarchical RL) - агент строит иерархию задач и решает их последовательно на разных уровнях.
Мультиагентное обучение с подкреплением (Multi-agent RL) - несколько агентов взаимодействуют друг с другом и учатся на основе получаемого подкрепления.