← Voltar ao módulo
Ementa
Conteúdo
Bibliografia Básica
Reinforcement Learning (Aprendizado por reforço)
- Professor
- Prof. Dr. Thiago Silva
- Carga horária
- 30h
Decisões sob incerteza. Simulação de Monte Carlo. Processos de decisão de Markov. Aproximação de Programação Dinâmica. Q-learning. Proximal Policy Optimization (PPO). Aplicações na indústria.
- Decisões sob incerteza
- Simulação de Monte Carlo
- Processos de decisão de Markov
- Aproximação de Programação Dinâmica
- Q-learning
- Proximal Policy Optimization (PPO)
- Aplicações na indústria
- SUTTON, Richard S.; BARTO, Andrew G. Reinforcement learning: An introduction. MIT press, 2018.
- BERTSEKAS, Dimitri P. et al. Dynamic programming and optimal control. Belmont, MA: Athena scientific, 2005.
- POWELL, Warren B. Approximate Dynamic Programming: Solving the curses of dimensionality. John Wiley & Sons, 2011.