Deep-Reinforcement-Learning

Collection of Deep Reinforcement Learning Algorithms in PyTorch.

Below a list of Jupyter Notebooks with implementations

Value Based / Offline Methods

Discrete Action Space

Distributional RL

Continuous Action Space

NAF - Normalized Advantage Function

-[Soft-DQN] TODO

Policy Based / Online Methods

Discrete Action Space

Sarsa [Source/Paper]
Vanilla Policy Gradient +LSTM [Source/Paper]
A2C Paper
A2C with gae* [TODO]
A2C multi environment
PPO Paper
PPO with gae*
PPO with gae and curiosity driven exploration (single, digit inputs) Paper
PPO multi environment

Continuous Action Space

gae* = Generalized Advanted Estimation Source

Actor-Critic Algorithms

DDPG [Source/Paper]
D4PG Source/Paper
Twin Delayed DDPG (TD3) Paper
Soft Actor Critic (SAC-newest 2019 version) Paper

Upside-Down-Reinforcement-Learning

Discrete and continuous action space implementation of ⅂ꓤ

Munchausen Reinforcement Learning

Implementierungen von Munchausen RL

Model-Based RL

Black-Box Optimization

Evolution Strategies with mulit processing and novelty search
Genetic Algorithm - GARNE
- Genetic Algorithm implementation with LSTM, Multiprocessing over several CPUs and Novelty Search for Exploration

Multi-Agent Deep Reinforcement Learning

Multi-Agent-DDPG

Hyperparameter Tuning

Gridsearch

Random Forest [TODO]

Genetic Algorithm [TODO]

====================================

Name		Name	Last commit message	Last commit date
Latest commit History 117 Commits
Black-Box Optimization		Black-Box Optimization
ContinousControl		ContinousControl
Cross_entropy		Cross_entropy
Deep Q_Learning		Deep Q_Learning
Double DQN		Double DQN
Dueling Deep Q-Network		Dueling Deep Q-Network
Paper		Paper
Policy Gradient Algorithms		Policy Gradient Algorithms
Q_Learning		Q_Learning
Temporal Difference (Sarsa, Sarsamax, Expeted Sarsa)		Temporal Difference (Sarsa, Sarsamax, Expeted Sarsa)
imgs		imgs
Categorical_DQN.ipynb		Categorical_DQN.ipynb
Grid_search_for_Reinforcement_learning.ipynb		Grid_search_for_Reinforcement_learning.ipynb
Noisy_DQN.ipynb		Noisy_DQN.ipynb
Nstep_DQN.ipynb		Nstep_DQN.ipynb
PPO_conti_gae_curio_multi.ipynb		PPO_conti_gae_curio_multi.ipynb
PPO_gae_curios.ipynb		PPO_gae_curios.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Deep-Reinforcement-Learning

Value Based / Offline Methods

Discrete Action Space

Distributional RL

Continuous Action Space

Policy Based / Online Methods

Discrete Action Space

Continuous Action Space

Actor-Critic Algorithms

Upside-Down-Reinforcement-Learning

Munchausen Reinforcement Learning

Model-Based RL

Black-Box Optimization

Multi-Agent Deep Reinforcement Learning

Hyperparameter Tuning

About

Uh oh!

Releases

Packages

Uh oh!

Languages

BY571/Deep-Reinforcement-Learning-Algorithm-Collection

Folders and files

Latest commit

History

Repository files navigation

Deep-Reinforcement-Learning

Value Based / Offline Methods

Discrete Action Space

Distributional RL

Continuous Action Space

Policy Based / Online Methods

Discrete Action Space

Continuous Action Space

Actor-Critic Algorithms

Upside-Down-Reinforcement-Learning

Munchausen Reinforcement Learning

Model-Based RL

Black-Box Optimization

Multi-Agent Deep Reinforcement Learning

Hyperparameter Tuning

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages