Latent Diffusion Constrained Q-Learning (LDCQ)

Training and visualizing of diffusion models from Reasoning with Latent Diffusion in Offline Reinforcement Learning (NeurIPS 2023).

Installation

Install requirement.txt

pip install --upgrade pip
pip install -r requirement.txt

Requirements (pip)

tqdm
matplotlib
wandb
ipdb
arcle == 0.2.5

Dataset

추가하기!

Training

Training Code for ARCLE Environment

cd training

Training skill with:

./gpu0_train_1_skill_model.sh

Collect data to train diffusion model with:

./gpu0_train_2_collect_diffusion_data.sh

Training diffusion model with:

./gpu0_train_3_diffusion.sh

Collect data to train offline Q-learning with:

./gpu0_train_4_collect_q_learning.sh

Training Q-network with:

./gpu0_train_5_q_learning.sh

Test

cd ../eval/
./gpu0_test_ARCLE.sh

Reference

@inproceedings{ldcq,
  title = {Reasoning with Latent Diffusion in Offline Reinforcement Learning},
  author = {Siddarth Venkatraman, Shivesh Khaitan, Ravi Tej Akella, John Dolan, Jeff Schneider, Glen Berseth},
  booktitle = {Conference on Neural Information Processing Systems},
  year = {2023},
}

Name		Name	Last commit message	Last commit date
Latest commit History 57 Commits
checkpoints		checkpoints
data		data
diffusion1d		diffusion1d
eval		eval
models		models
training		training
utils		utils
.gitignore		.gitignore
README.md		README.md
config		config
requirement.txt		requirement.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Latent Diffusion Constrained Q-Learning (LDCQ)

Installation

Install requirement.txt

Requirements (pip)

Dataset

Training

Test

Reference

About

Uh oh!

Releases

Packages

Languages

GIST-DSLab/LDCQ

Folders and files

Latest commit

History

Repository files navigation

Latent Diffusion Constrained Q-Learning (LDCQ)

Installation

Install requirement.txt

Requirements (pip)

Dataset

Training

Test

Reference

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages