Asilomar 2023 || Pacific Grove, California || October 29 - November 1, 2023

TP2b.1

Predictive Estimation for Reinforcement Learning with Time-Varying Reward Functions

Abolfazl Hashemi, Antesh Upadhyay, Purdue University, United States

Session:

TP2b: Reinforcement Learning Lecture

Location:

Oak Shelter

Presentation Time:

Tue, 31 Oct, 15:30 - 15:55 PT (UTC -7)

Session Chair:

Talha Bozkus, University of Southern California

Session TP2b

TP2b.1: Predictive Estimation for Reinforcement Learning with Time-Varying Reward Functions

Abolfazl Hashemi, Antesh Upadhyay, Purdue University, United States

TP2b.2: Practical Robust Reinforcement Learning Via Adjacent Uncertainty Set

Ukjo Hwang, Songnam Hong, Hanyang University, Republic of Korea

TP2b.3: A Novel Ensemble Q-Learning Algorithm for Policy Optimization in Large-Scale Networks

Talha Bozkus, Urbashi Mitra, University of Southern California, United States

TP2b.4: Reward Attack on Stochastic Bandits with Non-stationary Rewards

Chenye Yang, Guanlin Liu, Lifeng Lai, University of California, Davis, United States

TP2b.5: Multi-Agent Recurrent Deterministic Policy Gradient with Inter-Agent Communication

Joohyun Cho, Mingxi Liu, Yi Zhou, Rong-Rong Chen, University of Utah, United States