人工智能学院龙婷老师指导的本科生李光赫同学的论文“DiffStitch: Boosting Offline Reinforcement Learning with Diffusion-based Trajectory Stitching”被 CCF-A类会议ICML 2024接收。ICML,全称为国际机器学习会议(International Conference on Machine Learning)。ICML是机器学习与泛人工智能领域的顶级国际会议。
李光赫同学就读于吉林大学唐敖庆理科试验班(计算机方向),一直在龙婷老师的指导下从事强化学习相关的研究工作。本篇工作由龙婷老师指导,同时与上海交通大学的张伟楠老师合作完成。
论文详情:
论文题目:DiffStitch: Boosting Offline Reinforcement Learning with Diffusion-based Trajectory Stitching
第一作者:李光赫(三年级本科生)
收录会议:ICML’2024(CCF A)
指导教师:龙 婷
论文概述:在离线强化学习(RL)领域,智能体学习出的策略很大程度上受到离线数据集质量的影响。然而,在很多情况下,离线数据集仅包含有限数量的最优轨迹,这对离线RL算法构成挑战,因为智能体必须具备从低回报区域向高回报区域转移的能力。为了解决这一问题,我们引入了基于生成模型的轨迹拼接算法DiffStitch。DiffStitch能够有效地连接离线数据集中的低回报轨迹和高回报轨迹,从而形成全局最优轨迹,帮助应对离线RL算法面临的挑战。我们在D4RL数据集上验证了DiffStitch在增强离线强化学习算法中的有效性,特别地,DiffStitch在增强IQL、TD3和DT算法上均表现出了良好的效果。