人工智能学院系列学术活动(第76场)——吉林大学人工智能学院胡纪锋博士学术报告

发布时间:2025-12-15 点击:

报告题目:生成式策略在强化学习中的应用

报告人:胡纪锋博士 吉林大学人工智能学院

报告摘要:

深度强化学习指将深度神经网络与强化学习框架相结合,通过智能体与环境交互获得最大累积奖励。近些年在自动驾驶、机器人控制、大语言模型等领域取得多项突破性进展。生成式模型在复杂数据分布拟合、长序列规划、训练稳定性、模型表达能力等方面具有较强的建模能力,与深度强化学习相结合有利于提高强化学习智能体在高维复杂任务中的控制能力。生成式强化学习是深度强化学习在智能体控制领域的前沿技术,是国家关于《新一代人工智能发展规划》以及《国家人工智能产业综合标准化体系建设指南》中的关键技术之一。未来,基于生成式策略的强化学习将对通用人工智能发展产生深远影响。本次报告将介绍多种生成式策略在强化学习领域的应用。

报告人简介:

胡纪锋,吉林大学人工智能学院2021级博士研究生,博士课题研究方向是强化学习,生成式强化学习等,在计算机领域国际顶级期刊及会议NeurIPS、ICML、TNNLS、TKDE等发表论文十余篇,担任多个期刊和会议的审稿人,如NeurIPS、ICML、ICLR、CVPR、AAAI、ESWA、TNNLS、TKDE等。在校期间获得学生荣誉三十余项,包括博士研究生国家奖学金、吉林省优秀大学生、长春市向上向善好青年、”两优一先“优秀共产党员等。

报告时间:2025年12月16日(周二)上午9:20

报告地点:吉林大学正新楼三楼报告厅