人工智能学院系列学术活动(第66场)——南开大学计算机学院副教授王亚星学术报告

发布时间:2025-08-22 点击:

报告题目:文生图模型中文本和图像表征的思考报告

报告人:王亚星 南开大学计算机学院副教授

报告摘要:

SD模型是一种依赖文本提示来生成图像的扩散模型,其核心优势在于能够精准描述目标图像的内容。不过,该模型在生成与文本语义高度一致的图像时存在一定的困难,并且推理过程相对缓慢。为应对这些挑战,本报告探讨优化文本嵌入的方法,通过移除不相关的信息来澄清复杂文本提示中主要对象之间的关系。此外,为了改善推理速度,本报告引入了特征共享机制,以减少处理时间并提高效率。

报告人简介:

王亚星,南开大学计算机学院副教授,博士生导师,入选海外高层次项目,南开“百名青年学科带头人培养计划”。西班牙巴塞罗那自治大学博士,曾在西班牙巴塞罗那自治大学从事博士后研究。研究方向为扩散模型、生成对抗网络、图像到图像翻译、迁移学习。在IJCV,CVPR,NeurIPS等期刊会议发表论文30余篇,谷歌学术引用3000余次。现担任Computers, Materials & Continua 期刊编委,ECCV Workshop 组织者,在国际顶级期刊和会议TPAMI、NeurIPS、CVPR、ICCV等多次担任期刊和会议审稿人。多模态语言翻译国际竞赛 (WMT16Multimodal Machine Translation challenge) 中 荣获第一名、2022 年粤港澳大湾区(黄埔)国际算法算例大赛(遥感目标检测赛道)亚军(2/116队伍)。主持国家自然科学基金青年项目。

报告时间:2025年825日(星期一)上午9:40

报告地点:吉林大学正新楼三楼报告厅

主办单位:吉林大学人工智能学院