发布时间:2025-06-12   浏览次数:309

报告题目:多模态大模型的安全对齐:挑战与解决方案

时间:2025613  下午 14:00

地点:福建师范大学旗山校区科研楼18#1004

主讲:刘航呈 博士后研究员 新加坡南洋理工大学担任

主办:计算机与网络空间安全学院福建省网络安全与密码技术重点实验室,福建省网络与信息安全行业技术开发基地,福建省网络空间安全学会

参加对象:计网学院感兴趣的老师和学生

报告内容:

随着大语言模型(LLMs)能力的拓展,多模态大模型(尤其是视觉语言模型,LVLMs)在图像理解、辅助问答等任务中展现出显著性能。然而,近年来的研究揭示,这类模型在引入视觉模态后,其原本在文本域建立的安全机制无法自然迁移,导致面对图像相关输入时表现出严重的安全性缺陷,甚至会在“看似安全”的输入组合下输出不当或有害内容,给实际部署带来巨大风险。报告围绕多模态模型的跨模态安全对齐问题展开,结合最新研究工作,总结了当前LVLM安全对齐面临的关键问题,并介绍当前几种代表性解决方案的可行性与局限性。



报告人简介:

刘航呈,目前在新加坡南洋理工大学担任博士后研究员,主要研究方向为人工智能安全。研究成果已发表在多个人工智能与信息安全领域的顶级国际会议和期刊上,包括 NeurIPS、ACM CCS、ACM MM、WWW、IEEE TIFS、IEEE TCSVT 等。



 
版权所有 © 联系地址:福建省网络安全与密码技术重点实验室(福建师范大学)  
邮编:350007  联系电话:0591-83456050转406   
访问量:
158962020年11月04日