福州金嘉实业有限公司

首页 >> 师资队伍 >> 人工智能系 >> 教授 >> 正文

孙晓帅国家级重点青年人才项目入选者、福建省杰青、教授、博士生导师

哈尔滨工业大学博士（2015）、昆士兰大学博士后（2016）

研究方向：计算机视觉、跨媒体计算、深度学习对抗攻防

电子邮件：xssun (AT) xmu.edu.cn

个人主页：https://mac.xmu.edu.cn/xssun/

个人简历：

研究方向为多媒体大数据分析与挖掘、深度学习对抗攻防。发表IEEE TPAMI、TIP、TMM、ICCV、CVPR等中国计算机学会A类及JCR一区论文50余篇，谷歌学术引用3476余次，H因子31。主持国家自然科学基金联合基金重点项目1项/面上1项/青年1项、腾讯/百度等企业合作项目3项。曾获得2011年微软学者奖、2020年度福建省科技进步一等奖（第二完成人）、2020年度福州市科技进步一等奖（第六完成人），2021年度福建省杰出青年科学基金。

2014年毕业于哈尔滨工业大学计算机应用技术专业，获工学博士学位。2015年9月至2016年12月，在澳大利亚昆士兰大学信息技术与电气工程学院，任博士后研究员。2016年9月至2019年5月在哈尔滨工业大学计算机科学与技术学院任讲师，2019年6月加盟福州金嘉实业有限公司，任人工智能系副教授，2023年8月任教授。

【学术兼职】

中国计算机学会计算机视觉专委会委员
中国计算机学会多媒体技术专委会通讯委员
中国图象图形学学会情感计算与理解专委会委员
《中国科学：技术科学》特邀编辑
十余个期刊审稿人，包括：

《国家科学评论》(National Science Review，NSR)
IEEE Transactions on Image Processing (TIP)
IEEE Transactions on Circuits and Systems for Video Technology (TCSVT)
IEEE Transactions on Multimedia (TMM)
Pattern Recognition (PR)

领域多个顶级会议TPC Member，包括CVPR/ICCV/ECCV/AAAI/IJCAI/MM等。

【项目情况】

国家自然科学基金委员会, 联合基金重点项目, U22B2051, 强干扰下跨媒体深度感知与可解释性关键技术, 2023-01-01 至2026-12-31, 253万元, 在研, 主持
国家自然科学基金委员会, 面上项目, 62072389, 面向深度学习的对抗攻防技术研究, 2021-01-01 至2024-12-31, 57万元, 在研, 主持
国家自然科学基金委员会, 青年科学基金项目, 61702136, 异构媒体深度分析与跨领域理解, 2018-01-01 至 2020-12-31, 25万元, 结题, 主持
腾讯科技（上海）有限公司, 校企合作项目，深度模型压缩与加速, 2022-01 至 2023-07, 60万元, 在研, 主持
腾讯科技（上海）有限公司, 校企合作项目，深度模型对抗攻击与防御, 2020-11 至 2021-11, 40万元, 结题, 主持
中国计算机学会-百度公司, CCF-百度松果基金, 面向小样本哈希学习方法的研究, 2020-11 至 2021-11, 15万元, 结题, 主持

【代表性论文】

Jingjia Huang, Yinan Li, Jiashi Feng, Xinglong Wu, Xiaoshuai Sun(通讯作者), Rongrong Ji. Clover: Towards A Unified Video-Language Alignment and Fusion Model. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023, 中国计算机学会A类
Lei Jin, Gen Luo, Yiyi Zhou, Xiaoshuai Sun(通讯作者) , Guannan Jiang , Annan Shu , Rongrong Ji. RefCLIP: A Universal Teacher for Weakly Supervised Referring Expression Comprehension. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023, 中国计算机学会A类
Yiwei Ma , Jiayi Ji , Xiaoshuai Sun(通讯作者) , Yiyi Zhoua , Rongrong Ji. Towards local visual modeling for image captioning. Pattern Recognition (PR), 2023, JCR-1区
Haowei Wang, Jiayi Ji, Yiyi Zhou, Yongjian Wu, Xiaoshuai Sun(通讯作者). Towards Real-Time Panoptic Narrative Grounding by an End-to-End Grounding Network. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2023, 中国计算机学会A类
Mingrui Wu, Jiaxin Gu, Yunhang Shen, Mingbao Lin, Chao Chen, Xiaoshuai Sun(通讯作者). End-to-End Zero-Shot HOI Detection via Vision and Language Knowledge Distillation. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2023, 中国计算机学会A类
Yiwei Ma, Guohai Xu, Xiaoshuai Sun(通讯作者), Ming Yan, Ji Zhang, Rongrong Ji. X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval. ACM International Conference on Multimedia (ACM MM), 2022, 中国计算机学会A类
Jiayi Ji , Xiaoyang Huang , Xiaoshuai Sun(通讯作者) ,Yiyi Zhou, Gen Luo, Liujuan Cao, Jianzhuang Liu. Multi-Branch Distance-Sensitive Self-Attention Network for Image Captioning. IEEE Transactions on Multimedia (TMM), 2022, JCR-1区
Jiayi Ji, Yiwei Ma, Xiaoshuai Sun(通讯作者), Yiyi Zhou, Yongjian Wu, Rongrong Ji. Knowing What to Learn: A Metric-Oriented Focal Mechanism for Image Captioning. IEEE Transactions on Image Processing (TIP), 2022, JCR-1区, 中国计算机学会A类
Yiwei Ma, Jiayi Ji, Xiaoshuai Sun(通讯作者),Yiyi Zhou, Yongjian Wu, Feiyue Huang, Rongrong Ji. Knowing What It Is: Semantic-Enhanced Dual Attention Transformer. IEEE Transactions on Multimedia (TMM), 2022, JCR-1区
Mingrui Wu, Xuying Zhang, Xiaoshuai Sun(通讯作者), Yiyi Zhou, Chao Chen, Jiaxin Gu, Xing Sun, Rongrong Ji. DIFNet: Boosting Visual Information Flow for Image Captioning. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2022, 中国计算机学会A类
Yiyi Zhou, Tianhe Ren, Chaoyang Zhu, Xiaoshuai Sun(通讯作者), Jianzhuang Liu, Xinghao Ding, Mingliang Xu, Rongrong Ji. TRAR: Routing the Attention Spans in Transformer for Visual Question Answering. International Conference on Computer Vision (ICCV), 2021, 中国计算机学会A类
Xuying Zhang, Xiaoshuai Sun(通讯作者), Yunpeng Luo, Jiayi Ji, Yiyi Zhou, Yongjian Wu, Feiyue Huang, Rongrong Ji. RSTNet: Captioning With Adaptive Attention on Visual and Non-Visual Words. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021, 中国计算机学会A类
Jiayi Ji, Yunpeng Luo, Xiaoshuai Sun(通讯作者), Fuhai Chen, Gen Luo, Yongjian Wu, Yue Gao, Rongrong Ji. Improving Image Captioning by Leveraging Intra- and Inter-layer Global Representation in Transformer Network.Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2021, 中国计算机学会A类
Yunpeng Luo, Jiayi Ji, Xiaoshuai Sun(通讯作者), Liujuan Cao, Yongjian Wu, Feiyue Huang, Chia-Wen Lin, Rongrong Ji. Dual-Level Collaborative Transformer for Image Captioning. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2021, 中国计算机学会A类
Xiaoshuai Sun(第一作者), Xuying Zhang, Liujuan Cao, Yongjian Wu, Feiyue Huang, Rongrong Ji. Exploring Language Prior for Mode-Sensitive Visual Attention Modeling. ACM International Conference on Multimedia (ACM MM), 2020, 中国计算机学会A类