头像

董建锋

博士 研究员 | 博士生导师,硕士生导师

学科: 计算机科学与技术,软件工程

职务:

研究中心:

导师类别: 博士生导师,硕士生导师

毕业院校: 浙江大学

办公电话:

地址: 信息楼458

邮编:

邮箱: djf@zjgsu.edu.cn

个人简介

 董建锋,男,1991年2月出生于浙江绍兴,国家高层次青年人才,博士生导师。于2018年获得浙江大学计算机科学与技术专业博士学位,浙江大学-悉尼大学计算机学院联合培养博士。现任浙江工商大学计算机科学与技术学院研究员、可视媒体大数据技术浙江省工程研究中心副主任、软件工程专业系主任。

      研究方向为人工智能、计算机视觉,主要包括多媒体检索与生成、多模态大模型、具身智能、数字内容安全等。近年来,主持国家自然科学基金(面上、青年)、浙江省重点研发计划“领雁”项目、国家重点研发计划子课题、CCF-蚂蚁科研基金等项目10余项;共发表高水平学术论文50余篇,其中以第一/通讯作者在CCF A 类期刊/会议TPAMI,TIP,CVPR,ICCV,NeurIPS等发表论文20余篇;授权中国发明专利20余项。研究成果获得了国内外学者的广泛引用与正面评述,谷歌学术引用 4000 余次,引用超过百次论文10余篇,包括来自60余位中外院士和 ACM/EEE Fellow 团队的引用;2024、2025年连续入选美国斯坦福大学发布的“全球前2%顶尖科学家榜单”。

      在学术获奖和竞赛方面,获得了国际计算机学会ACM Rising Star Award新星奖(杭州分会),入选中国科协“青年人才托举工程”、浙江省高层次人才特殊支持计划青年人才。相关研究成果受到国内外通过认可,曾获中国图学学会优秀博士学位论文奖、中国多媒体大会ChinaMM 2023唯一最佳学生论文奖(1/209)、CSS 2019 最佳论文奖、多媒体领域国际顶级会议ACM Multimedia 2016最佳挑战论文奖等。所研发的技术在国际挑战赛或测评中获得7次冠亚军;其中,在TRECVID 2018的比赛中,带队开发的检索系统显著优于卡内基梅隆大学、南洋理工大学等高校和研究机构的方案。

      在学生培养方面,获得校级“我心目的中好导师”称号。指导本科生、研究生发表多篇CCF A类论文;多位学生获得国奖奖学金(其中,2022年指导的2名硕士生获得国家奖学金,占整个学院的1/2)、浙江省研究生优秀学位论文、校级研究生优秀学位论文等。多位学生毕业后在浙江大学、西安交通大学、合肥工业大学等高校继续深造。

招生信息:本人招收计算机科学与技术、人工智能方向的博士、硕士研究生。对学生较为严格,但同时尊重学生的规划和选择,为学生选择感兴趣的研究课题。欢迎上进心强、吃苦耐劳、踏实认真的同学申请本人研究生,特别是有进一步深造想法的同学,共创美好未来。

本人与浙江大学、北京大学、中国人民大学、武汉大学、华东师范大学、上海人工智能实验室等国内顶尖高校和研究院的导师保持紧密协作,开展常态化的联合指导,能够为学生提供高水平学术培养。同时,与阿里巴巴、海康威视、宇视科技、华数传媒、当虹科技等建立了深厚的合作基础,能够为学生提供丰富的产业实践机会与前沿课题资源。


电子邮箱djf@zjgsu.edu.cn

个人主页    谷歌学术主页


研究方向

人工智能

计算机视觉

多媒体检索与生成

多模态大模型

具身智能

数字内容安全

社会服务领域

教育经历

  • 浙江大学,博士,计算机科学与技术

  • 浙江工业大学,学士,软件工程


工作经历

学术兼职

中国计算机学会CCF YOCSEF 2024-2025杭州主席

中国图学学会可视化与认知计算专委会秘书长

浙江省青年科技工作者协会理事

中国青年科技工作者协会委员。

中国计算机学会多媒体专委会执委

中国图象图形学学会多媒体专委会委员

中国图学学会青年工作委员会委员

中国图学学会计算机图学专委会委员

荣誉及奖励

2025年 浙江工商大学优秀教师称号

2024年 国际计算机学会ACM杭州分会“新星奖” 

2023年 中国多媒体大会ChinaMM 2023唯一最佳学生论文奖 

2023年 浙江工商大学第三届“我心目中的好导师” 

2023年 浙江工商大学优秀共产党员 

2023年 浙江工商大学2022-2023学年“优秀班主任”荣誉称号 

2020年国家一级学会中国图学学会优秀博士学位论文奖 

2019年 安全领域国际会议CSS 2019 Best Paper Award最佳论文奖 

2016年 英国ARM公司创新奖学金一等奖获得者 

2016年 多媒体领域国际顶级会议ACM Multimedia Grand Challenge Award最佳挑战论文奖

研究生课程

  • 高级人工智能,研究生

  • 人工智能基础与实践,研究生

本科生课程

  • Linux系统与编程实践,本科生

  • 解密DeekSeek:从基础到创意实践,本科生

发表论文

*第一作者,#通讯作者

[1]    Jianfeng Dong, Xirong Li, Chaoxi Xu, Xun Yang, Gang Yang, Xun Wang, Meng Wang. Dual Encoding for Video Retrieval by Text. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022. (CCF-A期刊, 影响因子24.314, 被引用294)

[2]   Xianke Chen, Daizong Liu, Xun Yang, Xirong Li, Jianfeng Dong#, Meng Wang, Xun Wang. PRVR: Partially Relevant Video Retrieval. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025. (CCF-A类期刊)

[3]    Xuanzuo Lin, Min Zhang, Daizong Liu, Zhiwen Zuo, Xun Yang, Changting Lin, Xun Wang, Jianfeng Dong. CAST: Context-Aware Dynamic Latent Space Transformation for Interactive Text-to-Image Retrieval. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2026. (CCF-A类会议)

[4]     Jianfeng Dong, Danfeng Luo, Daizong Liu, Jie Sun, Xiaoye Qu, Xun Yang, Dongsheng Liu, Xun Wang. LLM-assisted Entropy-based Adaptive Distillation for Unsupervised Fine-grained Visual Representation Learning. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2025. (CCF-A类会议)

[5]     Jianfeng Dong, Junwei Zhu, Daizong Liu, Xiaoye Qu, Cuizhu Bao, Zhike Han, Jixiang Zhu, and Xun Wang. Open-world fine-grained fashion retrieval with LLM-based commonsense knowledge infusion. Proceedings of the 48th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025. (CCF-A类会议)

[6]     Baolong Liu, Roukai Huang, Xin Pan, Chuanhuang Li, Jie Sun, Jianfeng Dong#, Xun Wang. Advancing Ship Re-Identification in the Wild: The ShipReID-2400 Benchmark Dataset and D2InterNet Baseline Method. Proceedings of the 48th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025. (CCF-A类会议)

[7]     Junan Lin, Daizong Liu, Xianke Chen, Xiaoye Qu, Xun Yang, Jixiang Zhu, Sanyuan Zhang, Jianfeng Dong#. Audio Does Matter: Importance-Aware Multi-Granularity Fusion for Video Moment Retrieval.Proceedings of the 33rd ACM International Conference on Multimedia (ACM MM), 2025. (CCF-A类会议)

[8]     Rui Cai, Zhiyu Dong, Jianfeng Dong#, Xun Wang. Dynamic Adapter with Semantics Disentangling for Cross-lingual Cross-modal Retrieval. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2025. (CCF-A类会议)

[9]     Baolong Liu, Ruiqing Yang, Roukai Huang, WenhaoXu, Xin Pan, Chuanhuang Ll, Bin Wang, XunWang, Jianfeng Dong#. Towards Ship License Plate Recognition in the Wild: A Large Benchmark and Strong Baseline. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2025. (CCF-A类会议)

[10]  Jianfeng Dong, Xiaoman Peng, Daizong Liu, Xiaoye Qu, Xun Yang, Cuizhu Bao, Meng Wang. Temporal Sentence Grounding with Relevance Feedback in Videos. Advances in Neural Information Processing Systems (NeurIPS), 2024. (CCF-A类会议)

[11]  Yabing Wang, Shuhui Wang, Hao Luo, Jianfeng Dong#, Fan Wang, Meng Han, Xun Wang, Meng Wang. Dual-View Curricular Optimal Transport for Cross-Lingual Cross-Modal Retrieval. IEEE Transactions on Image Processing (TIP), 2024. (CCF-A类期刊)

[12]  Yabing Wang, Fan Wang, Jianfeng Dong#, Hao Luo#. CL2CM: Improving cross-lingual cross-modal retrieval via cross-lingual knowledge transfer. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), 2024. (CCF-A类会议)

[13]  Rui Cai*, Jianfeng Dong*, Tianxiang Liang, Yonghui Liang, Yabing Wang, Xun Yang, Xun Wang, and Meng Wang. Cross-lingual cross-modal retrieval with noise-robust fine-tuning. IEEE Transactions on Knowledge and Data Engineering (TKDE). 36, no. 11: 5860-5873, 2024. (CCF-A类期刊)

[14]  Jianfeng Dong, Minsong Zhang, Zheng Zhang, Xianke Chen, Daizong Liu, Xiaoye Qu, Baolong Liu, Xun Wang. Dual Learning with Dynamic Knowledge Distillation for Partially Relevant Video Retrieval. International Conference on Computer Vision (ICCV), 2023. (CCF-A类会议)

[15]  Shengkai Sun, Daizong Liu, Jianfeng Dong#, Xiaoye Qu, Junyu Gao, Xun Yang, Xun Wang, Meng Wang. Unified Multi-modal Unsupervised Representation Learning for Skeleton-based Action Understanding. ACM international conference on Multimedia (ACM MM), 2023. (CCF-A类会议)

[16]  Baolong Liu, Tianyi Zheng, Peng Zheng, Daizong Liu, Xiaoye Qu, Junyu Gao, Jianfeng Dong#, Xun Wang. Lite-MKD: A Multi-modal Knowledge Distillation Framework for Lightweight Few-shot Action Recognition. ACM international conference on Multimedia (ACM MM), 2023. (CCF-A类会议)

[17]  Daizong Liu, Xiaoye Qu, Jianfeng Dong#, Guoshun Nan, Pan Zhou#, Zichuan Xu, Lixing Chen, He Yan, Yu Cheng. Filling the Information Gap between Video and Query for Language-Driven Moment Retrieval. ACM international conference on Multimedia (ACM MM), 2023. (CCF-A类会议)

[18]  Leiming Zhang, Jianfeng Dong#, Cuizhu Bao, Shouling Ji, Xun Wang. Click-through Rate Prediction for Video Cold-start Problem (面向视频冷启动问题的点击率预估). Journal of Software (软件学报), 2021. (中文CCF-A类期间)

[19]  Junan Lin, Cuizhu Bao, Jianfeng Dong#, Xun Yang, Xun Wang. Multilingual Text-Video Cross-Modal Retrieval Model via Multilingual-Visual Common Space Learning (基于多语言-视觉公共空间学习的多语言文本-视频跨模态检索模型). Chinese Journal of Computers (计算机学报), 2024(中文CCF-A类).

[20]  Cuizhu Bao, Kai Ding, Jianfeng Dong, Xun Yang, Mande Xie, Xun Wang. Research Progress of Video Question Answering Technologies (视频问答技术研究进展). Journal of Computer Research and Development (计算机研究与发展), 2024. (中文CCF-A类期间)

[21]  Zhenguang Liu, Xinyang Yu#, Ruili Wang, Shuai Ye, Zhe Ma, Jianfeng Dong#, Sifeng He, Feng Qian, Xiaobo Zhang, Roger Zimmermann, Lei Yang. Video Infringement Detection via Feature Disentanglement and Mutual Information Maximization. ACM international conference on Multimedia (ACM MM), 2023. (CCF-A类会议)

[22]  Jianfeng Dong, Xiaoman Peng, Zhe Ma, Daizong Liu, Xiaoye Qu, Xun Yang, Jixiang Zhu, Baolong Liu. From Region to Patch: Attribute-Aware Foreground-Background Contrastive Learning for Fine-Grained Fashion Retrieval. International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2023. (CCF-A类会议)

[23]  Jianfeng Dong, Shengkai Sun, Zhonglin Liu, Shujie Chen, Baolong Liu, Xun Wang. Hierarchical Contrast for Unsupervised Skeleton-based Action Representation Learning. Thirty-seventh AAAI Conference on Artificial Intelligence (AAAI), 2023. (CCF-A类会议)

[24]  Jianfeng Dong, Xianke Chen, Minsong Zhang, Xun Yang, Shujie Chen, Xirong Li, Xun Wang. Partially Relevant Video Retrieval. ACM international conference on Multimedia (ACM MM, oral), 2022. (CCF-A类会议)

[25]  Yabing Wang*, Jianfeng Dong*, Tianxiang Liang, Minsong Zhang, Rui Cai, Xun Wang. Cross-Lingual Cross-Modal Retrieval with Noise-Robust Learning. ACM international conference on Multimedia (ACM MM), 2022. (CCF-A类会议)

[26]  Jianfeng Dong*, Yabing Wang*, Xianke Chen, Xiaoye Qu, Xirong Li, Yuan He, and Xun Wang. Reading-strategy Inspired Visual Representation Learning for Text-to-Video Retrieval. IEEE Transactions on Circuits and Systems for Video Technology (TCSVT), 2022. (CCF B类期刊,影响因子5.859)

[27]  Jianfeng Dong*, Zhe Ma*, Xiaofeng Mao, Xun Yang, Yuan He, Richang Hong, Shouling Ji. Fine-Grained Fashion Similarity Prediction by Attribute-Specific Embedding Learning. IEEE Transactions on Image Processing (TIP), 2021. (CCF-A期刊, 影响因子10.856)

[28]  Jianfeng Dong, Xun Wang, Leimin Zhang, Chaoxi Xu, Gang Yang, Xirong Li. Feature Re-Learning with Data Augmentation for Video Relevance Prediction. IEEE Transactions on Knowledge and Data Engineering (TKDE), 2021. (CCF-A期刊, 影响因子9.235)

[29]  Jianfeng Dong, Xirong Li, Cees G. M. Snoek. Predicting Visual Features from Text for Image and Video Caption Retrieval. IEEE Transactions on Multimedia (TMM), 2018. (CCF B类期刊, 影响因子8.182, 被引用371)

[30]  Jianfeng Dong, Xirong Li, Duanqing Xu. Cross-Media Similarity Evaluation for Web Image Retrieval in the Wild. IEEE Transactions on Multimedia (TMM), 2018. (CCF B类期刊,影响因子8.182)

[31]  Jianfeng Dong, Xirong Li, Chaoxi Xu, Shouling Ji, Yuan He, Gang Yang, Xun Wang. Dual encoding for zero-example video retrieval. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019. (CCF-A类会议, 被引用356)

[32]  Jianfeng Dong, Xirong Li, Chaoxi Xu, Gang Yang, Xun Wang. Feature Re-Learning with Data Augmentation for Content-based Video Recommendation. ACM international conference on Multimedia (ACM MM), 2018. (CCF-A类会议)

[33]  Jianfeng Dong, Xirong Li, Weiyu Lan, Yujia Huo, Cees G. M. Snoek. Early Embedding and Late Reranking for Video Captioning. ACM international conference on Multimedia (ACM MM), 2016. (CCF-A类会议, 被引用91, 该论文获得ACM Multimedia 2016 Grand Challenge Award)

[34]  Jianfeng Dong, Xirong Li, Shuai Liao, Jieping Xu, Duanqing Xu, Xiaoyong Du. Image Retrieval by Cross-Media Relevance Fusion. ACM international conference on Multimedia (ACM MM), 2015. (CCF-A类会议)

[35]  Zhe Ma, Jianfeng Dong#, Yao Zhang, Zhongzi Long, Yuan He, Hui Xue, Shouling Ji. Fine-Grained Fashion Similarity Learning by Attribute-Specific Embedding Network. Thirty-fourth AAAI Conference on Artificial Intelligence (AAAI), 2020. (CCF-A类会议)

[36]  Xun Yang, Jianfeng Dong#, Yixin Cao, Xun Wang, Meng Wang, Tat-Seng Chua. Tree-Augmented Cross-Modal Encoding for Complex-Query Video Retrieval. International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2020. (CCF-A类会议被引用160)

[37]  Xirong Li, Chaoxi Xu, Gang Yang, Zhineng Chen, Jianfeng Dong#. W2VV++: Fully Deep Learning for Ad-hoc Video Search [C]. ACM international conference on Multimedia (ACM MM), 2019. (CCF-A类会议, 被引用211)


纵向科研

   国家自然科学基金面上项目:资源受限条件下跨模态视频检索研究,负责人

   国家重点研发计划项目子课题:面向模拟与决策协同的城市治理AI技术框架研究,负责人

   浙江省“领雁”科技计划项目:数据知识双轮驱动的跨模态智能检索与生成平台及应用, 负责人

   浙江省“领雁”科技计划项目子课题:超高清数字内容智能生成与版权保护关键技术研究与应用,负责人

   国家自然科学基金青年项目:基于深度学习的跨模态检索方法研究,负责人

   国家重点研发计划项目子课题:目标演员动作细粒度识别技术,负责人

   浙江省自然科学基金青年项目:跨模态检索若干关键问题研究,负责人

   中国科学院自动化研究所模式识别国家重点实验室开放课题:基于弱监督学习的跨模态检索研究,负责人

   信息安全国家重点实验室开放课题:深度学习系统的模型逆向攻击研究, 负责人



横向科研

  • 面向版权保护的视频多模态侵权检测算法研究,阿里巴巴蚂蚁集团委托项目,项目负责人

  • 面向公共安全的跨模态检索研究,海康威视委托项目,项目负责人

  • 交通场景多尺度目标检测技术研发,宇视科技委托项目,技术负责人

出版专著

软件成果

专利

教学论文

教学项目

出版教材

教学奖励

其他

手机扫描二维码

即可访问本教师主页

总访问量:10
11:18