👤 Bio
我正在中国科学技术大学(University of Science and Technology of China)攻读计算机专业博士,我的导师是李向阳教授(ACM Fellow, IEEE Fellow)。我的研究兴趣是复杂网络中人工智能模型推理优化(主要方向),也涉及研究物联网智能感知领域。我的简历here(实时更新),欢迎通过邮件与我联系。
🎓 Education
- 2022.09 - 至今 中国科学技术大学 计算机学院 攻读计算机专业博士研究生。
- 2020.09 - 2022.06 中国科学技术大学 计算机学院 攻读计算机专业硕士研究生。
- 2016.09 - 2020.06 重庆大学(985) 弘深学院/计算机学院 获得计算机专业本科学位。
📰 News
- [2025.04] 🎉 我以第一作者身份在 CCF B类会议IWQoS 2025 上发表了一篇论文,感谢老师的指导和同学的帮助!
- [2025.02] 🎉 我在美国费城AAAI’25上进行了Oral报告,展示材料可参见slides,旅途摄影分享见blog。
- [2025.02] 🎉 USTC DeepSeek正式上线!我深度参与学校的DeepSeek服务开发中,并负责了昇腾集群上的模型部署和一些其他辅助工作,也踩了不少坑,可以参见blog。
- [2024.12] 🎉 我们与蔚来汽车公司的智能座舱大模型推理优化合作项目圆满结束,我以第一作者发表论文工作被CCF A类会议AAAI录用!
- [2024.12] 🎉 我以共同一作身份在CCF A类会议INFCOM上发表论文,感谢Bowen Zhang、Jiahui Hou等所有作者的努力!
- [2024.11] 🎉 在 泛在智能感知技术创新应用大赛 中获得三等奖。
- [2024.10] 🎉 我以合作者身份参与CCF A类中文期刊计算机学报上发表一篇论文,感谢老师的指导和每一位同学的努力!
- [2024.08] 🎉 我以第一作者身份在 CCF A类期刊TMC(SCI一区Top) 上发表一篇论文,感谢老师的指导和同学的帮助!
📚 Publications
[AAAI’25 Oral] A-VL: Adaptive Attention for Large Vision-Language Models. [paper] [code] [slide]
Junyang Zhang, Mu Yuan, Ruiguang Zhong, Puhan Luo, Huiyou Zhan, Ningkang Zhang, Chengchen Hu, Xiangyang Li.
The 39th Annual AAAI Conference on Artificial Intelligence (AAAI 2025, CCF-A)[TMC’24] WordWhisper: Exploiting Real-Time, Hardware-Dependent IoT Communication Against Eavesdropping.
Junyang Zhang; Jiahui Hou; Ye Tian; Xiang-Yang Li.
IEEE Transactions on Mobile Computing (IEEE TMC, CCF-A, 中科院一区Top, JCR Q1)[INFOCOM’25] TensAllo: Adaptive Deployment of LLMs on Resource-Constrained Heterogeneous Edge Devices.
Bowen Zhang, Junyang Zhang(共同一作), Jiahui Hou and Yixin Wang.
IEEE Conference on Computer Communications (IEEE INFOCOM, CCF-A)[IWQoS’25] Deploy Efficient Large Language Model Distributed Inference Pipeline for Heterogeneous GPUs.
Junyang Zhang, Jiahui Hou, Bowen Zhang and Xiang-Yang Li.
IEEE/ACM International Symposium on Quality of Service (IEEE/ACM IWQoS, CCF-B)[计算机学报] 面向智能物联网的资源高效模型推理综述
袁牧,张兰,姚云昊,张钧洋,罗溥晗,李向阳.
CHINESE JOURNAL OF COMPUTERS 计算机学报 (中文CCF-A)[PrePrint] PICE: A Semantic-Driven Progressive Inference System for LLM Serving in Cloud-Edge Networks.
Huiyou Zhan, Xuan Zhang, Haisheng Tan, Han Tian, Dongping Yong, Junyang Zhang, Xiang-Yang Li.
arXiv[PrePrint] DERMARK: A Dynamic, Efficient and Robust Multi-bit Watermark for Large Language Models.
Qihao Lin, Chen Tang, Lan zhang, Junyang zhang, Xiangyang Li.
arXiv
📝 Research
模型推理优化
模型推理优化【主要研究】:关注深度学习模型在实际应用落地时的性能瓶颈,提高深度学习模型的推理效率、降低计算成本、减少延迟,并在保持或提升准确率的前提下优化资源利用,做到快、好、省。
- 【应用项目】蔚来汽车校企合作项目“基于大模型的智能座舱推理优化”中负责研究多模态大模型计算优化,降低计算负载、减少推理时延并且降低KV Cache显存占用。
- 【应用项目】华为校企合作项目“端侧AI能效比提升”中负责研究异构算力下的大模型分布式推理优化,提升异构算力下的推理吞吐,提高资源利用率。
- 【应用项目】百度校企合作项目“面向ESG专业领域问答系统”中参与研发行业知识库和大模型问答系统,针对垂直领域知识问答进行真实系统优化。
- 【论文一作】【CCF A】A-VL: Adaptive Attention for Large Vision-Language Models.
- 【论文一作】【CCF B】Deploy Efficient Large Language Model Distributed Inference Pipeline for Heterogeneous GPUs.
- 【论文共一】【CCF A】TensAllo: Adaptive Deployment of LLMs on Resource-Constrained Heterogeneous Edge Devices.
- 【论文合作】PICE: A Semantic-Driven Progressive Inference System for LLM Serving in Cloud-Edge Networks.
- 【论文合作】【CCF A】面向智能物联网的资源高效模型推理综述。
智能无线感知
智能无线感知:人工智能与信息感知技术的深度融合,利用无线信号进行环境感知、目标检测和行为识别的技术,突破了传统传感器对光照、可视角度等限制,具备低功耗、非接触、高精度的优势。主要技术涉及多源复杂时序信号处理、分析和预测等,从信噪比极低的时序信号中剥离出物理世界的感知信息。研究过程中需要硬件知识、物理学知识等相交叉。智能感知往往能通过常见的无线信号做出意想不到的黑科技,灵感先行、创意无限!
- 【论文一作】【CCF A】WordWhisper: Exploiting Real-Time, Hardware-Dependent IoT Communication Against Eavesdropping
模型推理安全
模型推理安全:模型推理安全可以分为推理前(输入安全)、推理中(权重安全)和推理后(输出安全)。而从目标上来看,又分为计算过程中的全程数据保护(私密)和计算结束后的鉴权溯源(公开)。我和我的合作伙伴主要关注于智能模型计算后的鉴权溯源,保护各方的合法利益。
- 【论文合作】DERMARK: A Dynamic, Efficient and Robust Multi-bit Watermark for Large Language Models
🌏 Service
- 课程助教:担任中科大研究生课程“计算机应用数学”的助教;
- 组织工作:担任研究生智能物联党支部的组织委员;
- 志愿活动:图灵大会志愿者、学院晚会志愿者等等……
💫 Hobbies
除了科研工作,我也喜欢摄影(尼康佬)、音乐、游戏,欢迎交流。我喜欢健身,但也喜欢美食,这两个爱好的效果经常互相抵消😭。我喜欢主持,曾经主持过两场校级、一场院级、两场实验室级的各类晚会,认识新朋友总是很开心。我还喜欢折腾各种稀奇古怪的代码项目,成就感总是驱动着我不断探索下一站。
既要努力工作、也要享受生活,螺旋上升方为持久之道。✨
