中文 | English

👤 Bio

我正在中国科学技术大学（University of Science and Technology of China）攻读计算机专业博士，我的导师是李向阳教授（ACM Fellow, IEEE Fellow）。我的研究兴趣是复杂网络中人工智能模型推理优化（主要方向），也涉及研究物联网智能感知领域。我的简历here（实时更新），欢迎通过邮件与我联系。

🎓 Education

2022.09 - 至今 中国科学技术大学计算机学院攻读计算机专业博士研究生。
2020.09 - 2022.06 中国科学技术大学计算机学院攻读计算机专业硕士研究生。
2016.09 - 2020.06 重庆大学(985) 弘深学院/计算机学院获得计算机专业本科学位。

📰 News

[2025.04] 🎉 我以第一作者身份在 CCF B类会议IWQoS 2025 上发表了一篇论文，感谢老师的指导和同学的帮助！
[2025.02] 🎉 我在美国费城AAAI’25上进行了Oral报告，展示材料可参见slides，旅途摄影分享见blog。
[2025.02] 🎉 USTC DeepSeek正式上线！我深度参与学校的DeepSeek服务开发中，并负责了昇腾集群上的模型部署和一些其他辅助工作，也踩了不少坑，可以参见blog。
[2024.12] 🎉 我们与蔚来汽车公司的智能座舱大模型推理优化合作项目圆满结束，我以第一作者发表论文工作被CCF A类会议AAAI录用！
[2024.12] 🎉 我以共同一作身份在CCF A类会议INFCOM上发表论文，感谢Bowen Zhang、Jiahui Hou等所有作者的努力！
[2024.11] 🎉 在 泛在智能感知技术创新应用大赛 中获得三等奖。
[2024.10] 🎉 我以合作者身份参与CCF A类中文期刊计算机学报上发表一篇论文，感谢老师的指导和每一位同学的努力！
[2024.08] 🎉 我以第一作者身份在 CCF A类期刊TMC(SCI一区Top) 上发表一篇论文，感谢老师的指导和同学的帮助！

📚 Publications

[AAAI’25 Oral] A-VL: Adaptive Attention for Large Vision-Language Models. [paper] [code] [slide]
Junyang Zhang, Mu Yuan, Ruiguang Zhong, Puhan Luo, Huiyou Zhan, Ningkang Zhang, Chengchen Hu, Xiangyang Li.
The 39th Annual AAAI Conference on Artificial Intelligence (AAAI 2025, CCF-A)
[TMC’24] WordWhisper: Exploiting Real-Time, Hardware-Dependent IoT Communication Against Eavesdropping.
Junyang Zhang; Jiahui Hou; Ye Tian; Xiang-Yang Li.
IEEE Transactions on Mobile Computing (IEEE TMC, CCF-A, 中科院一区Top, JCR Q1)
[INFOCOM’25] TensAllo: Adaptive Deployment of LLMs on Resource-Constrained Heterogeneous Edge Devices.
Bowen Zhang, Junyang Zhang(共同一作), Jiahui Hou and Yixin Wang.
IEEE Conference on Computer Communications (IEEE INFOCOM, CCF-A)
[IWQoS’25] Deploy Efficient Large Language Model Distributed Inference Pipeline for Heterogeneous GPUs.
Junyang Zhang, Jiahui Hou, Bowen Zhang and Xiang-Yang Li.
IEEE/ACM International Symposium on Quality of Service (IEEE/ACM IWQoS, CCF-B)
[计算机学报] 面向智能物联网的资源高效模型推理综述
袁牧，张兰，姚云昊，张钧洋，罗溥晗，李向阳.
CHINESE JOURNAL OF COMPUTERS 计算机学报 (中文CCF-A)
[PrePrint] PICE: A Semantic-Driven Progressive Inference System for LLM Serving in Cloud-Edge Networks.
Huiyou Zhan, Xuan Zhang, Haisheng Tan, Han Tian, Dongping Yong, Junyang Zhang, Xiang-Yang Li.
arXiv
[PrePrint] DERMARK: A Dynamic, Efficient and Robust Multi-bit Watermark for Large Language Models.
Qihao Lin, Chen Tang, Lan zhang, Junyang zhang, Xiangyang Li.
arXiv

📝 Research

模型推理优化

模型推理优化【主要研究】：关注深度学习模型在实际应用落地时的性能瓶颈，提高深度学习模型的推理效率、降低计算成本、减少延迟，并在保持或提升准确率的前提下优化资源利用，做到快、好、省。

【应用项目】蔚来汽车校企合作项目“基于大模型的智能座舱推理优化”中负责研究多模态大模型计算优化，降低计算负载、减少推理时延并且降低KV Cache显存占用。
【应用项目】华为校企合作项目“端侧AI能效比提升”中负责研究异构算力下的大模型分布式推理优化，提升异构算力下的推理吞吐，提高资源利用率。
【应用项目】百度校企合作项目“面向ESG专业领域问答系统”中参与研发行业知识库和大模型问答系统，针对垂直领域知识问答进行真实系统优化。
【论文一作】【CCF A】A-VL: Adaptive Attention for Large Vision-Language Models.
【论文一作】【CCF B】Deploy Efficient Large Language Model Distributed Inference Pipeline for Heterogeneous GPUs.
【论文共一】【CCF A】TensAllo: Adaptive Deployment of LLMs on Resource-Constrained Heterogeneous Edge Devices.
【论文合作】PICE: A Semantic-Driven Progressive Inference System for LLM Serving in Cloud-Edge Networks.
【论文合作】【CCF A】面向智能物联网的资源高效模型推理综述。

智能无线感知

智能无线感知：人工智能与信息感知技术的深度融合，利用无线信号进行环境感知、目标检测和行为识别的技术，突破了传统传感器对光照、可视角度等限制，具备低功耗、非接触、高精度的优势。主要技术涉及多源复杂时序信号处理、分析和预测等，从信噪比极低的时序信号中剥离出物理世界的感知信息。研究过程中需要硬件知识、物理学知识等相交叉。智能感知往往能通过常见的无线信号做出意想不到的黑科技，灵感先行、创意无限！

【论文一作】【CCF A】WordWhisper: Exploiting Real-Time, Hardware-Dependent IoT Communication Against Eavesdropping

模型推理安全

模型推理安全：模型推理安全可以分为推理前（输入安全）、推理中（权重安全）和推理后（输出安全）。而从目标上来看，又分为计算过程中的全程数据保护（私密）和计算结束后的鉴权溯源（公开）。我和我的合作伙伴主要关注于智能模型计算后的鉴权溯源，保护各方的合法利益。

【论文合作】DERMARK: A Dynamic, Efficient and Robust Multi-bit Watermark for Large Language Models

🌏 Service

课程助教：担任中科大研究生课程“计算机应用数学”的助教；
组织工作：担任研究生智能物联党支部的组织委员；
志愿活动：图灵大会志愿者、学院晚会志愿者等等……

💫 Hobbies

除了科研工作，我也喜欢摄影（尼康佬）、音乐、游戏，欢迎交流。我喜欢健身，但也喜欢美食，这两个爱好的效果经常互相抵消😭。我喜欢主持，曾经主持过两场校级、一场院级、两场实验室级的各类晚会，认识新朋友总是很开心。我还喜欢折腾各种稀奇古怪的代码项目，成就感总是驱动着我不断探索下一站。
既要努力工作、也要享受生活，螺旋上升方为持久之道。✨

张钧洋 Junyang Zhang