Shenglin Zhang (张圣林)

Shenglin Zhang (张圣林)

Shenglin Zhang is an associate professor at the College of Software, Nankai University. His research interests focus on AIOps, including anomaly detection, failure diagnosis, root cause analysis, failure prediction, etc., for software/network service management. He has published 50+ papers in international conferences, including ATC, WWW, VLDB, KDD, SIGMETRICS, CoNEXT, INFOCOM, IJCAI, ISSRE, IWQOS, etc., and peer-reviewed journals, including IEEE JSAC/TC/TSC/TNSM, etc. Additionally, he won the Best Research Paper Award at ISSRE 2023/2018. He is the PI of 16 projects funded by NSFC, China Postdoctoral Science Foundation, Huawei, ByteDance, ZTE, CERNET, etc. He went to Alibaba as a visiting scholar during 2018-2019.

Before joining Nankai University, he got his Ph. D. in the Department of Computer Science and Technology at Tsinghua University and was awarded the “Outstanding Doctoral Dissertation of Tsinghua University.” His advisers were Professor Dan Pei and Professor Ying Liu. He visited the School of Computer Science, Georgia Institute of Technology, as a visiting scholar, supervised by Professor Jun (Jim) Xu in 2016. Before attending Tsinghua University, he attended Xidian University and received his B.S. in Network Engineering in 2012. He did his internship on Baidu, one of the most significant search engines in the world, from 2014 to 2017. From November 2017 to May 2018, Prof. Dan Pei and he together successfully launched AIOps Challenge, which was the first competition in the area of AIOps. In addition, they also successfully organized the First AIOps Workshop on May 19, 2018.

张圣林现为南开大学软件学院副教授,博士生、硕士生导师,先进计算与关键软件(信创)海河实验室双聘研究员。主要研究方向为基于机器学习的智能运维,包括异常检测、故障定位、根因分析和故障预测等。以第一或通讯作者在CCF A/B类会议或期刊以及IEEE Trans.期刊发表论文30余篇。谷歌学术被引1600余次。申请国内发明专利13项,其中5项已授权。主持国家自然科学基金项目2项, 中国博士后科学基金项目1项,横向项目14项(与华为、字节跳动、网商银行、中兴等合作),并于2022年获CCF-华为胡杨林基金、CCF-腾讯犀牛鸟基金资助。获中国电子学会科技进步一等奖(排名第3)、ISSRE 2023/2018最佳学术论文奖、清华大学优秀博士学位论文、南开大学第九届“良师益友”称号、华为计算产品线“最佳技术合作教授”、麒麟软件“校企合作突出贡献”奖、天津市科技进步一等奖(排名11),入选天津市“131”创新型人才培养工程(第三层次)。指导的研究生获得南开大学优秀硕士学位论文1项,南开大学研究生优秀毕业生1项。

于2017年获清华大学工学博士学位(计算机科学与技术专业),2012年获西安电子科技大学工学学士学位(网络工程专业)。在攻读博士学位期间,曾经赴佐治亚理工学院学习。 于2014-2017年在百度运维部实习, 并于2018-2019年在阿里巴巴从事访问学者研究。

担任CCF A/B类国际会议程序委员会委员11次,CCF青年计算机科技论坛(YOCSEF)天津学术委员会副主席(2023-2024),CCF互联网专委、软件工程专委、服务计算专委执行委员。以执行主席身份在CNCC、CCF中国网络大会、CCF中国数字服务大会组织技术论坛多次,并因此获CCF 2023中国数字服务大会“最佳论坛组织奖”。获得IEEE Outstanding Leadership Award。主编CCF数图焦点文章《智能运维技术》;参与编撰CCF计算机科学前沿丛书《互联网技术十讲》和《中国计算机科技发展报告(2019-2020)》。此外,协助清华大学裴丹教授创办、并担任首届和第六届技术委员会主席的CCF国际AIOps挑战赛已连续成功举办六届,成为CCF互联网专委会三大年度活动之一,累积1325支队伍参赛,超过10万人次线上或线下参与,促进了我国智能运维的人才培养与技术发展。

课题组现在与阿里巴巴、腾讯、华为、字节跳动、中兴、百度、虎牙、云账户、CERNET等国内一流IT公司建立了合作关系,分析互联网服务应用层面和机器层面的数据,解决影响用户体验的问题。课题组欢迎更多优秀的博士研究生个、硕士研究生、本科生加入,共同解决世界级的难题,提高数百万用户的使用体验!

Research Interests

  • Failure detection, diagnosis, and prediction for service/network management
  • Resource scheduling for cloud-native scenario

Professional Activities

  • CCF互联网专委执行委员
  • CCF软件工程专委执行委员
  • CCF服务计算专委执行委员
  • CCF YOCSEF天津副主席
  • TPC member of WSDM 2023/2024
  • TPC member of IEEE/ACM IWQoS 2022/2023
  • TPC member of ICNP 2022/2023
  • TPC member of WWW 2022
  • TPC member of IEEE ISSRE 2019/2020/2021/2022/2023
  • TPC member of ICA3PP 2023
  • TPC member of PRICAI 2023
  • IEEE member
  • ACM member
  • Reviewer of JSAC/TDSC/IoTJ/ASUR/TNSM/JCST
  • TPC member of HDR-Nets 2019/2020
  • TPC member of AIOps Workshop 2020

Courses

Projects

  • 面向多模态数据的大规模云平台故障诊断机制研究,国家自然科学基金面上项目,2023.1-2026.12,项目负责人
  • 面向多语法语义日志的数据中心网络设备异常检测机制研究,国家自然科学基金青年基金项目,2020.1-2022.12,项目负责人
  • 基于日志的数据中心网络设备异常检测机制研究,中国博士后科学基金面上项目,2019.6-2021.5,项目负责人
  • 多模态数据的故障识别与根因定位项目,华为公司合作项目,2023.1-2024.1,项目负责人
  • 面向云原生系统故障的智能诊断,中兴公司合作项目,2023.1-2023.12,项目负责人
  • 基于知识图谱的多态失败日志根因定位机制,CCF-华为胡杨林基金(软件工程专项),2022.10-2023.9,项目负责人
  • 面向大规模数据中心的网络故障诊断与自愈研究,CCF-腾讯犀牛鸟创意基金项目,2022.10-2023.9,项目负责人
  • 云原生环境可观测性-系统隐患发现与故障树构建技术研究合作项目,华为公司合作项目,2022.9-2023.9,项目负责人
  • 集群通信故障诊断技术研究项目,华为公司合作项目,2021.11-2022.11,项目负责人
  • 基于图推理的分布式系统故障定位技术研究,网商银行合作项目,2021.11-2022.11,项目负责人
  • 面向数据中心网络设备的智能异常检测,中兴公司合作项目,2021.9-2022.9,项目负责人
  • OS故障诊断项目,华为公司合作项目,2020.8-2021.8,项目负责人
  • 智能变更评估技术合作项目,华为公司合作项目,2020.4-2021.4,项目负责人
  • 面向机器整体异常的无监督机器聚类和多KPI异常检测模型,字节跳动合作项目,2019.7-2020.6,项目负责人
  • 下一代互联网交换机故障预测机制研究,赛尔网络下一代互联网技术创新项目,2018.12-2019.12,项目负责人
  • 基于日志的数据中心交换机故障预测机制研究,中央高校基本科研业务费专项资金资助项目,2018.1-2019.12,项目负责人
  • AI运维联合创新技术项目,百度,2017.10~2022.10,项目负责人

Selected Honors and Awards

  • 2023 麒麟软件“校企合作突出贡献”奖
  • 2022 华为“最佳技术合作教授”
  • 2021 天津市科技进步一等奖(排名11)
  • 2021 南开大学第九届“良师益友”
  • 2018 天津市“131”创新型人才培养工程第三层次
  • 2018 Best Research Paper Award, IEEE ISSRE
  • 2017 清华大学优秀博士学位论文二等奖

Invited Talks

  • Failure Diagnosis for Large-Scale Cloud Services, Academic Saloon on AIOPS 2023, Beilin, Germany, 05/23/2023
  • Failure Detection, Diagnosis, and Prediction for Large-Scale Cloud Services, Asia Pacific Advanced Network, 03/09/2023, online
  • Failure Detection, Diagnosis, and Prediction for Large-Scale Cloud Services, MS-AIOps workshop (co-located with ISSRE 2021), 10/28/2021, Wuhan, China
  • 数据中心智能故障预测、诊断与溯源,2021 CCF青年精英大会,2021.5.14,沈阳
  • PreFix: Switch Failure Prediction in Datacenter Networks, 第七届中国互联网学术年会,优秀青年学者论坛,2018.9.9,恩施
  • “网络智能运维中的科研问题”,华为网络天下•数据中心技术论坛,2018.6.7,南京
  • “智能运维中的科研问题”,存储联盟“智能存储与智能运维”技术沙龙,2018.4.26,北京

Publications

Selected publications can be found here.

Media Links

Contacts

  • Email: zhangsl at nankai.edu.cn
  • 地址:天津市滨海新区南开大学泰达校区3区407;天津市津南区南开大学津南校区软件楼215

Visits: 23906