Skip to content

Lumos A Library for Diagnosing Metric Regressions in Web Scale Applications

Introduction

对于软件devops人员来说,当完成新版本的上线之后,我想要通过线上指标的变化知道新版本是不是有什么问题,如果有问题的话最好还能有个推荐的根因。

但是有几个挑战,首先是异常检测算法误报很多,其次是很多指标异常并不是actionable的,比如用户群体的变化,这种就不需要打扰devops人员了。

这个工具就是主要解决了这两个问题导致的误报,然后对剩下的异常推荐根因feature(不是维度组合,只有维度)

Lumos A Library for Diagnosing Metric Regressions in Web-Scale Applications_image_1

Methodology

Evaluation

Thinking and Conclusion


Last update : July 1, 2023
Created : February 13, 2023

Comments

Comments