首页 新闻 市场 科技 财经 商业 地产 手机版
国际 国内 产业 宏观 股市 公司 动态 行情 业界 电商 数码 手机 银行 理财 数据 金融 产经 生活 评论 观察 房产 家居 趋势 楼市

阿里云回应故障:运维操作失误 将认真复盘改进

http://www.tzgcjie.com 来源: 蓝鲸TMT 李晓利            发布时间:2018-06-28 08:57:27

蓝鲸TMT628日讯,今日凌晨,阿里云对昨日出现的大规模问题在官方微博上作出官方回应。回应称,我们在运维上的一个操作失误,导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题。

对于复盘故障原因,回应称,工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这一功能在测试环境验证中并未发生问题,上线到自动化运维系统后,触发了一个未知代码bug。错误代码禁用了部分内部IP,导致部分产品访问链路不通。后续人工介入后,工程师团队快速定位问题进行了恢复。

6月27日下午,网友在微博反馈阿里云控制台访问出现故障,后台无法登陆。阿里云官网的部分管控功能,及MQ、NAS、OSS等产品的部分功能也出现访问异常现象,部分用户反馈称手机端和PC端均无法访问。随后阿里云在官网发布公告称,部分管控功能出现访问异常,受影响业务正逐渐恢复正常。

以下为阿里云故障官方回复原文:

  6月27日阿里云故障说明

  6月27日下午,我们在运维上的一个操作失误,导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题,引发了大员吐槽。故障于北京时间2018年6月27日,16:21左右开始,16:50分开始陆续恢复。

  经过紧急技术复盘,故障原因如下:

  当天下午,工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这一功能在测试环境验证中并未发生问题,上线到自动化运维系统后,触发了一个未知代码bug。错误代码禁用了部分内部IP,导致部分产品访问链路不通。后续人工介入后,工程师团队快速定位问题进行了恢复。

  受影响范围包括阿里云官网控制台,以及MQ、NAS、OSS等产品功能。对于这次故障,没有借口,我们不能也不该出现这样的失误!我们将认真复盘改进自动化运维技术和发布验证流程,敬畏每一行代码,敬畏每一份托付。

  阿里云计算有限公司

  2018年6月27日

【免责声明】 凡本站未注明来源为投资观察界:www.tzgcjie.com的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。其他媒体、网站或个人转载使用时必须保留本站注明的文章来源,并自负法律责任。 如您不希望作品出现在本站,可联系我们要求撤下您的作品。联系邮箱:xinxifankuui@163.com
责任编辑:
首页 | 新闻 | 市场 | 科技 | 财经 | 商业 | 地产