新开传奇私服

传奇私服发布网

当前位置:首页 > 互联网 IT业界 > 持续近87分钟1957个客户报障,腾讯云回应

持续近87分钟1957个客户报障,腾讯云回应

admin 互联网 IT业界 34热度

  本文字数:1951,阅读时长大约 3 分钟

  导读:云平台在追求销量与市场规模的同时,客户的基础运维与数据安全工作,不应因“降本增效”而被忽视。

  作者 第一财经吕倩

  2024 年 4 月 8 日下午,腾讯云出现服务故障,接口响应报错、内部服务错误,网页显示 504 错误。504 错误代表网关超时(Gateway timeout),是指服务器作为网关或代理,但没有及时从上游服务器收到请求。

  4 月 8 日傍晚,腾讯云公告,腾讯云官网控制台相关服务出现异常,工程师正在紧急修复中。部分地区已恢复,其他地区也正在继续抢修当中。

  4 月 14 日,腾讯云官方对 4 月 8 日故障情况进行说明:4 月 8 日 15 点 23 分,腾讯云团队收到告警信息,云 API 服务处于异常状态;随即在腾讯云工单、售后服务群以及微博等渠道开始大量出现腾讯云控制台登录不上的客户反馈。

  经过故障定位发现,客户登录不上控制台正是由云 API 异常所导致。云 API 是云上统一的开放接口集合,客户可以通过 API 以编程方式管理和操控云端资源,云控制台通过组合云 API 提供交互式的网页功能。而事故根本原因在于腾讯云版本变更过程中,没有有效执行沙箱验证和预案演练,暴露了在变更管理上的不足,最终导致云 API 服务新版本向前兼容性考虑不够和配置数据灰度机制不足的问题。

  故障发生后,腾讯云方面表示,依赖云 API 提供产品能力的部分公有云服务,也因为云 API 的异常出现了无法使用的情况,比如云函数、文字识别、微服务平台、音频内容安全、验证码等。此次故障一共持续了近 87 分钟,期间共有 1957 个客户报障。

  从客户的视角来看,云服务可以分为数据面和控制面,数据面承载客户自身的业务,控制面负责操作云上不同产品。比如目前使用最广泛的 IaaS 服务基本上都是以直接面向数据面为主,控制面仅在客户购买或需要对资源层面进行调整操作时会涉及。此次发生故障的控制台和云 API 是对控制面的影响。通俗来讲,如果把云服务类比为酒店,控制台相当于酒店的前台,是一个统一的服务入口。一旦酒店前台发生故障,会导致入住、续住等管理能力不可用,但已入住的客房不受影响。

  腾讯云方面称,这次故障中客户已经配置好的服务器等 IaaS 资源,包括已经部署运行的业务,没有受到云 API 异常的影响。其他以非云 API 方式提供服务的 PaaS 和 SaaS 服务,处于正常服务的状态。但用 API 提供的服务类产品(需要“酒店前台服务“)有不同程度的影响,比如腾讯云存储服务调用当天有明显下滑。期间售后团队协助部分客户做了业务容灾预案的实施,将受影响服务做调度以快速恢复客户的业务服务。

  腾讯云方面表示将从提升系统韧性、强化变更管理与保护措施、增强故障响应与沟通能力三方面进行改进。

  近年来,因云服务问题导致应用程序“崩了”的现象频繁发生。今年 4 月 9 日,支付宝崩了登上热搜,用户反映在使用支付宝 APP 时出现“已经停止访问”的页面。随后支付宝方面回应称:少量用户访问部分页面时出现了短暂性的访问不畅。这一情况已经快速恢复,用户的资金和信息安全都不受影响,各项功能也都可以正常使用。但具体事故原因并未进一步说明。

  2023 年 12 月 3 日晚,腾讯视频“崩了”登上微博热搜。腾讯视频方面回应称,出现了短暂技术问题,正在加紧修复,各项功能在逐步恢复中。

  2023 年 11 月 27 日晚间,滴滴 App 系统发生故障,全国大面积崩溃,服务无法正常使用。11 月 29 日,滴滴方面发表声明称,各项服务已经恢复,初步确定,这起事故的起因是底层系统软件发生故障。

  2023 年 3 月 5 日 20:20 左右,在B站用户活跃的高峰期,许多网友发现B站手机和电脑端均无法访问视频详情页,当晚B站团队在出现故障 20 分钟后解决了问题。多位行业人士倾向于原因是“迭代更新出现代码故障”,这是 2021 年 7 月B站大规模服务器崩溃后的官方解释。

  如果不是滴滴全国范围的长时间崩溃造成大规模的负面影响与讨论度,非行业人士不会将某款软件的暂时“崩了”作为热点讨论。万博智云 CTO 孙琦对第一财经表示,滴滴事件仅是一个个案,但该事件故障级别较大,确实影响到了一定规模普通群众的生活。实际上,很多用户看不到的软件故障正在每天发生,这在行业内是一个较为常见的问题。

  此次腾讯云发生大范围故障,有行业人士将其与 2023 年 11 月阿里云史诗级故障并称。2023 年 11 月 12 日晚间,阿里云发生故障,“阿里云盘崩了” “淘宝又崩了” “闲鱼崩了” “钉钉崩了” 等话题相继登上热搜,阿里系诸多产品受到影响。阿里云对此公告称,2023 年 11 月 12 日 17:44 起,阿里云监控发现云产品控制台访问及 API 调用出现异常,阿里云工程师正在紧急介入排查。18:54 阿里云再度公告称,经过工程师处理,杭州、北京等地域控制台已恢复,其他地域控制台服务逐步恢复中。

  近期国内云平台密集降价,阿里云甚至直接将云产品以折扣形式搬进罗永浩淘宝直播间,传统 IaaS 产品逐渐同质化,云厂商竞争逐渐转为价格竞争。但在追求销量与市场规模的同时,客户的基础运维与数据安全工作,不应因“降本增效”而被忽视。

  微信编辑 七三

更新时间 2024-05-01 13:23:09