资讯公告
  • 你的位置:
  • 首页
  • >
  • 资讯公告
  • >
  • 云计算
  • >
  • IBM云计算再次陷入困境:两周内第二次重大故障
IBM云计算再次陷入困境:两周内第二次重大故障
发布时间:2025-06-04 发布者:FebHost

IBM云计算再次陷入困境:两周内第二次重大故障


IBM 云服务在两周内第二次发生重大故障,导致全球用户无法登录、管理资源或访问关键服务。


此次故障影响了 41 项服务,包括 IBM 云服务、AI 助手、DNS 服务、Watson AI、全球搜索服务、Hyper Protect 加密服务、数据库以及安全与合规中心。


此次故障持续了数小时,于周一上午9:05 UTC开始,并于当晚11:10 UTC得到解决。根据IBM的状态更新报告,用户无法通过控制台、命令行界面(CLI)或应用程序接口(API)登录IBM云。在此期间,他们也无法管理或配置云资源。此外,IAM认证失败、支持门户访问中断,以及客户应用程序的数据路径可能受到影响。


IBM已启动调查并采取初步缓解措施,于6月2日UTC时间19:42开始实施受控恢复流程以恢复系统。截至UTC时间23:12,IBM已完成核心恢复操作,用户可对应用程序进行健康检查。


该事件被归类为严重性一级(Sev-1)事件,导致客户收到关于IAM身份验证失败的邮件,无法访问支持门户处理支持案例,以及客户应用程序数据路径可能受到影响。


IBM尚未立即回应置评请求。


不仅仅是身份验证漏洞?


“云登录中断——即使是短暂的——会延迟对关键应用程序的访问,减缓内部协调,并干扰自动化工作流程。影响用户登录或平台访问的云故障并不总是立即引发混乱——但它们会引入摩擦,这种摩擦会迅速累积,”Greyhound Research首席分析师兼首席执行官Sanchit Vir Gogia表示。


戈吉亚指出,多区域影响表明问题可能超出认证漏洞范畴——通常指向共享后端组件,如全球域名解析层、编排控制器或遥测服务。"与计算或存储故障通常局限于局部不同,控制平面弱点会跨区域蔓延,使故障更难控制,并对管理分布式工作负载的企业团队造成更大干扰。核心平台功能缺乏区域解耦仍是CIO在平衡合规性、性能与隔离性时面临的挑战,"戈吉亚说道。


类似事件仅在两周前的5月20日发生,持续了2小时10分钟。此次故障影响了14项服务,包括IBM Cloud、VPC客户端VPN、Code Engine和Kubernetes服务等。此次全球云平台故障期间,用户在通过用户界面(UI)、命令行界面(CLI)甚至基于API密钥的认证尝试登录时均遇到失败。


CMR行业研究集团副总裁普拉布·拉姆(Prabhu Ram)指出,当登录或IAM服务出现故障时,关键业务工作负载可能陷入停滞,并引发跨服务和区域的连锁中断。

文章相关标签: IBM 重大故障 云计算
购物车