写于2025.11.18,纪念 Cloudflare 发生的大规模故障。

今年真是个多事之年啊。

开着组会呢,网站突然就打不开了,接着就是熟悉的小黄云500。还以为是源站挂了,随即关了浏览器再开。好家伙,GPT也卡在前面的Cloudflare Challenge 认证界面。这才意识到:Cloudflare,大抵是又了。而这,已经是今年的第三次了。

网络菩萨、赛博义父,终究要顶不住这泼天的“流量”了吗。


翻了下Telegram,几乎所有群组都炸锅了:“Cloudflare” “宕机” “攻击” 的字样层出不穷。谁也不知道,究竟是一个员工的无心之举,还是一个部门的一次部署失误,亦或是什么组织的大规模网络攻击,导致了这一场灾难。微信群里同样炸了锅:同学嚷嚷着自己看文献的网站打不开、ChatGPT进不去……就连我的博客和一系列Cloudflare Workers服务也没能幸免于难,只剩下了前几天新搭建的 OneLastKiss生成器 还活着 TuT

看着Cloudflare Status那色彩缤纷的,我不由得希望,今年结束之前不要再见到它。

MJJ最不想看见的颜色(笑)

过了几分钟,就连监控Cloudflare状态的Cloudflare Status也炸了。

彻底爆炸的Cloudflare Status

不过还有一部分企业网站幸免于难,比如CSGO国际官网,可能是Enterprise有着不同线路?毕竟ChatGPT挂掉的也只是人机验证部分。这么算来,粗略估算的话,世界上有五分之一的网站应该都受到了影响——从DNS到静态页面托管,再到反向代理。不愧是你,Cloudflare。


在两个小时后,22:50,官方终于发消息称修复完毕。VPS信号旗播报也给到了Level B的重要等级。只能说小老弟还得多练,想达到你谷哥以前Level A还有很长的路呢。


我想到了《球状闪电》。

“摧毁芯片的宏聚变可以使地球这块大硬盘被格式化,越先进的国家受到的打击就越大。而在向信息时代的恢复过程中,将出现一个不确定的全新的世界格局。”

倘若真有一日,互联网全部瘫痪——或是更严重,如同《全频段阻塞干扰》那样——人类的生活会怎么样?是于废墟中携手重建往日的信息时代,还是借混乱之时重建各自渴望的世界格局?


一觉醒来,Cloudflare也发了官方声明,解释本次故障原因:

故障是由于工程师更改了一个数据库系统的权限所引发的。该设置会导致数据库向 Bot 管理系统所使用的“特征文件(feature file)”中输出多重条目,进而导致该特征文件的大小翻了一番。随后,有问题的特征文件被分发到了网络中的所有机器上。

网络中的设备软件对特征文件的大小设定了上限,而翻倍后的文件超过了这一限制,导致软件崩溃。

Cloudflare 一度怀疑这是由超大规模 DDoS 攻击引起的,但很快锁定了核心问题,成功阻止了体积异常的特征文件进一步传播。将其替换为该文件的早期版本后核心流量基本恢复正常流转。但随着流量重新涌入,Cloudflare 最终耗费了数小时来缓解网络各部分增加的负载。

果然是工程师的误操作导致的,唉草台班子 ^__^。不知道工程师是不是被拉去祭天了?这每秒损失可不是挖断国防光缆能比的。