Future.com,北京,12月15日(記者 張炳青 蘇建軍)12日晚,“菜鳥APP崩潰,包裹無法正常顯示,取件碼和物流相關資訊也看不到。 隨後,菜鳥接卡碼的話題出現在微博熱搜上。
菜鳥公關部相關負責人告訴 Future.com 記者,“目前有一段靜默期,我不能再接受採訪了。 一切以公司回覆為準,12日晚間新人app取件碼出現短時間顯示異常,經過技術生快速調查,已正常修復。 對於給您帶來的不便,我們深表歉意。 ”
對於此次事故的原因,該負責人表示,“由於短暫的技術原因,維修很快就完成了。 ”
新浪微博截圖。
今年以來,多款熱門應用在熱搜上被“坍塌”。
菜鳥並不是今年第乙個因應用崩潰而登上熱搜的APP,記者盤點了各大網際網絡廠的系統崩潰,發現2024年,唯品會、滴滴、嗶哩嗶哩等各大廠的APP相繼下線,共計14倍。
今年3月29日,多位網友表示,唯品會倒閉,無法登入。 唯品會在其官方微博上回應稱,由於短期系統故障,主站“加購”等功能可能出現異常。
B站今年兩次“坍塌”,3月5日20:20左右,B站活躍使用者高峰期,不少網友發現B站手機和電腦無法訪問**詳情頁,當晚B站團隊在故障20分鐘後解決了問題。 6月28日下午,不少網友反映“B站倒塌”,該詞條隨後登上熱搜。 主要受影響的是“劇”和“影視”頁面,使用者反映“追粉絲不斷提示你無法獲取**內容”、“顯示頁面載入失敗”、“看粉絲中途無法載入”。 問題持續了大約乙個小時,對於墜機原因沒有具體解釋。
10月23日,螞蟻集團旗下文件編輯協作工具Yuque遭遇伺服器宕機近8小時,導致**文件和官網無法開啟。
今年雙11後的第一天,鮮宇、釘釘、阿里雲盤、餓了麼、天貓精靈、菜鳥、夸克、玉闕等阿里APP紛紛無法訪問或出現異常服務,“XX崩潰”迅速衝上微博熱搜榜。
11月27日,多地使用者反映滴滴出行APP無法使用,出現地圖載入不、計程車打車不行、自行車在寒風中鎖不上等情況,故障時間長達12小時。
12月3日晚,騰訊**APP出現“首頁內容無法載入”、“VIP使用者無法**會員**”等,相關話題立即成為熱搜詞。
而在12月12日晚間,不少網友反映“菜鳥APP崩潰,包裹無法正常顯示,提貨碼和物流相關資訊也看不出來”。
宕機是由系統故障、人員優化和雲服務技術故障引起的。
今年的停機時間似乎特別長。 然而,並不是每個人都願意透露事故原因。 據專業人士介紹,硬體系統故障、人員優化、雲服務技術故障等都是引發宕機的原因。
據**報道,6月5日,唯品會發布《關於329機房停機故障處理的公告》。 公告顯示,3月29日(00:14-12:01),南沙IDC製冷系統故障導致機房裝置溫度快速公升高並停機,導致線上服務暫停。 事故持續12小時,造成效能損失超過1億元,影響客戶800萬,判定為P0級故障。
唯品會表示,此次事故暴露了災後恢復應急預案和風險防範措施不到位,決定嚴肅處理。 事故由本部門直屬主管承擔責任,基礎平台部門負責人應予辭退職並給予相應處理。
隨著行業技術的逐步成熟和規範的容災機制,面對製冷系統,可以有效避免災害應急響應等不可抗力因素,但這有別於因人員優化或技術原因導致運維缺乏上下游對接。
某上市科技公司硬體產品經理告訴 Future.com 記者,在這種規模的公司裡,發生這麼大的技術事故是非常困難的,但一旦出現,就會影響到很多人的日常生活,比如出行、辦公等,大家的關注度都會比平時高。 大多數崩潰發生在他們自己的演算法、硬體或他們自己的技術團隊的級別。
自建技術團隊的原因已經刊登在B站“嗶哩嗶哩科技”技術團隊的公眾號上,這是一篇技術分析《2021》的長文。07.13 我們就是這樣崩潰的“,提到運維團隊在做專案時有乙個弊端,開發完成後,自測會開始灰度上線,沒有專業測試團隊的干預,”這個元件太核心了,需要引入基礎元件測試團隊,對SLB輸入引數做乙個完整的異常測試。 ”
或多或少與今年各大廠的人員調整有關。 據上述產品經理介紹,或多或少運維團隊上下游合作可能會出現問題,現在各大網際網絡平台的基礎設施層已經非常成熟,在存量市場下,業務併發不會暴漲,在團隊穩定的前提下,類似問題應該不會頻繁發生。
不過,也有業內人士質疑,技術操作失誤導致的APP故障。
以11月27日的滴滴出行app崩潰為例,官方對事故原因的回應是“底層系統軟體故障”。 有網友在論壇中討論,“乙個非常大的 K8S 集群進行了熱公升級,由於某種原因,所有的 Pod(容器)都被殺死了,而且 K8s 的元資料已經被新版 K8s 修改了,無法回滾,所以恢復時間很長。 ”
雲猿資料創始人兼CEO、阿里雲資料庫前總經理曹偉在個人***文章中解釋,這種說法並非毫無根據。 曹偉表示,滴滴團隊近兩個月一直在將公司內部的K8S從1改成1版本 12 已公升級到 120、兩個版本之間有相當大的差距。 K8S 官方推薦的方法是從乙個版本到另乙個版本向上爬。 然而,滴滴團隊認為多次公升級風險更大,並採用了跨越八個版本的直接公升級策略。 曹偉認為,這種策略在理論上是可行的,但中間可能會遇到意想不到的因素,比如運維誤操作,導致最終的大規模失敗。
體制機制仍需不斷完善。
面對同樣的崩潰,各大工廠的響應速度和解決方案都不盡相同。
12月3日晚,騰訊**系統出現故障,騰訊**僅發布簡短公告回應:“騰訊**出現暫時性技術問題,我們正在加緊修復,各項功能正在逐步恢復中。 ”
11月27日晚,滴滴APP系統故障,全國大面積坍塌,服務無法正常使用。 滴滴最終發表道歉宣告,並解釋稱,中斷的原因是底層系統軟體故障。 滴滴也第一時間進行了較為全面的整治措施,做好了系統恢復後的各項善後工作,所有因系統故障導致的異常訂單都會統一處理,並同時發放10元優惠券。
相比之下,一些大型廠商只修復bug,不做其他回應,面對使用者的投訴,也不做實質性的賠償。 上述產品經理在接受 Future.com 記者採訪時表示,只有使用者要求高,企業才能高質量發展,更何況目前使用者要求不高,正常使用APP才是基本需求。 網際網絡行業進入存量市場時,要不斷優化自身技術,完善抗風險機制,在關鍵崗位配置專人,減少人才流失。
網際網絡、大資料、雲計算、人工智慧、區塊鏈......數字經濟日益融入各領域經濟社會發展的全過程,已成為人們日常生活中不可分割的一部分。 作為其中的重要一環,網際網絡龍頭企業提供的數字公共產品和平台在一定程度上具有公共基礎設施的屬性。
在數字經濟時代,我們面臨著資料確權、資料流通、資料安全等諸多新問題,這些問題歸根結底源於體制機制的不完善。 中國電子資訊產業發展研究院院長張立在接受採訪時表示。
事實上,這種風險在國家層面由來已久。 《網路安全法》第十條規定,建設、運營網路或者通過網路提供服務,應當依照法律、行政法規的規定和國家標準的強制性要求,採取技術措施和其他必要措施,保障網路安全穩定執行。 有效應對網路安全事件,防範網際網絡違法犯罪活動,維護網路資料的完整性、保密性和可用性。
第二十五條規定,網路運營者應當制定網路安全事件應急預案,及時處置系統漏洞、計算機病毒、網路攻擊、網路入侵等安全風險一旦發生危害網路安全的事件,立即啟動應急預案,採取相應的補救措施,並按照規定向有關主管部門報告。