Backblaze 2024 Q3硬盘故障质量报告解读

作为一家在2021年在美国纳斯达克上市的云端备份公司,Backblaze一直保持着对外定期发布HDD和SSD的故障率稳定性质量报告,给大家提供了一份真实应用场景下的稳定性分析参考数据:

图片

以往报告解读系列参考:

  • Backblaze发布2024 Q2硬盘故障质量报告

  • Backblaze发布2024 Q1硬盘故障质量报告


截至2024年第三季度末,Backblaze在其全球数据中心的云存储服务器中监控着总计292,647个硬盘(HDDs)和固态硬盘(SSDs)。为了专注于数据存储设备的表现,Backblaze从分析中剔除了4,100个引导盘,包括3,344个SSD和756个HDD。因此,本季度报告涵盖了剩余的288,547个用于数据存储的硬盘。

图片

AFR故障率从第二季度的1.71%增长到第三季度的1.89%,显示了季度间AFR持续缓慢上升的趋势

  • 非老化4TB硬盘的影响:尽管4TB硬盘是较老的型号,这些硬盘正在被逐步替换。因此,剩余4TB硬盘的AFR仅为0.26%,表明它们不是此次AFR上升的主要原因。

  • 8TB硬盘的老化问题:实际上,导致AFR上升的主要原因是8TB硬盘群体。这批硬盘平均已服役超过七年,其AFR从第二季度的2.31%跃升至第三季度的3.04%。随着这些硬盘逐渐老化,预计未来几个月内将启动对8TB硬盘的大规模迁移工作。

硬盘型号的变化
  • 4TB Seagate硬盘退出历史舞台:曾经广泛使用的4TB Seagate硬盘(型号ST4000DM000)几乎完全被淘汰。所有包含这些硬盘的Backblaze Vaults已完成迁移,仅剩下两台未列入季度统计表中。

  • 20TB Toshiba硬盘的到来:第三季度迎来了新的20TB Toshiba硬盘(型号MG10ACA20TE),共计3,600台(分布在三个完整的Backblaze Vaults,每个Vault 1,200台)。经过几个月的严格测试后,这款硬盘正式加入了Backblaze可部署硬盘型号列表,标志着存储容量和技术水平的又一次提升。

特定型号的表现亮点
  • 14TB Seagate硬盘零故障记录:连续两个季度,14TB Seagate硬盘(型号ST16000NM00J)保持了零故障的良好记录。尽管目前仅有185pcs在役,但这一表现显示出该型号硬盘具有较高的可靠性。不过,由于样本量较小,未来仍可能存在较大变数。

在Backblaze的Drive Stats数据集中,有一个名为failure的字段用于标记硬盘是否发生故障(1表示故障,0表示正常)。多年来,Backblaze在其发布的各种报告中提到,硬盘故障可以分为反应性和主动性两类,并且这两种类型的故障大致均匀分布。

硬盘故障分类定义
反应性故障(Reactive Failures)
  • 定义:当硬盘出现以下情况之一时,被视为反应性故障:

    • 硬盘崩溃,无法启动或旋转;

    • 硬盘不响应系统命令;

    • 硬盘无法保持正常运行状态。

  • 特点:这些故障通常是突然发生的,导致硬盘立即失效,无法继续提供服务。

主动性故障(Proactive Failures)
  • 定义:主动性故障通常指任何不属于反应性故障的情况,尤其是当SMART统计数据、文件系统检查(如FSCK)等指标显示硬盘存在问题,预示即将发生故障。

  • 特点:这类故障往往伴随着多个预警信号,表明硬盘正在经历困难,但尚未完全失效。因此,可以在问题恶化之前采取预防措施进行更换。

总体来看,反应性和主动性故障的数量非常接近,分别占总故障数的47%和53%,基本符合Backblaze过去提出的50/50假设

图片

为了保证统计数据的有效性和可靠性,Backblaze设定了筛选条件,即每个型号至少要有500台硬盘在运行,并且累计运行天数超过100,000天。这样可以确保样本量足够大,以得到有意义的结果。经过筛选,共有25种型号的硬盘被纳入分析。这些硬盘型号覆盖了不同的容量和品牌。终身AFR是指硬盘在其整个生命周期中的年度化故障率,这可以帮助用户了解不同型号硬盘的长期可靠性表现。

图片

在2024年第二季度,Backblaze记录的硬盘终身AFR为1.47%。然而,在第三季度,这一数值下降到了1.31%,这是一个显著的季度间下降,尤其是在同一时期内季度AFR却呈现上升趋势的情况下。这种看似矛盾的数据变化可以通过两个相关因素来解释。

图片

从上表可以看出,虽然硬盘数量有所增加,但累积硬盘天数和故障硬盘数量都显著减少。这种变化主要是由于不同季度间硬盘型号的调整所致。

硬盘型号的调整
  • 新增:在Q3中,加入了20TB Toshiba硬盘型号(MG10ACA20TE),而在Q2时仅有两台该型号硬盘在役。

  • 移除:Q3中移除了4TB Seagate硬盘型号(ST4000DM000),因为到季度末只剩下两台,远低于500台的最低要求。

当Backblaze在Q3移除4TB Seagate硬盘的数据时,也相应地去除了80,400,065个硬盘天数和5,789次硬盘故障。如果将4TB Seagate硬盘的数据包含在Q3的终身AFR计算中,那么AFR将会是1.50%,这比实际报告的1.31%要高。因此,移除这部分数据实际上导致了终身AFR的下降。


如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • 华为的MED磁电存储技术,原来是这样的!

  • PCIe SSD在温变环境的稳健性技术剖析

  • 2024 NAND领域的机遇与挑战

  • SSD在低地球轨道卫星应用中的挑战

  • CXL内存技术:有效提高GPU利用率

  • 这可能是最清晰的AI存储数据流动图解

  • DWPD指标:为何不再适用于大容量SSD?

  • 突破内存墙:DRAM的过去、现在与未来

  • E1.S接口如何解决SSD过热问题?

  • ZNS SSD是不是持久缓存的理想选择?

  • 存储正式迈入超大容量SSD时代!

  • FMS 2024: 带来哪些存储技术亮点?

  • IEEE报告解读:存储技术发展趋势分析

  • 什么?陶瓷也可以用来存储数据了?

  • 都说固态硬盘寿命短,那么谁把使用寿命用完了吗?

  • 内存原生CRAM技术将会颠覆计算存储的未来?

  • 浅析SSD性能与NAND速率的关联

  • 关于SSD LDPC纠错能力的基础探究

  • 存储系统如何规避数据静默错误?

  • PCIe P2P DMA全景解读

  • 深度解读NVMe计算存储协议

  • 浅析不同NAND架构的差异与影响

  • SSD基础架构与NAND IO并发问题探讨

  • 字节跳动ZNS SSD应用案例解析

  • CXL崛起:2024启航,2025年开启新时代

  • NVMe SSD:ZNS与FDP对决,你选谁?

  • 浅析PCI配置空间

  • 浅析PCIe系统性能

  • 存储随笔《NVMe专题》大合集及PDF版正式发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/36240.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

河工oj第七周补题题解2024

A.GO LecturesⅠ—— Victory GO LecturesⅠ—— Victory - 问题 - 软件学院OJ 代码 统计 #include<bits/stdc.h> using namespace std;double b, w;int main() {for(int i 1; i < 19; i ) {for(int j 1; j < 19; j ) {char ch; cin >> ch;if(ch B) b …

[ABC234A] Weird Function

解题思路 这是一道模拟题…… 设置一个函数 &#xff0c;返回值为 。 最后答案就是 。 代码 记得开 long long ! #include<bits/stdc.h> using namespace std;long long t; long long f(long long x) {return x*xx*23; }int main() {cin>>t;cout<<f(f(f…

蓝牙键鼠无法被电脑识别

起因是我的键鼠是三模的&#xff0c;但是我蓝牙模式我只用过几次&#xff0c;基本一直使用的是有线模式&#xff0c;最近突然要用无线连接&#xff0c;如果使用收发器就显得过于繁琐&#xff0c;还占用usb口&#xff0c;因此想用蓝牙连&#xff0c;但是由于 win10更新了英特尔…

【C#设计模式(18)——中介者模式(Mediator Pattern)】

前言 中介者模式&#xff1a;是两者之间通过第三者来帮助传话。 代码 //抽象接收者public abstract class Receiver{protected Mediator mediator;protected Receiver(Mediator mediator){this.mediator mediator;}public abstract void SendMessage(string message);public a…

动态计算加载图片

学习啦 别名路径&#xff1a;①npm install path --save-dev②配置 // vite.config,js import { defineConfig } from vite import vue from vitejs/plugin-vueimport { viteStaticCopy } from vite-plugin-static-copy import path from path export default defineConfig({re…

Java HashMap用法详解

文章目录 一、定义二、核心方法三、实例演示3.1、方法示例3.2、get()方法注意点&#xff01; 一、定义 Java 的 HashMap 是 Java 集合框架中的一个非常重要的类&#xff0c;它实现了 Map 接口。HashMap基于哈希表的数据结构&#xff0c;允许使用键-值对存储数据。这种存储方式使…

淘宝直播间智能化升级:基于LLM的学习与分析

自营直播应用技术团队负责的业务中&#xff0c;淘宝买菜的直播业务起步较晚&#xff0c;业务发展压力较大&#xff0c;业务上也就有了期望能够对一些二方的标杆直播间进行学习&#xff0c;并将其优点应用到自己直播间的需求。 最初 - 人海战术&#xff0c;学习PK 业务侧最直接的…

有的开发者用Apache-2.0开源协议,但是不允许商用?合理吗

Apache 2.0开源协议是设计用来允许商业使用的。该协议明确授予了使用者在遵守许可条款的情况下&#xff0c;对软件进行复制、修改、分发以及商业使用的权利。这包括但不限于&#xff1a; 1. 永久、全球性的版权许可&#xff1a;允许复制、准备衍生作品、公开展示、公开演出、从…

java学习 -----项目(1)

项目 写在前面的话&#xff1a;耳机没电&#xff0c;先来写写今早的感受。说实话&#xff0c;我并不喜欢我们的职业规划老师&#xff0c;满嘴荒唐言&#xff0c;被社会那所大缸浸染了一身社会气。课快结束时&#xff0c;老师问还有谁的视频没做&#xff0c;我把手举了起来。&a…

某j vue3 ts 随笔

因为ts组件封装的缘故&#xff0c;使用某个组件就必须按照这个组件的规则使用&#xff0c;老是忘记&#xff0c;这里就记一下吧 1.ApiSelect 组件 {label: 角色,field: selectedroles,component: ApiSelect,componentProps: {mode: multiple,api: getAllRolesListNoByTenant,la…

红旗Asianux8.1+高斯GaussDB6.0安装手册

一、简介 服务器系统&#xff1a;红旗Asianux8.1&#xff08;需联网&#xff09;高斯GaussDB6.0&#xff1a;openGauss_6.0.0 极简版 二、安装准备 关闭防火墙 systemctl stop firewalld systemctl disable firewalld###查看状态 systemctl status firewalld 上传安装包 创建组…

如何实现Docker容器自动更新?从此无需再手动更新!(如何实现docker容器的自动更新、docker容器如何实现定时更新)

以下是经过优化后的完整文章内容: 文章目录 📖 介绍 📖🏡 演示环境 🏡📒 Docker 容器自动更新的需求 📒📝 解决方案概述📝 Docker 容器自动更新📝 Docker 容器定期更新📝 实现指定容器更新或排除更新⚓️ 相关链接 ⚓️📖 介绍 📖 随着容器化技术的普…

python异常、模块和包

文章目录 异常异常简介异常处理捕获所有异常捕获指定异常捕获多个指定异常 异常else、finally异常的传递 模块模块导入自定义模块 包自定义python包安装第三方python包 综合案例 异常 异常简介 异常就是程序运行过程中出现了错误 f open(RLlearn_2.txt, "r", enc…

Python内存泄漏 —— 宏观篇

Python内存泄漏 —— 宏观篇 应该弄清楚哪些问题 内存情况如何&#xff0c;是否一直增长&#xff1f;哪些是异常对象&#xff1f;这类对象占总内存多大比例&#xff1f;异常对象为何泄漏&#xff1f;如何使其正常释放&#xff1f;如何确定异常对象正常释放了&#xff1f;如何…

Chromium CDP 开发(五):注册自己的指令(中)

引言 在前一篇文章中&#xff0c;我们已经了解了 PDL&#xff08;Protocol Description Language&#xff09;的基本功能以及如何在其中声明 CDP&#xff08;Chrome DevTools Protocol&#xff09;指令和事件的具体内容。接下来&#xff0c;我们将深入探讨如何在实际开发中进行…

回溯算法解决全排列问题

1. 问题描述 定义&#xff1a;给定一个不含重复数字的数组 nums &#xff0c;返回其所有可能的全排列 。 示例&#xff1a; 输入数组 [1, 2, 3] 输出结果应该为&#xff1a; leetcode 地址 2. 代码实现 package com.ztq.algorithm.BackTrack;import java.util.List; impo…

金融行业 IT 实践|某信托公司:从虚拟化到容器平台的 VMware 替代与双活建设实践

随着“VMware 替代” 在金融行业的快速推进&#xff0c;不少金融用户的替代进程已逐渐从存储、虚拟化过渡到容器平台层面&#xff0c;实现更为全面的 VMware 国产化替代与架构升级。其中&#xff0c;某信托用户在使用 SmartX 超融合&#xff08;采用 VMware 虚拟化和 Tanzu 容器…

python学习——格式化字符串

在Python中&#xff0c;格式化字符串是一种将变量插入到字符串中的方法&#xff0c;使得字符串的构建更为灵活和方便。以下是一些常见的格式化字符串的方法&#xff1a; 文章目录 1. 使用百分号 % 格式化2. 使用 str.format() 方法3. 使用 f-string (格式化字符串字面量)格式说…

【上线文档】系统上线方案模板,计算机系统上线保障计划,系统运维信息系统运行保障方案,系统上线方案模板(Word原件)

一、项目背景和目标 二、项目需求分析 2.1 功能需求 2.2 非功能需求 三、系统设计 3.1 系统架构设计 3.2 数据库设计 3.3 接口设计 3.4 用户界面设计 四、系统开发 4.1 开发环境搭建 4.2 业务逻辑开发 4.3 数据库实现 4.4 接口实现 4.5 用户界面实现 五、系统测…

MySQL索引再认识

在最近的一次MySQL测试过程中&#xff0c;我的同事幺加明遇到了一些令人困惑的现象&#xff0c;这些现象超出了我们最初的预期。一直以来&#xff0c;我们在建立索引时&#xff0c;首要考虑的原则是在区分度大的字段上建立索引。然而&#xff0c;在实际测试中&#xff0c;我们发…