我以近日亲历的RAID5降级损毁修复的过程,记录下一些关键点,给有基础的您参考。
手头有两台白群(DS214Play 2盘位,DS918+ 4盘位),两台黑群(N54L 5盘位,ASROCK J4105 8盘位),算是NAS老友了。
用途:
DS214Play,RAID1,WD RE2-GP 1TB (URE 10^15) * 2,可用容量1TB,用来PT及观看临时电影剧集。有保留价值的,转到J4105的媒体仓库保存;
DS918+,RAID5,WD RE4 2TB * 4 (URE 10^15),可用容量6TB,工作数据;
N54L, RAID5, WD RE4-GP 2TB * 5 (URE 10^15),可用容量8TB,冷备份J4105的重要数据;
J4105,RAID5,WD RED 4TB * 6 (URE 10^14) 可用容量20TB,Video Station媒体仓库;
RAID1,WD HC320 8TB * 2 (URE 10^15) 可用容量8TB,重要数据,包含热备份DS918+的工作数据。
近日折腾的起因是,J4105的RAID5原来是4TB*4,容量不够了,需要扩容。
扩容需要Rebuild是很大风险的事情,尤其担心URE(红盘只有10^14非企业盘)及同时再坏一盘,所以计划借扩容之机,加2盘,扩为4TB*6,RAID级别改为RAID6,实际增加可用容量4TB。
屏幕快照 2019-12-21 上午8.50.29.png (11.34 KB, 下载次数: 0)
然后,群晖NAS里添加2个硬盘,竟然没有让我选择RAID级别,就直接以原RAID5扩容了,也不能取消,瞬间满天星星,按URE计算成功率只有20%,我想这得挂彩了
屏幕快照 2019-12-21 上午8.50.52.png (22.2 KB, 下载次数: 0)
经过三天多的等待,竟然成功了。还好还好,似乎RP不算太坏。
可是,依然担心RAID5,就再整了一红盘,计划更改RAID级别为RAID6,不增加容量。
取出RAID1的两个盘,插入1新盘,准备迁移成4TB*7,RAID6。
巧合是,我插入新盘,还没选更改RAID级别,原RAID5就提示降级,有一块盘错误,囧。
屏幕快照 2019-12-21 上午8.51.24.png (17.7 KB, 下载次数: 0)
于是,将新盘替换错误的盘,开启RAID5重建。又多一次考验。
屏幕快照 2019-12-21 上午8.51.41.png (9.77 KB, 下载次数: 0)
屏幕快照 2019-12-21 上午8.52.26.png (42.93 KB, 下载次数: 0)
这次就没有那么好彩了。
重建过程中,提示另一盘错误,RAID报告损毁(crashed)!所有硬盘内容自然就看不到了。
关机。
下面开启修复过程:
首先,确认用哪几个盘修复,
先看最后一个报错误的盘,确定是完全不能访问的故障,废了。
另外,因为此次RAID降级发生在新盘还没有重建完成,新盘必然没有完整的数据。不能用。
但还有一丝希望,重建换下的那颗有错误的盘,确定盘仍然可以正常访问,而它是有完整数据的。
这样,就有五颗完整数据的盘,按照RAID5的规则,是可以完全恢复的,当然群晖已经不认这个RAID了。
下面,找一个Linux盘启动来修复,修复过程并不复杂:
1. 手头有一张Ubuntu 18.04.3光盘,直接引导,不需安装,直接选tryout试运行就可以;
2. 启动后打开terminal,输入以下几条命令,数据就加载在/mnt目录了:sudo -i
apt-get install mdadm
mdadm -Asf
vgchange -ay
mount /dev/md2 /mnt复制代码
IMG_2864.JPG (362.1 KB, 下载次数: 0)
这个过程中,mdadm -Asf 会将RAID的FAULT标志清除,然后RAID就出现在设备列表中,可以mount加载了。我这里RAID设备是/dev/md2,你可以通过fdisk -l查看你的RAID设备名。
3. 可以在linux下继续从/mnt拷贝你需要的重要数据出来。或者,直接重启,这时群晖NAS又能正常工作了(堪用状态),不妨碍你备份数据。
我在修复后,再加了一张盘,保持有一个冗余盘的正常状态,RAID5就这样修复完成。这又多了一次重建考验。这次重建是成功的。
回顾一下:
URE很重要,但并不可怕。群晖RAID方案采用的是标准linux的,并没有用众所周知还存在BUG的BTRFS RAID(群晖有官方的说明),这带来一个便利,就是随便找个linux启动,就能正常读写RAID数据。
当然,以后再也不想买URE为1 * 10^14的红盘了,故障率真高。我7个4TB红盘,四个出现了多个IDNF错误(暂不影响使用,其中1个还出现坏扇区自动重映射)、1个I/O错误掉盘(日志显示是扇区错,重格式化后正常)、1个完全损坏弃用、1个正常。只有1/7的完全正常率,直接列黑名单,以后不会再买这个盘了。
URE为1 * 10^15的企业级盘WD RE4-GP 2TB, 买了6个,目前用5个,有1个出现几十个坏扇区弃用了。这种带GP的盘可靠性差一些。同期不带GP的WD RE4 盘目前没出现一个故障。
HC320是个惊喜,这个号称最强的空气盘的确很牛,除了功耗,其他都是优点。以后计划逐渐换成这个系列。
结论意见:
RAID5可以日常保用,只要确保出现降级时,不进行重建,而是立即备份,就不会有太大的问题。RAID5的重建跟ZFS不一样,是整盘按块进行处理的,全盘的任意出错都将影响重建的成功率,所以在重建前,一定先备份好数据,就可以放心使用。
选盘尽量10^15以上URE的盘,一些DC的SSD甚至达到10^17以上,用来作RAID5会更放心一些。
评论
你要知道,现在有“小白”用着拆机4盘6t 8t 10t去弄r5的,等死吧
评论
不见得吧,硬盘故障又不全是数据全损。重建失败个一次半次,也可以拷出数据,继续重来
评论
一直遵循321原则
3套备份 2种介质 一份异地
麻烦是唯一的缺点 优点是数据再也没有丢失过
评论
小白不白的其实不必强调,硬盘没有硬件缺陷或故障,是没问题的。
但4T以上的盘,不会去做R5,一般是R6或双镜像。4T或4T以下的盘,3-4碟,R5是没问题的,除非真RP坏到了极处低密度碟也重建过程出错,那确实没办法
评论
请问异地备份的服务大概每年要花多少啊
评论
小企业 没那么高端 就是异地办事处也有小机房 每次需要备份的数据不过2个T 数据库异地备份不是实时的 远程把数据传过去 等传完了 就再传一套完整新的 如此往复
评论
4个8T 都是单独。 重要资料每个盘都有自动备份。 另一份百度云以防万一。 RAID。炸了麻烦死。
评论
R1保平安
评论
说了多少回了,raid解决的是raid中有硬盘损坏的时候不间断工作的作用
文件的备份不是raid要干的事
评论
我FREENAS重建过RAID-Z2,全部都是洋垃圾SAS 4T盘。居然重建成功了,虽然洋垃圾标的是10^15的洋垃圾企业盘
评论
公司的数据库服务器,R5,坏了一个盘,买了个直接换上就好了。
快点再加一个硬盘每天晚上备份。
评论
是的,自从之前DS712红盘莫名其妙损毁后更换新的918我现在都是不做Raid,就单硬盘在跑
和退役的DS712 Hyper Bacup ,另外在Cloud sync 备份到OneDrive和百度云。
评论
有巡读的情况下 重建成功概率还是会高一些的
评论
哈哈,是的,raid只是解决可用性问题的。
评论
这个东西一次成功不算什么,一次失败才要命,之前管理机房的走了,后面才发现两台极其重要的服务器数据库备份都只有本机有,都是一个硬盘亮灯,都是重建的过程中挂掉另一个盘,再也重建不了,花了4个多月才搞定,各种催促电话打爆
评论
楼主例子恰恰证明了RAID 5在4TB单盘的情况下都很不可靠,更不用说现在12TB单盘的情况了。 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?