日本电子维修技术 NAS记一次黑群故障及RAID和数据恢复过程
看了回复,无非大家觉得黑群不能放业务数据,RAID不安全,不过我想说的是重要数据备份,这个跟黑白没关系,跟RAID没关系,各种数据有其重要性,用户自然是知道的,只是重要性有个高低,是否值得的花成本的问题。白群崩溃的也不是少数,关键看运气和操作,此次问题也证明RAID对某些问题导致盘脱机有一定的数据保护能力。
这儿的数据有部分有备份,未备份的还是能重新获取到,只是麻烦一点(分散存放,需求重新做整理,或者不在本地),否则我也不会放心大胆的恢复,而不是直接就让送专业数据恢复那儿了。
以下仅有文字描述,未配任何图片。觉得不想看文字的可以绕道。
仅记录处理全过程,暂时未复盘处理过程中有何不妥的步骤,如果各位有建议,请指出讨论。
设备非我自用,是朋友的。
先说结果,虽然过程稍微有点曲折,但结果基本OK。
1.设备配置:
某黑群晖,采购自TB,六盘位,卖家安装的DSM5-5967,后加装了4块8T酷狼,R5,存有业务数据10多T。经检查是GA-MN525RI主板,4G内存,8GU盘,益衡250W电源
2.故障描述:
不定时掉盘,后RAID损坏,有一块盘显示未初始化,另外3块盘只有一块显示系统可以访问,其他红字显示无法系统访问。盘未显示有任何坏道之类故障。也拿脱机的那块接PC看了下,扫描了前一部分,也没问题。
3.故障处理过程:
因数据还比较重要,且虽然掉盘,但还可以访问数据,故先尝试了修复系统,修复完成显示3个盘都是绿色可以访问正常,然后开始拷贝数据,但拷贝当中大量数据无法正确读取,不时跳出文件无法访问的提示,点了跳过后有可以拷贝一部分,故挂那儿继续拷贝,但没过多久发现系统死机。
再次重启系统,接显示器,黑群启动到命令登陆界面后,群晖助手完全找不到此NAS,也无法登陆WEB界面,故可以判断前面的系统修复完全没有成功,且最后一个系统也有问题,处理遇到瓶颈。
咨询了一下别人,也查了下网上资料,准备尝试下再做一个系统然后挂载RAID,拔了4个盘,然后重新找了一个硬盘,按新机器重新装了系统,能正常启动,然后关机,插入3个盘(RAID未坏的3个盘),重新开机,进系统提示RAID损坏,但还是能拷贝数据,故继续拷贝数据,但还是大量的读取错误。想想能救一点是一点,就跳过了无法读取部分。拷贝了一会儿,系统再次死机,重启后发现新系统无法进,反而进了老系统(黑群启动完后命令提示前有显示名称,前后两个名称特意起的不一样就此判读),但老系统还是跟原来一样无法进WEB,也无法访问。
再次拔了RAID盘,单系统盘进系统根本无法找到系统,WEB显示无硬盘,以为硬盘坏了(毕竟是很老的旧盘),又换了块盘再重做,又能进系统,再重启了一遍(没插RAID盘),结果又进不了系统了,提示无硬盘,想想不会手这么背吧,连坏两个盘,把前面一块盘拿下来接PC,一切正常,想想是不是主板口有问题,换到2口也不行,换最后一个口,能进系统,故终于判断主板SATA口有故障。然后用6口接系统盘,1口随便接了个其他的盘,进系统还是不认1口的盘证实前面的判断。
故障就是坏了5个SATA,且是间隙性故障。
4.数据处理过程:
前面判断是主板问题,换主板好办,重要的数据恢复。
先要找个合适的平台,要至少5个SATA口还真不好找,最后拆了自己的WINSERVER做的NAS机器,搭建了下。
同样是1口接新的系统盘,后面4个口接了3个RAID盘(因为试过那块离线的盘接上会系统启动有问题),进系统,RAID损毁,但能读取数据,开始拷贝数据,一共比较重要的有4个T左右,时间比较长,中间也偶尔跳数据损坏,但少多了,拷贝数据花了几个小时,期间共有5个大小不一的文件报数据损坏,做了记录。
拷贝完又再次尝试了下拷贝那几个文件,居然惊喜的发现很顺利的都拷贝出来了,包括有一个几个G的单个文件,所以坏的也可以再试下,说不定就有能读出来。
拷贝完数据,下面基本就放心搞了,想想还有些不很重要或者有备份的,能恢复最好,但不想再拷贝出来了,一是没那么多空间,二是时间太长了,所以想尝试修复下RAID,但离线的盘不能冷插,故尝试热插了下,过了一会儿,系统里面显示多一个盘,按流程加入RAID组,开始修复RAID,然后就是漫长等待,大概花了16个小时,修复成功,RAID恢复正常。期间因为机箱是开着的,严重影响了风道,且硬盘一直在读写,温度一度达到60度,故使用电风扇对其进行强制散热,最后保持在了45-50度之间。
5.恢复到另外一个新的群晖:
老机器的主板一时来不了,故新搞了一个,插入4个修复好的盘,启动提示可以重新恢复,按照向导保留数据重装了6.2的系统,然后一切正常,重启了一下也正常,不需要再次修复RAID,这次过程基本结束。
评论
看来还是有必要上白裙
评论
安全性的关键还是不用raid,多备份
评论
这主板不靠谱,这raid不靠谱。
评论
Raid不是备份 Raid不是备份 Raid不是备份 业务数据一开始就要备份 否则追悔莫及
评论
业务数据上黑裙,公司经费有那么困难么?
评论
下电影玩,可以用黑群
业务数据,要么白群;或者存储服务器;或者FreeNAS
实际使用中,我这边业务数据是主存FreeNAS,备份到Windows存储服务器。
单台机器存放,数据可靠性太差,和阵列没有关系。
要考虑这台机器本体彻底挂彩的情况发生,而不是单纯坏一两个盘。
评论
有业务数据的也敢有黑群晖,心也蛮大的,这个就是第一步失误, 全盘皆错了~~~
黑群用来玩玩下载电影, 放点电影音乐还是不错的
评论
我也再某宝看了黑裙成品,j3455组成的八盘位,但还没有入手,我就也就是怕用raid了系统或者其它出问题了数据全没了,现在安安稳稳的用硬盘盒用着,数据无价,重要的数据没了就是没了,曾经的360网盘至今记忆尤新
评论
硬盘盒的话要不备几份,真的是说没就没了,这个真有遇到过。我觉得重要数据在黑群里面用R1做个备份,然后不定时再冷备份一份,对一般人真的也足够了。
评论
你这SATA大面积挂掉也少见了
我用过南桥raid,软的,南桥挂了,数据丢了的情况
哎。,。 辛苦了
评论
业务的话我们用IBM存储,根本不会碰群辉这种家用级别的东西
然后黑裙白裙都一样的
评论
看这故障并不是很严重的 我遇到的是存储空间损坏 完全没救~~
评论
专业存储照样会挂,我也遇到过,只是概率理论上会小一点。
备份才是王道,热备,冷备,离线,异地,方式越多越安全。
评论
没啥重要数据,顶多学习资料,现在平时也不用,一个月都不开机不了几次,黑裙组raid5成本又太高也不会,我想黑裙出问题的概率肯定高于硬盘盒,通电次数这么少,硬盘坏的机率肯迪也低
评论
公司业务数据用群晖?不至于吧
评论
电源很重要,白群挂硬盘也是不少的~
评论
若要可靠性高,就要购买白裙了,当然是企业型号如FS系列机架式1U2U的那种。黑裙要选择匹配的硬件,系统盘raid1,然后弄个LSI的RAID卡做硬RAID后以Basc方式挂载到黑裙里面,这样系统与数据分离,数据有硬RAID冗余,当然也要做好备份!
评论
群晖系统还好,每个盘都有,此次比较特殊,导致损坏,不过可以外挂硬盘做系统或者直接重做系统解决。
硬RAID不比软RAID好多少,有时候硬RAID崩溃比软RAID还难恢复。
其实不管怎么存储,重要数据还是备份最重要 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?