JoCool

[Aide] Echec de partition système : perte récurrente d'un disque en Raid 5

Recommended Posts

Posted (edited)

Bonjour à tous,

 

Depuis plusieurs mois (même quelques années maintenant), j'ai un problème récurrent sur mon NAS : je perds régulièrement un HDD.

 

Je suis en Raid 5, mais je ne me rappelle plus si c'est du Raid 5 classique ou celui de Synology qui est plus souple mais propriétaire.

Je tourne sous DSM 6.1.7-15284 avec le loader de Jun (v1.02 il me semble), mais j'ai ce problème depuis longtemps et je l'avais déjà avec d'autres versions de DSM et du loader. Mon NAS est indentifié comme étant un DS3615xs.

 

Le problème est donc le suivant : j'ai 4 HDD et régulièrement, je perds le 4ème. Le système m'indique alors : Le RAID Group 1 (Groupe1) sur Serveur_NAS est passé en mode dégradé [3/4].

La plupart du temps, je répare et ça tient un certain temps (très aléatoire), puis ça recommence. Mais de temps en temps, le système n'arrive pas à réparer le HDD en panne.

 

Je précise que j'ai changé mes 4 HDD, ça le faisait avant avec les anciens et ça le fait encore. Et les 4 nouveaux HDD n'ont pas la même capacité de stockage et ne sont pas de la même marque. Donc je pense que c'est soit le système, soit la CM, soit... un câble peut-être ?

Le HDD qui dégage est indiqué comme ayant un "échec de partition système". Au niveau tests SMART, aucun souci.

Et si je sors le disque de la baie NAS, que je formate et que je le remets, ça passe. Le Raid se reconstruit et ça fonctionne. Mais au bout de quelques jours ou semaines, j'ai de nouveau un plantage.

 

Sur la carte mère, les 4 HDD sont branchés sur les 4 ports qui permettent une gestion du Raid par la CM (ports 3 à 6). J'ai d'autres ports Sata, mais je n'ai pas essayé de brancher différemment car je n'étais pas sûr de pouvoir me passer des fonctions de gestion du Raid de la CM (il me semble que la gestion est logicielle via le DSM, mais pas certain).

 

Si vous avez des conseils, je suis preneur. Merci :)

Edited by JoCool

Share this post


Link to post
Share on other sites

Bonjour,

Le diagnostic me semble bon, soit le système, soit la CM, soit... un câble peut-être

Mais le système en dernier recours, le plus logique étant de remplacer le câble potentiellement en cause, où de le déplacer pour voir si le problème suit le port ou le disque sur lequel il est connecté. Ensuite, refaire la clef USB car c'est le plus facile.

Quelques précisions :

- SHR n'est pas propriétaire au sens habituel du terme, c'est une combinaison de raid soft linux (tout à fait classique) mais non pas sur des disques physiques mais sur des volumes logiques (LVM) reposant sur cette technologie logicielle pour répartir les données d'un volume sur un ou plusieurs disques physiques.

Il est tout à fait possible de récupérer des données écrites avec SHR avec une simple distribution linux (liveCD ou liveUSB).

- Le RAID de la carte mère (la plupart du temps c'est du miroir ou du JBOD) ne doit pas être utilisé, tout est géré par le NAS en raid soft (RAID5 par défaut sur le DSM6) ou SHR (sur DSM5 et en l'activant sur DSM6). Si le raid de la CM est utilisé, alors il est possible que ce soit lui qui provoque une incohérence quelconque et fasse passer le disque en faut (dans ce cas, l'absence d'erreur SMART serait logique).

 

Donc, pour résumer :

- Supprimer le raid de la CM s'il est activé (APRÈS SAUVEGARDE DES DONNÉES), cette opération provoque en principe la perte de la structure du disque, donc de l'accès aux données

- Déplacer ou changer le câble SATA en cause

- Déplacer le disque en cause sur un autre port SATA (IDEM, SAUVEGARDE AVANT)

 

Jacques

  • Thanks 1

Share this post


Link to post
Share on other sites

Merci pour ton retour Jacques.

 

Je vais tester ça aujourd'hui. Mon NAS est sauvegardé régulièrement, en local et en distant, donc ça devrait aller, mais tu as raison, il vaut mieux lancer une sauvegarde avant, il vaut mieux qu'elle soit récente.

 

Je fais un retour ici après avoir testé les différentes options.

Share this post


Link to post
Share on other sites

J'ai eu ce soucis, au point de renvoyer le disque WD red en SAV... Et c'était tout bêtement dû à un câble Sata défectueux, on n'y pense pas mais cela peut effectivement arriver... J'avais très honte. 😭

  • Thanks 1

Share this post


Link to post
Share on other sites
Posted (edited)

Merci pour cette info pmchan.

Y a pas de honte, parfois on n'y pense pas tellement ça n'arrive pas souvent. Mais du coup, autant j'ai le même souci.

Moi j'ai changé mes 4 HDD à cause de ça. bon, ils avaient 10 ans et j'avais plus assez de stockage, c'était la bonne excuse ;)

 

1ère tentative : formatage du HDD en faute + remplacement du câble.

 

Afin de ne pas fausser les résultats, au risque de ne pas comprendre d'où vient la panne, je n'ai pas fait plusieurs changement en même temps. Le HDD est donc resté sur le port 6 qu'il occupait déjà.

 

J'ai déposé le HDD et l'ai testé sur mon PC via un simple test SMART. Même s'il était déjà testé et indiqué OK par le NAS, je préférais être sûr. J'ai supprimé toutes les partitions sur le HDD avant de le remettre dans le NAS.

 

Par ailleurs, j'ai vérifié dans le Bios et mes HDD ne sont pas en Raid matériel mais en AHCI. Je me suis rappelé en allant dans le Bios que si j'active le Raid matériel, mes HDD ne sont plus vus par le NAS, ce qui est logique puisqu'ils sont alors reconnus comme un unique volume géré par le Raid.

Donc, pas de souci côté gestion du Raid par la CM, ce qui n'exclut pas un port SATA défectueux.

 

J'ai attendu quelques heures, le temps que le Raid se reconstruise et là c'est OK. Mais il faudra attendre plusieurs jours avant de savoir si ça tient vraiment puisque le défaut apparaît parfois au bout de presque un mois.

 

Je mettrai ce post à jour si jamais il y a un autre défaut.

Edited by JoCool

Share this post


Link to post
Share on other sites

Juste un retour pour dire qu'après 1 semaine, le NAS se porte bien, pas d'apparition d'un nouveau défaut.
Donc, autant c'était bien le câble.

 

Je verrai à l'usage car par le passé, j'avais eu le même souci et un formatage complet avec suppression des partitions suffisait à remettre tout en ordre pour quelques jours ou semaines.
S'il y a du nouveau, je l'indiquerai sur ce post, sinon c'est que le remplacement du câble était bien la solution :)

 

En attendant, merci à Jacques et pmchan pour leur intervention 🖕

Share this post


Link to post
Share on other sites

j'ai aussi le mm pb "echec de la partition systeme". J'ai réparé la dite partition en ligne de commande, après un reboot plus d'erreur et puis en parcourant des dossiers paf l'erreur reviens. Alors je refait les commandes checkdisk, ça "corrige" (c'est ce que l'outil dit mais en réalité si il n'y arrive pas alors il suppprime le fichier... donc bon pour une correction j'ai connu mieux^^) et bim ça recommence sur d'autres fichiers... 

 

Chez moi je n'ai pas de cable sata sauf sur mon cache SSD en effet les disques de données de mon N54L sont branchés en direct par leur baie. Si c'est celui du disque SSD qui met le bazard alors hop à dégager! je vais tester ça de suite.

Share this post


Link to post
Share on other sites

Eh bien, j'espère que c'était bien le câble qui était en cause.

À voir avec le temps...

 

Bon WE

Jacques

Share this post


Link to post
Share on other sites

Chez moi, je viens de désactiver le cache SSD et ..... j'ai retrouvé mes débits :) reste à déterminer si c'est aussi le cable (je dois admettre que c'était de la récup alors c'est possible qu'il soit pourri) ou le SSD qui flanche (c'est possible aussi car il presque 6 ans)

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.