coupure de courant, DS3615xs en vrac ...

crob-37 · March 18, 2022

Bonjour à tous,

Je suis nouveau ici ... heureux possesseur jusque là d'un DS3615xs Xpeno, j'ai monté mon NAS progressivement et après une coupure de courant j'ai perdu l'accès !

J'ai essayé d'être le plus précis possible :

1°) structure physique :

CM : Gigabyte UEFI dualbios B75N de 2013. (Bios Rev F4).

- une clé USB 2.0 de BOOT Xpeno en 5.644

- un disque SSD 128 Go "système"

- une carte multi SATA (12 ports) en PCI Express 4

- 13 disques WD-4 To RED NAS

10 disques branchés sur la carte, et 3 disques sur les ports SATA de la carte mère.

Boot on : UEFI first, Legacy ensuite.

SATA Mode = AHCI.

xHCI enabled

2°) structure logique :

avant CRASH : DSM 5.644 upd8 (je crois !!) sans backup de la config

NB : Je suis resté dans cette version car le vendeur m'a dit que les versions supérieurs n'étaient pas gérés par le système physique.

* NAS Xpenology DSM : DSM_DS3615xs_v5.644_5644.PAT (pas d'update 5 ou 8 de réalisé, après la reinstall je suis resté "de base" 5.644, téléchargement officiel)

* Tous les 13 disques sont en SHR dans un seul volume.

3°) Faits accomplis :

- Après reinstall de l'OS sur un nouveau disque SSD (je croyais que la partition était HS ...)

- le volume 2 apparaît logiquement EN PANNE, car seuls 9 des 13 disques sont vus.

- sur ces 9 devices détectés, seuls 2 sont fonctionnels, les 7 autres sont noté "ECHEC DE PARTITION"

- j'ai testé unitairement les 13 disques durs sont bien alimentés en tension électrique.

- je m'aperçois qu'une des 2 alimentations électriques de l'ensemble des disques est FAIBLARDE ... je pense que la tension n'est plus suffisante en bout de chaîne pour les derniers disques à alimenter.

- j'installe 2 nouvelles alimentations électriques.

J'ai maintenant A NOUVEAU les 13 disques dont 11 en "ECHEC DE PARTITION" et le volume inutilisable mais pas de possibilité de correction ... ?

Je ne dirai qu'une chose : HELP

Merci de vos lumières ^^

Edited March 18, 2022 by crob-37

crob-37 · March 28, 2022

Bon, un petit UP svp j'ai besoin de vous ...

RECAPITULATIF :

Après une panne de courant, NAS inaccessible. Je réinstalle le système sur un autre disque SSD et hop.

Sauf que :

* Quand je branche tous les disques et que je démarre le DS3615xs, j'ai un premier message en me connectant en HTTP :

"Votre système doit être migré"

Je remets le fichier PAT correspondant à ma version, il s'installe et redémarre tout seul.

Au redémarrage, la console XPEnoboot affiche les informations classiques, puis les lignes "updating file ..." jusqu'à la phase POST INIT.

==================== start udevd =====================

System is going to reboot.

syslog-ng stop/waiting

stop : unknown instance : system is not in ups safe mode

kill-all-process start/running, process 19911

umount root [1]

crond[19963] : crond (Busybox 1.16.1) started log level 8

umount : cannot umount /: device or resource busy

umount fail, killall again

NAS login : crond[20036]

umount root[2]

umount : cannot umount /: device or resource busy ...

puis il reboote tout seul et me redemande sans cesse une MIGRATION.

le cycle infernal.

* Quand je ne branche pas tous les disques, le NAS est accessible en HTTP et me notifie simplement "VOLUME 2 : PANNE" (car il n'a pas tous les disques)

Je ne suis pas plus avancé, le volume reste logiquement inaccessible, mais au moins j'ai accès au NAS !

QUE FAIRE ?

nicoueron · March 29, 2022

Salut

voici plusieurs pistes :

- as-tu essayé de refaire la clé USB de boot? Elle a peut-être pris un coup électrique lors de la coupure.

- as-tu vérifier la pile de ton BIOS? Il arrive sur les vieux serveurs tj up h24 qu’à une coupure de courant si la pile est morte alors le bios est réinitialisé à ses paramètres par défaut et donc plus de AHCI et autres pré-requis. Ça me fait penser évite le BIOS UEFI sur ces vieilles version de DSM, essaie de repasser en legacy.

- as-tu essayé une réinstallation de DSM depuis le menu de boot du loader ?

ton histoire d’alim m’interpelle, comment as-tu fait pour installer 2 alim? C’est un serveur rackable ?

il faut arrêter de penser comme Windows, DSM ne s’installe pas sur un disque à part entier, mais sur TOUS les disques dans une partition spécifique. L’intérêt c’est que si un disque crash, le NAS peut continuer de démarrer.

crob-37 · April 4, 2022

Salut

Après tes conseils, je n'arrive toujours pas à accéder aux disques via le SYNO.

J'ai donc décidé de tester ceci "recover Syno Diskstation data using a PC"

https://kb.synology.com/en-uk/DSM/tutorial/How_can_I_recover_data_from_my_DiskStation_using_a_PC

Tout fonctionne jusqu'au moment de monter le 1er disque.

J'ai donc monté les 13 disques de 4 To sur un PC avec Ubunto 20 avec espoir de récupérer chaque disque lisible sur chaque mountpoint.

Pour faire court,

a) il faut créer 13 répertoires qui vont servir de points de montage des 13 disques :

cd /home/crob/recover

mkdir 1

mkdir 2

...

mkdir 13

b) utiliser MDADM pour reconstituer le bloc des disques

mdadm -Asf && vgchange -ay

c) monter chaque disque

$ mount ${device_path} ${mount_point} -o ro

chez moi ça fait :

mount /dev/dm-1 /home/crob/recover/1 -o ro

mais j'ai le message

Mount: unknown filesystem type ‘linux_raid_member’

En furetant je ne vois que 3 possibilités :

1-utiliser l'outil TestDisk (sick!)

2-mdadm --assemble --scan et voir ce qui se passe en essayant de monter les disques en LOOP

3- ne rien risquer et tenter autre chose ... mais quoi donc ?

nicoueron · April 5, 2022

là désolé je ne sais pas 😕

J'avais déjà tenté par le passer de remonter mon RAID5 sur 3 disques sur Windows à l'aide d'un logiciel, j'avais galéré comme pas possible mais je m'en étais sorti. Le truc c'est que l'outil en question était payant... (et je ne me rappelle plus du nom)

JacquesF · April 5, 2022

Bonjour,

Sur le fait de créer 13 points de montage, j'ai des doutes...

Il en faudra plutôt un par partitions existantes sur le groupe raid au final.

Je ne sais pas s'il existe plusieurs groupes raid dans l'ensemble des 13 disques, mais (je prends la discussion en cours) il faut déjà savoir si c'est du raid SHR (ou SHR2) ou simplement du raid 5 ou 6.

Dans le cas du SHR, on a besoin de LVM (les commandes vg*) pour recréer les volumes.

Le scan des disques par mdadm est la meilleure chose à faire pour le moment, pour voir quelle est la structure du raid.

La procédure donnée dans le lien me semble sans erreur (ce qu'on peut espérer de la part de Synology tout de même) mais je n'ai pas l'impression à lire le message qu'elle ait été suivie à l'exact (on parle de créer autant de point de montage que de volumes, pas de disque comme je le disais plus haut).

Je pense que refaire cette procédure pas à pas est la chose à faire actuellement, ensuite si ça ne marche pas rechercher les volumes avec LVM (commandes vg*) puis le raid avec mdadm (md*).

Dans le cas d'un démarrage impossible, seule la 1ere partition (premier ensemble raid en principe : md0) est à réparer, les données étant sur les autres groupes raid.

Et, règle de base sur un crash disque, on prend son temps et on ne fait rien trop tard le soir, ou tôt dans la nuit, si on est pas totalement reposé...

Jacques

crob-37 · April 6, 2022

Merci de vos retours.

-$ lsblk
NAME   MAJ:MIN RM   SIZE RO TYPE MOUNTPOINT
loop0    7:0    0     4K 1 loop /snap/bare/5
loop1    7:1    0 61,9M 1 loop /snap/core20/1405
loop2    7:2    0 248,8M 1 loop /snap/gnome-3-38-2004/99
loop3    7:3    0 61,9M 1 loop /snap/core20/1328
loop4    7:4    0 43,6M 1 loop /snap/snapd/14978
loop5    7:5    0 54,2M 1 loop /snap/snap-store/558
loop6    7:6    0 65,2M 1 loop /snap/gtk-common-themes/1519
loop7    7:7    0 44,7M 1 loop /snap/snapd/15314
sda      8:0    0 111,8G 0 disk
├─sda1   8:1    0   2,4G 0 part
├─sda2   8:2    0     2G 0 part
├─sda3   8:3    0   513M 0 part /boot/efi
├─sda4   8:4    0     1K 0 part
└─sda5   8:5    0 106,9G 0 part /
sdb      8:16   0   3,7T 0 disk
├─sdb1   8:17   0   2,4G 0 part
├─sdb2   8:18   0     2G 0 part
└─sdb5   8:21   0   3,6T 0 part
sdc      8:32   0   3,7T 0 disk
├─sdc1   8:33   0   2,4G 0 part
├─sdc2   8:34   0     2G 0 part
└─sdc5   8:37   0   3,6T 0 part
sdd      8:48   0   3,7T 0 disk
├─sdd1   8:49   0   2,4G 0 part
├─sdd2   8:50   0     2G 0 part
└─sdd5   8:53   0   3,6T 0 part
sde      8:64   0   3,7T 0 disk
├─sde1   8:65   0   2,4G 0 part
├─sde2   8:66   0     2G 0 part
└─sde5   8:69   0   3,6T 0 part
sdf      8:80   0   3,7T 0 disk
├─sdf1   8:81   0   2,4G 0 part
├─sdf2   8:82   0     2G 0 part
└─sdf5   8:85   0   3,6T 0 part
sdh      8:112 0   3,7T 0 disk
├─sdh1   8:113 0   2,4G 0 part
├─sdh2   8:114 0     2G 0 part
└─sdh5   8:117 0   3,6T 0 part
sdi      8:128 0   3,7T 0 disk
├─sdi1   8:129 0   2,4G 0 part
├─sdi2   8:130 0     2G 0 part
└─sdi5   8:133 0   3,6T 0 part
sdj      8:144 0   3,7T 0 disk
├─sdj1   8:145 0   2,4G 0 part
├─sdj2   8:146 0     2G 0 part
└─sdj5   8:149 0   3,6T 0 part
sdk      8:160 0   3,7T 0 disk
├─sdk1   8:161 0   2,4G 0 part
├─sdk2   8:162 0     2G 0 part
└─sdk5   8:165 0   3,6T 0 part
sdl      8:176 0   3,7T 0 disk
├─sdl1   8:177 0   2,4G 0 part
├─sdl2   8:178 0     2G 0 part
└─sdl5   8:181 0   3,6T 0 part
sdm      8:192 0   3,7T 0 disk
├─sdm1   8:193 0   2,4G 0 part
├─sdm2   8:194 0     2G 0 part
└─sdm5   8:197 0   3,6T 0 part
sdn      8:208 0   3,7T 0 disk
├─sdn1   8:209 0   2,4G 0 part
├─sdn2   8:210 0     2G 0 part
└─sdn5   8:213 0   3,6T 0 part
sdo      8:224 0   3,7T 0 disk
├─sdo1   8:225 0   2,4G 0 part
├─sdo2   8:226 0     2G 0 part
└─sdo5   8:229 0   3,6T 0 part

~$ mdadm --examine --scan
~$ cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md3 : inactive sde5[5](S) sdf5[13](S) sdc5[8](S) sdd5[11](S) sdo5[2](S) sdn5[15](S) sdm5[12](S) sdl5[14](S) sdk5[10](S) sdj5[7](S) sdi5[0](S) sdh5[4](S) sdb5[9](S)
50728436928 blocks super 1.2

unused devices: <none>
~$

Pour info, j'ai un disque fraîchement remplacé qui est vide (certainement celui noté "inactive" dans le log MDSTAT.

Calmement, en ayant bien dormi comment puis-je faire le montage pour accéder à mes données en lecture seule ?

crob-37 · April 6, 2022

un mount /dev/md3 /home/crob/volume2 m'affiche maintenant

# file -s /dev/sd(b jusqu'à o) :

#parted -l

# parted -l
Model: ATA PNY CS900 120GB (scsi)
Disk /dev/sda: 120GB
Sector size (logical/physical): 512B/512B
Partition Table: msdos
Disk Flags:

Number Start   End     Size    Type      File system     Flags
1      1049kB 2551MB 2550MB primary   ext4            raid
2      2551MB 4699MB 2147MB primary   linux-swap(v1) raid
3      4699MB 5237MB 538MB   primary   fat32           boot, esp
4      5238MB 120GB   115GB   extended
5      5238MB 120GB   115GB   logical   ext4

Model: ATA WDC WD40EFAX-68J (scsi)
Disk /dev/sdb: 4001GB
Sector size (logical/physical): 512B/4096B
Partition Table: gpt
Disk Flags: