Sign in to follow this  
ferby09

HPE Micro Gen10 + WD100EMAZ ständiger Absturz der Festplatten

Recommended Posts

Server: HPE Microserver Gen10 8GB

DSM 6.1.7-15284

Jun's official v1.02b

 

 

Hallo zusammen,

 

auf der Suche nach einer günstigen Speichererweiterung für einen RAID1-Betrieb habe ich mir zwei WD Elements 10TB gekauft und die WD White WD100EMAZ daraus ausgebaut.

Bisher habe ich im Server eine WD RED 4TB WD40EFRX sowie eine HGST 4TB HDN724040ALE640, welche beide seit einem bzw. zwei Jahren problemlos im Einzelbetrieb laufen. 

 

Nun habe ich die neuen WD White eingebaut und wollte sie testweise erstmal einzeln konfigurieren, um sie zu testen. Eine davon konnte beim ersten Versuch problemlos als Basic-Platte eingerichtet werden. Die Andere brach beim Einrichten ab, weil sie auf einmal aus der Übersicht der Festplatten verschwunden ist und kurz darauf wieder verfügbar war (System failed to create [RAID Group 5](Device Type is [Basic]) with disk [5]). Ich habe auch das Hinzufügen zur anderen Platte im RAID1-Betrieb versucht, aber auch hier gibt es nur Fehlermeldungen.  

Ich ging natürlich von einem Defekt aus und tauschte die fragliche Festplatte um - sogar zweimal. Es wollte immer noch nicht funktionieren. Dann habe ich mich zum ersten Mal etwas genauer mit dem Festplattenbay des Servers beschäftigt und gemerkt, dass ich bei keiner Festplatte die über dem Bay befindlichen Schrauben in die Festplatten geschraubt habe, um sie so in eine Schiene schieben zu können und damit ein Wackeln der Festplatten zu verhindern. Den alten Festplatten hat es ja anscheinend bisher nicht geschadet.

Jedenfalls habe ich die Festplatten nun entsprechend beschäftigt und plötzlich funktionierten beide WD White-Festplatten und ich konnte den RAID1 einrichten! 

Dann habe ich testweise insgesamt 5TB in mehreren Etappen auf die Festplatten kopiert, was auch vorerst funktionierte.

Als ich mich nach dem letzten Kopiervorgang wieder in die Benutzeroberfläche einloggte, sah ich, dass eine der beiden Festplatten abgestürzt ist. Wenig später passierte das Gleiche mit der Anderen und ich war wieder am Ausgangspunkt angelangt...

Nun kann ich wieder keine der beiden Festplatten einrichten ohne eine Fehlermeldung nach einiger Zeit oder auch sofort zu erhalten.

 

Im Übrigen fällt mir ein, dass es bisher auch nur geklappt hat, wenn ich die Festplatten bei der Einrichtung nicht auf Fehler untersuchen ließ.

Außerdem befinden sich im Protokoll Einträge, die besagen, dass die Festplatten getrennt und wieder verbunden werden, wenn ich mich einlogge.

 

Datum & Zeit	Laufwerkmodell	Seriennummer	Gerät	Position	Ereignis
2019/12/27 14:32:42	WD100EMAZ-00WJTA0	2YXXXXXX	DS3615xs	Datenträger 4	Festplatten eingesteckt.
2019/12/27 14:32:31	WD100EMAZ-00WJTA0	2YXXXXXX	DS3615xs	Datenträger 4	Festplatten getrennt.
2019/12/27 03:46:54	WD100EMAZ-00WJTA0	1EXXXXXX	DS3615xs	Datenträger 5	Festplatten eingesteckt.
2019/12/27 03:46:39	WD100EMAZ-00WJTA0	1EXXXXXX	DS3615xs	Datenträger 5	Festplatten getrennt.
2019/12/27 03:42:36	WD100EMAZ-00WJTA0	2YXXXXXX	DS3615xs	Datenträger 4	Festplatten eingesteckt.
2019/12/27 03:42:26	WD100EMAZ-00WJTA0	2YXXXXXX	DS3615xs	Datenträger 4	Festplatten getrennt.

Hat jemand einen Lösungsvorschlag, weshalb keine der Festplatten laufen will?

Share this post


Link to post
Share on other sites

die hardware hat 4 x stata über backplane (marvell 9330) und 2 x sata chipset (nehme ich an), die nummern in platten manager sind nicht zwangläufig mit dem layout der ports identisch, check mal an hand der seriennummern der platten ob 4 und 5 wirklich verteilt auf backplane internem sata liegen - ist der esata auch benutzt

 

solche dropouts sind aber nicht zwangsläufig kabel probleme, können auch auf probleme mit der stromversorgung hindeuten, also auch stromverkablung prüfen und nachrechnen in wie fern das netzteil mit den 2 platten mehr noch in der sicheren zohne ist

vergleich auch mal die platten typen, die zwei platten die da ausfallen sing vom gleichen typ, evtl. modell spezifische probleme mit sata oder stromversorgung

 

check mal die health info der platten im storage manager, dort dann die s.m.a.r.t. info werte,UDMA_CRC_ERROR_COUNT mit den anderen platten vergleichen, wenn da abweichend hohe werte sind kann das auf kabel probleme hindeuten kann aber auch andere ursachenhaben (wie eben stromversorgung)

 

wenn du in so kurzer zeit gleich 2 platte "verlierst" dann wird das nie stabil mit raid laufen, das musst du beseitigen bevor du weiter machst

 

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Sign in to follow this