Jump to content
XPEnology Community

Внезапный сброс DSM


Recommended Posts

Добрый день!

После одного внештатного выключения сервера с Хренью один из разделов пометился в DSM как "Повреждённый", хотя SMART диска, ровно как mdadm -D и mdadm -E уверяли, что всё хорошо. При этом диск на чтение работал, а на запись - нет. Диск в томе один, собран как SHR.

Потратив несколько часов на гугление нашёл топик, описывающий ровно мою ситуацию. Описано решение на мой взгляд было немного скупо, однако, в заметке была ссылка на источник, который, однако, к сегодняшнему дню уже почил. Тут выручил веб-архив. Внимательно изучив источник, я пересобрал рейд и он ожил без намёков на проблемы. Спустя несколько дней я заметил, что проблема вернулась. Попытка восстановить таким же способом снова увенчалась успехом, до первой попытки обращения к диску на запись.

В надежде вытащить с этого диска директории, которые используются докером в качестве внешних томов начал пытаться их скопировать, но получил внезапный шатдаун сервера. Причём судя по тому, что пикнул микротик, подключенный к одному ИБП с сервером это было скорее что-то с питанием, ноэтонеточно.

После этого NAS перестал пинговаться по своему адресу. Поставил Ассистента и тот с третьей попытки нашёл мой сервер (естественно, но новому адресу, выданному DHCP), который говорит следующее:

image.thumb.png.42560b50e0e18477bc3d12b797da6b4d.pngimage.thumb.png.b2101ec196a9fb3d7b2eade677fd1cfc.png

 

Отсюда вопрос - можно ли как-то вернуть работоспособность NAS без потери данных и настроек? Смотрел похожие темы тут и тут, но в первом случае предлагается миграция, а не установка, а во втором судя по дальнейшим сообщениям у товарища не до конца вопрос решился.

 

Сервер собран на плате MSI LGA1150 H81 H81I с процессором i7-4770 и 2 Гб оперативной памяти.

Диск-виновник подключил к винде, чтобы посмотреть его состояние. Криминала не обнаружил:

image.png.16b91ed6661052c9d1045fecf09e6ec2.png

Link to comment
Share on other sites

Posted (edited)
50 минут назад, ZoorDrack сказал:

Диск в томе один, собран как SHR.

Один диск и DSM 5.2? И нет бэкапа? Видимо, не очень ценные данные лежали...

Я бы предложил подумать над такими шагами:

1. любым, какой сработает, способом попытаться считать важные данные с диска. Варианты:

1.1. От Synology (но там правда указано, что это для 6.2)

1.2. Сторонним софтом, например. Сам пока подобные действия не проводил, не могу что-то конкретное порекомендовать (возможно, кто-то ещё посоветует)

2. Обновить (точнее - установить заново) версию DSM (думаю, надо сразу пробовать на 7.2 - загрузчики к ней уже намного дружелюбней, чем для 5.2)

3. Установить не меньше двух дисков в SHR для защиты от сбоев. (при этом старый диск, на котором сбойнуло, надо с особой осторожностью использовать - трижды провериться....)

Edited by dj_nsk
Link to comment
Share on other sites

11 minutes ago, dj_nsk said:

Один диск и DSM 5.2? И нет бэкапа? Видимо, не очень ценные данные лежали...

Действительно, я не в полной мере описал дисковую систему сервера... все важные данные лежат на двух рэдах в raid1. Самые критичные данные периодически бэкапируются. Сабжевый и ещё один диск используются в качестве хранилища некритичных данных вроде фильмов, сериалов и т.д.

То, что хватило ума держать тома для докера на этом диске - мой факап, да.

 

14 minutes ago, dj_nsk said:

Обновить (точнее - установить заново) версию DSM

Вот тут вопрос: не затронет ли это действие данные на других дисках? Больше всего волнуют, собственно, основной рейд. Остальные данные по остаточному принципу.

 

Диск, на котором обнаружил сбой планирую в любом случае менять, но пока хотелось бы по возможности завести сервер в последнем рабочем состоянии, дабы избежать потери/коррапта  данных - 15Тб контента не сильно хочется перекачивать :)

Link to comment
Share on other sites

47 минут назад, ZoorDrack сказал:

Вот тут вопрос: не затронет ли это действие данные на других дисках? Больше всего волнуют, собственно, основной рейд. Остальные данные по остаточному принципу.

Теоретически данные на дисках должны сохраниться, а вот пакеты и настройки скорее всего потеряются (как минимум - частично), т.к. в 7.2 пакеты от Synology уже сильно поменялись, и сторонние могут оказаться не совместимы с новой версией DSM. Проходить обновление придётся самостоятельно (не припоминаю, чтобы здесь где-то был подробно описан успешный опыт обновления с 5.2 на 7.2, но может и есть - надо поискать), но всё же лучше на это решиться. Продумать порядок миграции, сделать бэкап и - вперёд :)

 

1 час назад, ZoorDrack сказал:

пока хотелось бы по возможности завести сервер в последнем рабочем состоянии

Так а просто с вынутым сбойным диском он теперь не запускается, что ли? Судя по уточнённому описанию, должен запуститься, ругаясь на потерянный диск/том.

Тогда диск/данные попытаться восстановить с ПК, а в DSM том просто удалить и заняться подготовкой к обновлению... Нет?

 

Link to comment
Share on other sites

15 minutes ago, dj_nsk said:

Так а просто с вынутым сбойным диском он теперь не запускается, что ли?

 

В том-то и дело, что без сбойного диска система сейчас стартует ровно так же, как и с ним - сообщает, что версия DSM, записанная на материнской плате является более поздней по сравнению с версией DSM.

Может, если причина текущей проблемы и правда была в питании, а не непосредственно в диске, (не верится в такие совпадения, но чем чёрт не шутит), то корень зла кроется в батарейке, например? Питание скакнуло, настройки BIOS сбросились и это как-то повлияло на работу системы 🤔

Link to comment
Share on other sites

1 hour ago, dj_nsk said:

не припоминаю, чтобы здесь где-то был подробно описан успешный опыт обновления с 5.2 на 7.2, но может и есть - надо поискать

 

В этой теме случайно не то, что нужно?

Link to comment
Share on other sites

1 час назад, ZoorDrack сказал:

 

В том-то и дело, что без сбойного диска система сейчас стартует ровно так же, как и с ним - сообщает, что версия DSM, записанная на материнской плате является более поздней по сравнению с версией DSM.

Может, если причина текущей проблемы и правда была в питании, а не непосредственно в диске, (не верится в такие совпадения, но чем чёрт не шутит), то корень зла кроется в батарейке, например? Питание скакнуло, настройки BIOS сбросились и это как-то повлияло на работу системы 🤔

У вас же- Xpenology, а не оригинальный Syno. BIOS на расхождение версий не влияет. Видимо, где-то рассинхронизировалась информация о версиях в загрузчике и в системном разделе DSM (я особенностей для 5.2 не знаю). Возможно, простое "Установить" эту ситуацию и поправит (хотя не понятно, какую обновлённую предлагает) - нужны знатоки по 5.2...

 

50 минут назад, ZoorDrack сказал:

В этой теме случайно не то, что нужно?

то, но слишком кратко. Могут возникнуть нюансы, которые там не описаны. Как понял, предлагается самый простой способ (я бы тоже в первую очередь его предложил): просто создать новую флешку с загрузчиком под 7.2 (советую использовать один из "автоматизированных", например, Arc Loader), при первом запуске система так же предложит миграцию/установку. После запуска будет куча невалидных пакетов, что понятно.

 

Другой вариант: сделать полный бэкап в 5.2, установить 7.2 "с нуля", восстановить из бэкапа. Старые пакеты восстановить тоже не даст.

Link to comment
Share on other sites

4 часа назад, ZoorDrack сказал:

Диск-виновник подключил к винде, чтобы посмотреть его состояние. Криминала не обнаружил:

Не единожды сталкивался, когда диск в Винде идеален, а Хрень его бракует. Так что это показатель под замену точно

Сам задумывался над сутью вещей, но ответа не нашёл. Ну и следя потом за сбойными дисками, наблюдал, что они всё же деградировали и на Винде. Видимо Хрень более критична к состоянию дисков

3 часа назад, ZoorDrack сказал:

Вот тут вопрос: не затронет ли это действие данные на других дисках?

Разбивка диска такова, что Система и файл подкачки, а так же данные, расположены на разных разделах и потерять Важное сложно. Если только не совершить какую либо ошибку. Вы не первый, кто переходит с Пятой версии на Седьмую версию

 

 

  • Like 1
Link to comment
Share on other sites

7 minutes ago, i926 said:

Разбивка диска такова, что Система и файл подкачки, а так же данные, расположены на разных разделах и потерять Важное сложно

 

Просто, насколько я помню, на момент первоначальной настройки этого NAS (около 8 лет назад) был вариант угробить сервер вместе с данными без возможности, если, например, попробовать обновиться из-под UI самого DSM. Хотя, возможно, это было связано с отсутствием нужного загрузчика на тот момент 🤔

Тут главное, чтобы основной рейд не рассыпался, наверное. Или при обновлении такой вариант маловероятен?

Link to comment
Share on other sites

9 минут назад, ZoorDrack сказал:

около 8 лет назад

Тогда и девки были моложе и трава зеленее .....)))

Угробить возможно всегда.  " ...Полное спокойствие может дать только страховой полис..." - Золотой теленок

12 минут назад, ZoorDrack сказал:

Тут главное, чтобы основной рейд не рассыпался

Из личного..... Обновил немало и даже полумёртвых и RAID ни разу не распался и восстановился в полной мере. А вот с Кэшем были (не у меня, бог миловал) такие проблемы . Максимум что теряется, это приложения. И то, в силу несовместимости версий

Link to comment
Share on other sites

Posted (edited)
2 minutes ago, i926 said:

А вот с Кэшем были такие проблемы

 

Кстати, в самом начале проблем с диском, когда он пометился как повреждённый, DSM ругался на повреждение кэша, собственно. Но сейчас точную формулировку не воспроизведу, а скринов походу сделать не додумался.

Edited by ZoorDrack
Link to comment
Share on other sites

Только что, ZoorDrack сказал:

От вас же

Ну (скромно потупив взор...) я не волшебник и даже не учусь ..... )))

И да ..... Как вариант обновления с форматированием первого раздела, тоже имеет место быть

Link to comment
Share on other sites

Только что, ZoorDrack сказал:

DSM ругался на повреждение кэша

Кэша посредством отдельного Диска ?

Обычно этот вариант более проблемный под восстановление

Link to comment
Share on other sites

В состоянии системы светилась надпись "Опасность", а в описании было написано что-то про кэш загрузочного сектора, вроде бы. Но после пересборки проблемного рейда все сообщения об ошибках уходили. Сервер несколько дней работал штатно.

Link to comment
Share on other sites

1 минуту назад, ZoorDrack сказал:

что-то про кэш загрузочного сектора

Это не то .... Я про другой вариант Кэша

Link to comment
Share on other sites

Posted (edited)
2 минуты назад, ZoorDrack сказал:

Сейчас мне не вполне понятно откуда взялась рассинхронизация версий DSM, с чем это могло быть связано?

Вот так сходу сложно сказать

Иногда простой бросок напряжения приводит к таким чудесам .....

Edited by i926
Link to comment
Share on other sites

Posted (edited)
57 минут назад, ZoorDrack сказал:

 

Похоже, что я сам нашёл ответ на свой вопрос 😃 От вас же 😃 

В загрузчике Arc вроде те же самые действия выполняются в пункте "Allow DSM Downgrade"  (надо будет посмотреть в исходники у автора...)

image.png.3fe489db6124491515907565c5c8b26a.png

 

[upd:] посмотрел в исходнике - нет, не форматирует раздел (хотя, возможно, этого и будет достаточно...)

function downgradeMenu() {
  TEXT=""
  TEXT+="This feature will allow you to downgrade the installation by removing the VERSION file from the first partition of all disks.\n"
  TEXT+="Therefore, please insert all disks before continuing.\n"
  TEXT+="Warning:\nThis operation is irreversible. Please backup important data. Do you want to continue?"
...

 

Edited by dj_nsk
Link to comment
Share on other sites

Posted (edited)
32 minutes ago, i926 said:

Иногда простой бросок напряжения приводит к таким чудесам

 

Полагаю, мой случай как раз... Допускаю даже, что эта проблема и неприятности с диском - это две разные проблемы. Я полагаю, что если сейчас я нажму "Установить" в ассистенте и подкину правильный pat-файл, то система может завестись? Должны ли в таком случае восстановиться настройки? Сейчас даже настройка сети сброшена, получается. 

 

Кстати, а можно ли подключиться к серверу по ssh, когда он в статусе миграции находится? У меня не выходит, но, возможно, я что-то делаю не так? Может, порт нестандартный?

 

UPD:

Взял себя в руки и произвёл переустановку с сохранением параметров. Судя по всему всё поднялось, как было на момент шатдауна. Ошибка тоже на месте 😃

image.thumb.png.ab08384402b396fe6c36b55bf5f6e25a.png

Edited by ZoorDrack
Link to comment
Share on other sites

20 минут назад, ZoorDrack сказал:

 

Полагаю, мой случай как раз... Допускаю даже, что эта проблема и неприятности с диском - это две разные проблемы. Я полагаю, что если сейчас я нажму "Установить" в ассистенте и подкину правильный pat-файл, то система может завестись? Должны ли в таком случае восстановиться настройки? Сейчас даже настройка сети сброшена, получается. 

 

Кстати, а можно ли подключиться к серверу по ssh, когда он в статусе миграции находится? У меня не выходит, но, возможно, я что-то делаю не так? Может, порт нестандартный?

1) На DSM7 так бы и сработало, и при загрузке спросило бы - с сохранением пакетов и настроек или без. Но на 5 версии - не знаю )

2) нет, пока DSM нормально не запустится, по SSH не войти

Link to comment
Share on other sites

28 минут назад, ZoorDrack сказал:

Полагаю, мой случай как раз...

Ну таки не пренебрегайте бесперебойником. Цена вопроса минимальная, а пользы много

 

30 минут назад, ZoorDrack сказал:

то система может завестись?

Вполне может

30 минут назад, ZoorDrack сказал:

Должны ли в таком случае восстановиться настройки?

А кто мешает вам сделать резервную копию настроек ?

С ней всё же лучше, нежели без неё

19671513d516db255e90be571c3e21c4.jpg

35 минут назад, ZoorDrack сказал:

Кстати, а можно ли подключиться к серверу по ssh, когда он в статусе миграции находится?

Не скажу про вариант в "Миграции", но при падении  иногда есть возможность войти. Я так свой сервак года четыре назад спас. Точнее данные на 95% вытянул. Но это скорее исключение

15 минут назад, dj_nsk сказал:

Но на 5 версии - не знаю )

Без резервной копии точно сложно сказать. Приложения придётся восстанавливать.

И не стоит забывать, что некоторые приложения имеют свои резервные копии

Link to comment
Share on other sites

3 минуты назад, ZoorDrack сказал:

Как выяснилось - ровно так же :)

Таки я понимаю, что процесс обновления пошёл и вроде как успешно, так ?

 

Link to comment
Share on other sites

Posted (edited)
28 minutes ago, i926 said:

не пренебрегайте бесперебойником

 

Как раз им-то и не пренебрегаю :) Даже написал об этом в первом посте:

 

6 hours ago, ZoorDrack said:

Причём судя по тому, что пикнул микротик, подключенный к одному ИБП с сервером это было скорее что-то с питанием, ноэтонеточно.

 

28 minutes ago, i926 said:

А кто мешает вам сделать резервную копию настроек ?

 

NAS, находящийся в состоянии миграции 😃 Сейчас сделаю на всякий случай, конечно, спасибо за совет! И тома докера мигрирую на рейд.

 

27 minutes ago, i926 said:

Таки я понимаю, что процесс обновления пошёл и вроде как успешно, так ?

 

Верно, подсунул старый pat-файл при установке, всё восстановилось, кроме сетевых настроек. Но их и не стоит восстанавливать, мне кажется - на уровне сети лучше выдать нужный, чем на устройстве прописывать.

 

Теперь думаю насчёт переезда на 7.2. Но сначала планирую заменить диск на новый.

Ещё смущает, что с 7 версии выпилили Photo Station, которым я активно пользовался. Видимо, придётся смириться. 

А вообще - правильно ли я понимаю, что несмотря на страшные предупреждения на сайте Synology откатить DSM до предыдущих версий можно путём форматирования первого раздела, даже для случаев понижения мажорной версии (7.2 -> 5.2, например)?

Edited by ZoorDrack
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...