Официальный форум СВД Встраиваемые Системы
03 Декабря, 2016, 07:39:50 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.

Войти
 
 
 Сайт СВД ВС  Начало   Помощь Поиск Войти Регистрация  
Страниц: [1]   Вниз
  Печать  
Автор Тема: Проблема с менеджером файловой системы Fsys  (Прочитано 928 раз)
Антон Падалко
Пользователь

Сообщений: 34


« : 28 Марта, 2014, 10:18:41 »

Здравствуйте!
На нескольких объектах столкнулись со следующей ситуацией - менеджер Fsys завершает работу.
На разных объектах происходит с разной периодичностью, от нескольких дней до недель.
Немного о железе на объектах:
- промышленные компьютеры c системной платой Advantech PCA-6178 или PCA-6010.
- жесткие диски HDD (IDE, SATA) или SSD (SATA), пробовали менять - не помогает
Программное обеспечение:
- ОС QNX4.25 + Photon + TCP/IP Runtime
- Прикладное ПО по сбору, передаче, отображению данных + постоянное ведение архива данных
Структура жесткого диска:
(щёлкните чтобы показать/скрыть)
Первый раздел (/dev/hd0t77) используется для хранения конфигурации и загрузки системы.
Второй раздел (/dev/hd0t78) не используется, не монтируется.
Третий раздел (/dev/hd0t79) используется для ведения архива данных.
Версии ПО + запуск Fsys:
(щёлкните чтобы показать/скрыть)
После падения менеджера Fsys на узел есть доступ по сети (fleet) с соседнего концентратора.
Все ПО не связанное с файловой системой продолжает нормально функционировать.
Утилитой sin видно что драйвер Fsys.atapi присутствует в списке процессов, а менеджера Fsys нету.
Запустил на проблемной машинке tracelogger с записью лога в файл на соседний концентратор и поймал событие:
(щёлкните чтобы показать/скрыть)

Как с этим бороться?
Какую еще информацию можно добыть для более подробного изучения проблемы? (есть объект, где наблюдается регулярно, раз в 1-3 дня)
Записан
LH
Опытный пользователь

Сообщений: 249


« Ответ #1 : 29 Марта, 2014, 07:57:35 »

Попробуйте посмотреть

#sin fi

М.б. в прикладном ПО открывается много файлов?

Еще можно было бы посмотреть:

#sin irq

Используете ли вы аппаратные прерывания на своем оборудовании и пересекаются ли они
с прерываниями, используемыми ОС?
« Последнее редактирование: 29 Марта, 2014, 08:03:40 от LH » Записан
Антон Падалко
Пользователь

Сообщений: 34


« Ответ #2 : 01 Апреля, 2014, 08:27:36 »

Попробуйте посмотреть
#sin fi
М.б. в прикладном ПО открывается много файлов?
Еще можно было бы посмотреть:
#sin irq
Используете ли вы аппаратные прерывания на своем оборудовании и пересекаются ли они с прерываниями, используемыми ОС?

#sin fi ничего криминального не показало, в прикладном ПО открытых файлов немного - около десятка (архивы, логи).

#sin irq - вроде тоже ничего плохого не вижу:
(щёлкните чтобы показать/скрыть)
Записан
Андрей Панченко
Сотрудник СВД ВС
Пользователь

Сообщений: 76



WWW
« Ответ #3 : 04 Апреля, 2014, 13:15:23 »

Посмотрите есть ли в выводе traceinfo сообщения от Fsys (можно использовать опции traceinfo -M3 -M5)

Также воспроизведите падение с этим Fsys-20140404.tar.gz модулем. Для этого потребуется пересобрать образ. Вышлите адрес падения (вывод traceinfo c "Run fault" и "Last run fault" сообщениями).
Записан

Сотрудник СВД Встраиваемые Системы
Антон Падалко
Пользователь

Сообщений: 34


« Ответ #4 : 04 Апреля, 2014, 15:17:32 »

Андрей, спасибо!
Обязательно попробуем воспроизвести падение. О результатах обязательно сообщу.
Записан
Антон Падалко
Пользователь

Сообщений: 34


« Ответ #5 : 15 Апреля, 2014, 10:28:45 »

Воспроизвели падение, вывод traceinfo:
Apr 14 17:00:17 1 00001013 Run fault 4 000B 000D /bin/Fsys
Apr 14 17:00:17 1 00001005 Last run fault at 0005:000128EF

Возникла еще одна идея, отчего это происходит.
Мы используем специализированную версию драйвера Fsys.atapi от 29 ноября 2011 года.
Эта версия получена от Вас в рамках заказной разработки интерфейсной библиотеки для обеспечения доступа к информации о состоянии жесткого диска (SMART).
Ранее мы запускали считывание SMART информации в "ручном" режиме, редко, время от времени, а теперь встроили периодический запуск в прикладное ПО.
И есть большое подозрение, что падение менеджера Fsys происходит как раз в некоторые случайные моменты обращения за информацией SMART.
Записан
Андрей Панченко
Сотрудник СВД ВС
Пользователь

Сообщений: 76



WWW
« Ответ #6 : 16 Апреля, 2014, 10:30:37 »

Если у вас есть подозрение на зависимость от запроса SMART, возможно следует интенсифицировать считывание SMART для выявления связи между падением и запросом SMART.
Записан

Сотрудник СВД Встраиваемые Системы
LH
Опытный пользователь

Сообщений: 249


« Ответ #7 : 17 Апреля, 2014, 03:51:07 »

Где можно почитать про SMART-функции драйвера Fsys.atapi?
Есть ли пример: как слать запросы и получать ответы?
Спасибо.
Записан
Антон Падалко
Пользователь

Сообщений: 34


« Ответ #8 : 21 Апреля, 2014, 13:44:37 »

Если у вас есть подозрение на зависимость от запроса SMART, возможно следует интенсифицировать считывание SMART для выявления связи между падением и запросом SMART
Интенсифицировал запросы SMART (раз в 1-2 секунды), теперь Fsys стабильно падает, в течение 20-30 минут.
(щёлкните чтобы показать/скрыть)

Записан
Андрей Панченко
Сотрудник СВД ВС
Пользователь

Сообщений: 76



WWW
« Ответ #9 : 22 Апреля, 2014, 09:31:52 »

Здравствуйте!

Ответил Вам через почту.
Записан

Сотрудник СВД Встраиваемые Системы
Страниц: [1]   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP © 2002-2016 СВД Встраиваемые Системы.
При использовании материалов сайта ссылка на forum.kpda.ru обязательна.

Powered by SMF 1.1.21 | SMF © 2015, Simple Machines | © Aiwan. Kolobok smiles | Sitemap
Valid XHTML 1.0! Valid CSS!
Сайт СВД ВС

В последний раз google посещал эту страницу 19 Октября, 2016, 12:04:51