Алгоритм автоматизированного анализа причинно-следственных связей с использованием геоинформационных технологий и прогнозирование динамики здоровья населения
Категория: Спорт и долголетие

Авторы: Комбарова М.Ю., Рембовский В.Р., Красильников И.А., Радилов А.С., Дулов С.А.

 

Актуальность вопроса

Анализ количественных зависимостей в системе «среда-здоровье» получил развитие в разработке критериев и методов количественной оценки воздействия факторов окружающей среды на здоровье населения. Актуальным стало сочетание экологического мониторинга с мониторингом здоровья населения, под которым понимается динамическое слежение за состоянием здоровья с пространственной интерпретацией данных для обоснования региональных мероприятий, направленных на устранение риска в конкретных районах [1].

 

Большое значение при проведении медико-экологического мониторинга и изучения влияния факторов риска на здоровье населения имеет полнота учета этих факторов. Между переменными (случайными величинами) может существовать функциональная связь, проявляющаяся в том, что одна из них определяется как функция от другой. Кроме того, могут быть общие случайные факторы, влияющие на обе переменные. Решение проблемы использования в анализе коррелированных переменных может быть частично решено путем использования факторного анализа с сокращением числа переменных и замены групп переменных на так называемые главные факторы (главные компоненты) [2].

Для обоснования потенциально эффективных мероприятий по охране здоровья населения и работников промышленных предприятий, особенно с вредными условиями производства, необходимо проведение комплексных аналитических исследований на основе сведений, аккумулируемых в информационных системах «Производственная среда - здоровье персонала», «Среда обитания – здоровье населения».

Цель исследования - апробация прототипа информационно-аналитической автоматизированной системы (ИАС) учета, хранения и обработки медико-гигиенической информации о состоянии производственной среды и здоровья персонала особо опасных предприятий Ленинградской области, здоровья населения и среды его обитания в районах расположения указанных предприятий в целях обеспечения химической безопасности в регионе на примере г. Тихвина.

 

Материалы и методы исследования

Для апробации Алгоритма в системах «производственная среда - здоровье персонала», «среда обитания – здоровье населения» в разработанном прототипе ИАС были использованы следующие материалы:

1. Результаты аттестации 235 рабочих мест ТФЗ, проведенной в декабре 2008 г. (150 рабочих мест) и в декабре 2010 г. (85 рабочих мест) по показателям оценки условий труда по степени вредности и опасности с градациями 1, 2, 3.1, 3.2, 3.3, 4.

2. Сведения о 2322 случаях заболеваний у 202 работников ТФЗ и примерно соответствующих им по возрастно-половой характеристике и месту проживания 194 жителей г.Тихвин.

3. Сведения о среде обитания в г. Тихвине преимущественно за период 2007-2012 гг.

Таблица 1

Пробы, характеризующие среду обитания в г. Тихвине в 2007-2012 гг.

 

4. Результаты лабораторных исследований на микроэлементы волос детей г.Тихвина, посещающих детские сады в условно «грязной» (42 ребенка) и условно «чистой» (74 ребенка) зонах города.

5. Общая оценка здоровья населения осуществлялась по отчетам о числе заболеваний населения, обслуживаемого МУЗ «Тихвинская центральная районная больница» за период 2008-2012 гг. и сведений о смертности населения Тихвинского района за этот же период (всего в ИАС введено 7774 показателя).

6. Влияние среды обитания на здоровье населения оценивалось на основе данных о 5062 случаях заболеваний детей дошкольного возраста и школьников, посещающих детские сады и школы в условно-грязной (263 ребенка) и условно-чистой (274 ребенка) зонах города.

Основная аналитическая работа была ориентирована на использование технологии OLAP (On Line Analytical Processing), реализованной на платформе MS Office Professional Plus 2013 c применением PowerPivot, последней версией сводных таблиц.

Углубленный математико-статистический анализ выполнялся в пакете Statistica for Windows. Проведено математико-картографическое моделирование с использованием ГИС-технологий [3-7] .

 

Результаты исследования

В ходе исследования создан прототип автоматизированной информационной системы, предназначенной для сбора, хранения и обработки данных о здоровье людей и влияющих на него факторов. В основу ИАС положена разработанная база данных (БД) оригинальной структуры. Подготовлена необходимая для функционирования ИАС техническая документация и методические рекомендации по ее использованию.

Созданная ИАС позволила ввести для последующей обработки в упорядоченном виде сведения о производственной среде, здоровье населения и среде обитания всего более 240 тыс. записей в 44 таблицах БД.

В процессе работ сделан выбор в пользу свободно распространяемой реляционной системы управления базами данных (далее – СУБД) MySQL v.5.6. В качестве архитектурного решения использовалась облачная технология с доступом к БД через Интернет.

При создании БД, в которой должны храниться все сведения, необходимые для автоматизированного анализа причинно-следственных связей, необходимо было предусмотреть возможность однозначной идентификации всех характеристик с целью обеспечения возможности их безошибочного извлечения для последующего анализа, а также ввод первичных сведений о людях и влияющих на них факторов (транзакционная БД).

БД носит реляционный характер. Все сведения распределяются по плоским двумерным таблицам, в которых каждая запись (строка) однозначно идентифицируется так называемым первичным ключом, а в таблицах, где содержатся соответствующие связанные сведения, имеются внешние ключи. Таким образом, создается весьма сложный комплекс таблиц, между которыми существуют связи (отношения, реляции) типа «один-ко-многим», «многие-к-одному», «многие-ко-многим».

В ИАС можно выделить три информационных блока: люди и их индивидуальные характеристики; состояние среды обитания; популяционные характеристики населения.

Для ввода данных разработан интерфейс, обеспечивающий возможность подключения к БД ИАС тонкого клиента.

Обработка данных включает несколько этапов. 1 этап - статистическое наблюдение (сбор сведений, необходимых для дальнейшего анализа). 2 – ввод полученных сведений в транзакционную БД. 3 этап - создание Хранилища данных (Data Warehouse). В хранилище с определенной периодичностью импортируются из транзакционной БД те данные, которые с высокой вероятностью не будут в дальнейшем меняться. Обновление данных в Хранилище может происходить с разной периодичностью.

Одна из основных проблем, решаемых с помощью Хранилища, – упрощение структуры хранения данных, что облегчает работу специалиста-аналитика. Это возможно в связи с тем, что в Хранилище данные хранятся в неизменяемом виде, что снимает необходимость придерживаться принципов нормализации БД. Таблицы в Хранилище обычно структурированы в виде звезды (центральная таблица фактов в окружении нескольких таблиц-справочников) или снежинки (когда таблицы справочники имеют, в свою очередь, подчиненные им периферические таблицы).

Но упрощение хранения данных не решает задачу ускорения их обработки. Для решения этой задачи в 90-е годы прошлого столетия была разработана технология OLAP (On Line Analytical Processing). На 4-м этапе данные хранилища подвергаются дополнительной обработке. По специально разработанным алгоритмам в фоновом режиме, например, в ночное время, осуществляются многочисленные расчеты и на основе данных Хранилища формируются показатели, которые, с высокой вероятностью, могут потребоваться при проведении анализа. Абстрактно это можно представить как формирование некоего виртуального куба данных, все ячейки которого заполнены уже готовыми показателями, а срезы граней представляют собой измерения какого-либо признака. Результат такой подготовительной работы - высочайшая скорость получения результатов запросов, которые на миллионах строк таблиц Хранилища выполняются практически мгновенно.

Для визуализации полученных результатов к OLAP-кубу на 5-м этапе подключают какие-либо внешние приложения.

Oracle BI

 

Это могут быть как многофункциональные бизнес-приложения класса Business Intelligence (например, Oracle BI или Crystal Reports, ArcGIS), так и более простые и распространенные программы, например, MS Excel, рисунок 1.

Рисунок 1. - Алгоритм анализа данных с использованием Хранилищ данных и OLAP(OnLineAnalyticalProcessing)

 

В последние годы появились решения, которые для относительно небольших БД объемом в несколько гигабайт позволяют существенно упростить алгоритм анализа. В первую очередь речь идет о так называемой надстройке COM для MS Excel – PowerPivot (MS Office Professional Plus 2013).

Функциональность, заложенная в PowerPivot 2013, в том числе развитый, но весьма простой язык запросов DAX, позволили использовать ее в ИАС, выполняя в одном приложении сразу три этапа обработки данных: создание Хранилища данных, формирование OLAP-куба и визуализация полученных результатов в виде динамических перекрестных таблиц и диаграмм, рисунок 2.

Рисунок 2. - Алгоритм анализа данных с использованием PowerPivot

 

При наличии сведений о среде обитания и популяционных характеристик здоровья населения, живущего и/или работающего в этой среде, обычно представленных в виде матриц данных с разбивкой по территориям (местам работы), группам населения (персонала предприятий) и времени, необходимо поэтапно:

- установить наличие или отсутствие статистических корреляционных связей между показателями здоровья и предполагаемыми факторами риска;

- при наличии корреляционных связей обосновать наличие или отсутствие причинно-следственных связей;

- при наличии причинно-следственных связей вскрыть механизм их действия и постараться определить конкретные элементы этого механизма, на которые можно воздействовать потенциально-эффективными профилактическими мероприятиями.

С помощью ИАС можно подготовить данные, которые потребуются для проведения первого этапа – установления статистических корреляционных связей, в том числе статистических моделей с использованием корреляционного, регрессионного, факторного, кластерного и других методов многомерного анализа данных.

Алгоритмы обработки данных в системах ««Производственная среда – здоровье персонала» и «Среда обитания – здоровье населения» реализуются в ИАС в виде сводных таблиц с использованием PowerPiwot.

Полученные на основе PiwotPivot сводные таблицы позволяют проанализировать как распределение результатов измерений факторов на рабочих местах (среде обитания) практически с любыми наложенными условиями, так и оценить влияние совокупности факторов на здоровье человека.

В результате проведенной работы выполнен комплексный гигиено-эпидемиологический анализ состояния производственной среды и здоровья персонала ЗАО «ТФЗ», а также состояния здоровья населения и среды его обитания в районе расположения указанного объекта в динамике за период 2007-2012 годы в ИАС, включая ГИС анализ [8-11].

Установлен перечень основных специальностей, составляющих «группу риска» по степени вредности и опасности трудового процесса; перечень основных цехов по вредности и опасности; «лидирующая» патология у группы риска.

Установлены ведущие вредные факторы, способные оказать неблагоприятное влияние на состояние здоровья населения.

Выявлена тесная корреляционная связь между заболеваниями органов пищеварения и болезнями костно-мышечной системы у детей из г. Тихвина с повышенным содержанием в питьевой воде железа и алюминия.

Необходимо отметить преимущества и отличия созданного прототипа ИАС:

1. Методологическое единство предметной области;

2. Открытая архитектура системы, позволяющая обновлять информацию и запросы по требованию пользователя системы;

3. Комплексное проектирование системы, включающее полный жизненный цикл системы: проектирование, реализацию, внедрение в эксплуатацию;

4. Унификация используемой нормативной базы (классификаторов, кодификаторов, словарей, картографических основ и т.д.);

5. Оперативная аналитическая обработка данных (On-Line Analytical Processing - OLAP);

6. Максимальное использование имеющегося научного, информационного, технического, программно-технологического и кадрового потенциала;

7. Быстрая скорость ввода и простота обработки данных.

В рамках развития ИАС рекомендовано шире использовать возможности современных информационных систем, созданных в структурах здравоохранения и обязательного медицинского страхования. В них накоплены детальные сведения об оказанных медицинских услугах, что позволяет перейти от статистических показателей в разрезе муниципальных образований к статистике, привязанной к любым произвольно взятым участкам жилой застройки, в том числе примыкающим к точкам контроля окружающей среды.

Для совершенствования ИАС можно выделить несколько основных направлений: более глубокая интеграция ИАС с геоинформационными системами; организация «корпоративного» доступа с использованием Active Directory и LDAP; разработка модулей пакетной загрузки и обработки данных, а также модулей пакетной выгрузки данных в различных форматах – XML, XLS, PDF и т.п.

ИАС предназначена для специалистов Федерального медико-биологического агентства, органов и учреждений Роспотребнадзора, НИИ, территориальных комитетов экологии и природных ресурсов, а также для управлений территориями, администрации химически опасных объектов.

 

Литература:

1. Прохоров Б.Б. Экология человека: учеб. для студ. высш. учеб. заведений /

Б.Б.Прохоров. – 5-е изд., стер. - М.:Издат. центр «Академия», 2010. - 320с.

2. Электронный учебник по статистике. StatSoft, Inc. (2012). – М.: StatSoft. -

WEB:http://www.statsoft.ru/home/textbook/default.htm

3. Малхазова СМ. Медико-географический анализ территорий: картографирование, оценка, прогноз. - М.: Научный мир, 2001. - 240с.

4. Барышников И.И., Вишневский Е.П., Нагорный С.В. Программно- математические решения задач картографирования и управления данными в интересах медико-географических исследований // Медико-географические аспекты оценки уровня здоровья населения и состояния окружающей среды. Сб. науч. трудов.– СПб. 1992.– С. 46-52.

5. Макаров В.З., Новаковский Б.А., Чумаченко А.Н. Эколого-географическое

картографирование городов.– М.: Научный мир, 2002.– 196с.

6. Жуков В.Т., Новаковский Б.А., Чумаченко А.Н.Компьютерное геоэкологичеcкое картографирование.– М.: Научный мир, 1999.– 128с.

7. Заруцкая И.П., Красильникова Н.В. Картографирование природных условий и ресурсов.– М.: Недра, 1988.– 300с.

8. Ревич Б.А., Авалиани С.Л., Тихонова Г.И. Основы оценки воздействия Загрязненной окружающей среды на здоровье человека. Пособие по региональной экологической политике. - М.: Акрополь, ЦЭПР, 2004. - 268с.

9. Зейлер М. Моделирование нашего мира.– М.: МГУ им. Ломоносова, 2001 – 254с.

10. Комплексная гигиеническая оценка степени напряженности медико-эко-

логической ситуации различных территорий, обусловленной загрязнением токсикантами среды обитания населения: Методические рекомендации. – Утв. Гл. госсанврачом РФ 30.07.97 г., № 2510/5716-97-32. – М., 1997. – 28с.

11. Маймулов В.Г., Нагорный С.В., Шабров А.В. Основы системного анализа в эколого-гигиенических исследованиях. – СПб.: СПбГМА им. И.И. Мечникова, 2000. – 342с.

 

Источник: электронный биомедицинский журнал «Medline.ru», том 16

Чтобы оставить комментарий, Вам необходимо авторизоваться (либо зарегистрироваться)

Комментарии

  • Комментариев пока нет