Авторы: Комбарова М.Ю., Рембовский В.Р., Красильников И.А., Радилов А.С., Дулов С.А.
Актуальность вопроса
Анализ количественных зависимостей в системе «среда-здоровье» получил развитие в разработке критериев и методов количественной оценки воздействия факторов окружающей среды на здоровье населения. Актуальным стало сочетание экологического мониторинга с мониторингом здоровья населения, под которым понимается динамическое слежение за состоянием здоровья с пространственной интерпретацией данных для обоснования региональных мероприятий, направленных на устранение риска в конкретных районах [1].
Большое значение при проведении медико-экологического мониторинга и изучения влияния факторов риска на здоровье населения имеет полнота учета этих факторов. Между переменными (случайными величинами) может существовать функциональная связь, проявляющаяся в том, что одна из них определяется как функция от другой. Кроме того, могут быть общие случайные факторы, влияющие на обе переменные. Решение проблемы использования в анализе коррелированных переменных может быть частично решено путем использования факторного анализа с сокращением числа переменных и замены групп переменных на так называемые главные факторы (главные компоненты) [2].
Для обоснования потенциально эффективных мероприятий по охране здоровья населения и работников промышленных предприятий, особенно с вредными условиями производства, необходимо проведение комплексных аналитических исследований на основе сведений, аккумулируемых в информационных системах «Производственная среда - здоровье персонала», «Среда обитания – здоровье населения».
Цель исследования - апробация прототипа информационно-аналитической автоматизированной системы (ИАС) учета, хранения и обработки медико-гигиенической информации о состоянии производственной среды и здоровья персонала особо опасных предприятий Ленинградской области, здоровья населения и среды его обитания в районах расположения указанных предприятий в целях обеспечения химической безопасности в регионе на примере г. Тихвина.
Материалы и методы исследования
Для апробации Алгоритма в системах «производственная среда - здоровье персонала», «среда обитания – здоровье населения» в разработанном прототипе ИАС были использованы следующие материалы:
1. Результаты аттестации 235 рабочих мест ТФЗ, проведенной в декабре 2008 г. (150 рабочих мест) и в декабре 2010 г. (85 рабочих мест) по показателям оценки условий труда по степени вредности и опасности с градациями 1, 2, 3.1, 3.2, 3.3, 4.
2. Сведения о 2322 случаях заболеваний у 202 работников ТФЗ и примерно соответствующих им по возрастно-половой характеристике и месту проживания 194 жителей г.Тихвин.
3. Сведения о среде обитания в г. Тихвине преимущественно за период 2007-2012 гг.
Таблица 1
Пробы, характеризующие среду обитания в г. Тихвине в 2007-2012 гг.
4. Результаты лабораторных исследований на микроэлементы волос детей г.Тихвина, посещающих детские сады в условно «грязной» (42 ребенка) и условно «чистой» (74 ребенка) зонах города.
5. Общая оценка здоровья населения осуществлялась по отчетам о числе заболеваний населения, обслуживаемого МУЗ «Тихвинская центральная районная больница» за период 2008-2012 гг. и сведений о смертности населения Тихвинского района за этот же период (всего в ИАС введено 7774 показателя).
6. Влияние среды обитания на здоровье населения оценивалось на основе данных о 5062 случаях заболеваний детей дошкольного возраста и школьников, посещающих детские сады и школы в условно-грязной (263 ребенка) и условно-чистой (274 ребенка) зонах города.
Основная аналитическая работа была ориентирована на использование технологии OLAP (On Line Analytical Processing), реализованной на платформе MS Office Professional Plus 2013 c применением PowerPivot, последней версией сводных таблиц.
Углубленный математико-статистический анализ выполнялся в пакете Statistica for Windows. Проведено математико-картографическое моделирование с использованием ГИС-технологий [3-7] .
Результаты исследования
В ходе исследования создан прототип автоматизированной информационной системы, предназначенной для сбора, хранения и обработки данных о здоровье людей и влияющих на него факторов. В основу ИАС положена разработанная база данных (БД) оригинальной структуры. Подготовлена необходимая для функционирования ИАС техническая документация и методические рекомендации по ее использованию.
Созданная ИАС позволила ввести для последующей обработки в упорядоченном виде сведения о производственной среде, здоровье населения и среде обитания всего более 240 тыс. записей в 44 таблицах БД.
В процессе работ сделан выбор в пользу свободно распространяемой реляционной системы управления базами данных (далее – СУБД) MySQL v.5.6. В качестве архитектурного решения использовалась облачная технология с доступом к БД через Интернет.
При создании БД, в которой должны храниться все сведения, необходимые для автоматизированного анализа причинно-следственных связей, необходимо было предусмотреть возможность однозначной идентификации всех характеристик с целью обеспечения возможности их безошибочного извлечения для последующего анализа, а также ввод первичных сведений о людях и влияющих на них факторов (транзакционная БД).
БД носит реляционный характер. Все сведения распределяются по плоским двумерным таблицам, в которых каждая запись (строка) однозначно идентифицируется так называемым первичным ключом, а в таблицах, где содержатся соответствующие связанные сведения, имеются внешние ключи. Таким образом, создается весьма сложный комплекс таблиц, между которыми существуют связи (отношения, реляции) типа «один-ко-многим», «многие-к-одному», «многие-ко-многим».
В ИАС можно выделить три информационных блока: люди и их индивидуальные характеристики; состояние среды обитания; популяционные характеристики населения.
Для ввода данных разработан интерфейс, обеспечивающий возможность подключения к БД ИАС тонкого клиента.
Обработка данных включает несколько этапов. 1 этап - статистическое наблюдение (сбор сведений, необходимых для дальнейшего анализа). 2 – ввод полученных сведений в транзакционную БД. 3 этап - создание Хранилища данных (Data Warehouse). В хранилище с определенной периодичностью импортируются из транзакционной БД те данные, которые с высокой вероятностью не будут в дальнейшем меняться. Обновление данных в Хранилище может происходить с разной периодичностью.
Одна из основных проблем, решаемых с помощью Хранилища, – упрощение структуры хранения данных, что облегчает работу специалиста-аналитика. Это возможно в связи с тем, что в Хранилище данные хранятся в неизменяемом виде, что снимает необходимость придерживаться принципов нормализации БД. Таблицы в Хранилище обычно структурированы в виде звезды (центральная таблица фактов в окружении нескольких таблиц-справочников) или снежинки (когда таблицы справочники имеют, в свою очередь, подчиненные им периферические таблицы).
Но упрощение хранения данных не решает задачу ускорения их обработки. Для решения этой задачи в 90-е годы прошлого столетия была разработана технология OLAP (On Line Analytical Processing). На 4-м этапе данные хранилища подвергаются дополнительной обработке. По специально разработанным алгоритмам в фоновом режиме, например, в ночное время, осуществляются многочисленные расчеты и на основе данных Хранилища формируются показатели, которые, с высокой вероятностью, могут потребоваться при проведении анализа. Абстрактно это можно представить как формирование некоего виртуального куба данных, все ячейки которого заполнены уже готовыми показателями, а срезы граней представляют собой измерения какого-либо признака. Результат такой подготовительной работы - высочайшая скорость получения результатов запросов, которые на миллионах строк таблиц Хранилища выполняются практически мгновенно.
Для визуализации полученных результатов к OLAP-кубу на 5-м этапе подключают какие-либо внешние приложения.
Oracle BI
Это могут быть как многофункциональные бизнес-приложения класса Business Intelligence (например, Oracle BI или Crystal Reports, ArcGIS), так и более простые и распространенные программы, например, MS Excel, рисунок 1.
Рисунок 1. - Алгоритм анализа данных с использованием Хранилищ данных и OLAP(OnLineAnalyticalProcessing)
В последние годы появились решения, которые для относительно небольших БД объемом в несколько гигабайт позволяют существенно упростить алгоритм анализа. В первую очередь речь идет о так называемой надстройке COM для MS Excel – PowerPivot (MS Office Professional Plus 2013).
Функциональность, заложенная в PowerPivot 2013, в том числе развитый, но весьма простой язык запросов DAX, позволили использовать ее в ИАС, выполняя в одном приложении сразу три этапа обработки данных: создание Хранилища данных, формирование OLAP-куба и визуализация полученных результатов в виде динамических перекрестных таблиц и диаграмм, рисунок 2.
Рисунок 2. - Алгоритм анализа данных с использованием PowerPivot
При наличии сведений о среде обитания и популяционных характеристик здоровья населения, живущего и/или работающего в этой среде, обычно представленных в виде матриц данных с разбивкой по территориям (местам работы), группам населения (персонала предприятий) и времени, необходимо поэтапно:
- установить наличие или отсутствие статистических корреляционных связей между показателями здоровья и предполагаемыми факторами риска;
- при наличии корреляционных связей обосновать наличие или отсутствие причинно-следственных связей;
- при наличии причинно-следственных связей вскрыть механизм их действия и постараться определить конкретные элементы этого механизма, на которые можно воздействовать потенциально-эффективными профилактическими мероприятиями.
С помощью ИАС можно подготовить данные, которые потребуются для проведения первого этапа – установления статистических корреляционных связей, в том числе статистических моделей с использованием корреляционного, регрессионного, факторного, кластерного и других методов многомерного анализа данных.
Алгоритмы обработки данных в системах ««Производственная среда – здоровье персонала» и «Среда обитания – здоровье населения» реализуются в ИАС в виде сводных таблиц с использованием PowerPiwot.
Полученные на основе PiwotPivot сводные таблицы позволяют проанализировать как распределение результатов измерений факторов на рабочих местах (среде обитания) практически с любыми наложенными условиями, так и оценить влияние совокупности факторов на здоровье человека.
В результате проведенной работы выполнен комплексный гигиено-эпидемиологический анализ состояния производственной среды и здоровья персонала ЗАО «ТФЗ», а также состояния здоровья населения и среды его обитания в районе расположения указанного объекта в динамике за период 2007-2012 годы в ИАС, включая ГИС анализ [8-11].
Установлен перечень основных специальностей, составляющих «группу риска» по степени вредности и опасности трудового процесса; перечень основных цехов по вредности и опасности; «лидирующая» патология у группы риска.
Установлены ведущие вредные факторы, способные оказать неблагоприятное влияние на состояние здоровья населения.
Выявлена тесная корреляционная связь между заболеваниями органов пищеварения и болезнями костно-мышечной системы у детей из г. Тихвина с повышенным содержанием в питьевой воде железа и алюминия.
Необходимо отметить преимущества и отличия созданного прототипа ИАС:
1. Методологическое единство предметной области;
2. Открытая архитектура системы, позволяющая обновлять информацию и запросы по требованию пользователя системы;
3. Комплексное проектирование системы, включающее полный жизненный цикл системы: проектирование, реализацию, внедрение в эксплуатацию;
4. Унификация используемой нормативной базы (классификаторов, кодификаторов, словарей, картографических основ и т.д.);
5. Оперативная аналитическая обработка данных (On-Line Analytical Processing - OLAP);
6. Максимальное использование имеющегося научного, информационного, технического, программно-технологического и кадрового потенциала;
7. Быстрая скорость ввода и простота обработки данных.
В рамках развития ИАС рекомендовано шире использовать возможности современных информационных систем, созданных в структурах здравоохранения и обязательного медицинского страхования. В них накоплены детальные сведения об оказанных медицинских услугах, что позволяет перейти от статистических показателей в разрезе муниципальных образований к статистике, привязанной к любым произвольно взятым участкам жилой застройки, в том числе примыкающим к точкам контроля окружающей среды.
Для совершенствования ИАС можно выделить несколько основных направлений: более глубокая интеграция ИАС с геоинформационными системами; организация «корпоративного» доступа с использованием Active Directory и LDAP; разработка модулей пакетной загрузки и обработки данных, а также модулей пакетной выгрузки данных в различных форматах – XML, XLS, PDF и т.п.
ИАС предназначена для специалистов Федерального медико-биологического агентства, органов и учреждений Роспотребнадзора, НИИ, территориальных комитетов экологии и природных ресурсов, а также для управлений территориями, администрации химически опасных объектов.
Литература:
1. Прохоров Б.Б. Экология человека: учеб. для студ. высш. учеб. заведений /
Б.Б.Прохоров. – 5-е изд., стер. - М.:Издат. центр «Академия», 2010. - 320с.
2. Электронный учебник по статистике. StatSoft, Inc. (2012). – М.: StatSoft. -
WEB:http://www.statsoft.ru/home/textbook/default.htm
3. Малхазова СМ. Медико-географический анализ территорий: картографирование, оценка, прогноз. - М.: Научный мир, 2001. - 240с.
4. Барышников И.И., Вишневский Е.П., Нагорный С.В. Программно- математические решения задач картографирования и управления данными в интересах медико-географических исследований // Медико-географические аспекты оценки уровня здоровья населения и состояния окружающей среды. Сб. науч. трудов.– СПб. 1992.– С. 46-52.
5. Макаров В.З., Новаковский Б.А., Чумаченко А.Н. Эколого-географическое
картографирование городов.– М.: Научный мир, 2002.– 196с.
6. Жуков В.Т., Новаковский Б.А., Чумаченко А.Н.Компьютерное геоэкологичеcкое картографирование.– М.: Научный мир, 1999.– 128с.
7. Заруцкая И.П., Красильникова Н.В. Картографирование природных условий и ресурсов.– М.: Недра, 1988.– 300с.
8. Ревич Б.А., Авалиани С.Л., Тихонова Г.И. Основы оценки воздействия Загрязненной окружающей среды на здоровье человека. Пособие по региональной экологической политике. - М.: Акрополь, ЦЭПР, 2004. - 268с.
9. Зейлер М. Моделирование нашего мира.– М.: МГУ им. Ломоносова, 2001 – 254с.
10. Комплексная гигиеническая оценка степени напряженности медико-эко-
логической ситуации различных территорий, обусловленной загрязнением токсикантами среды обитания населения: Методические рекомендации. – Утв. Гл. госсанврачом РФ 30.07.97 г., № 2510/5716-97-32. – М., 1997. – 28с.
11. Маймулов В.Г., Нагорный С.В., Шабров А.В. Основы системного анализа в эколого-гигиенических исследованиях. – СПб.: СПбГМА им. И.И. Мечникова, 2000. – 342с.
Источник: электронный биомедицинский журнал «Medline.ru», том 16