Электронный журнал "Архитектура здоровья"
`
Категория: Случай из практики

Статистический анализ множества графиков частотных спектров голосов человека, полученных методом быстрого преобразования Фурье (БПФ), позволил выявить закономерности характеристик графиков содержания глюкозы в крови. Например, было определено содержание глюкозы в крови на момент записи голоса В. Высоцкого (5,3 ммоль/л, диабетом не страдал) и Л. Паваротти (12,8 ммоль/л, как известно, скончался от осложнений, вызванных сахарным диабетом). Найденная закономерность влияния химического состава крови на релаксационные процессы и, соответственно, на физико-механические свойства голосовых связок позволит, в перспективе, определять и другие биохимические параметры крови по голосу человека.

Состояние проблемы

По оценке Всемирной организации здравоохранения (ВОЗ) сахарным диабетом страдают до 7% жителей Земли, из которых 20% даже не знают, что они больны. Нарушения углеводного обмена в организме человека (эндокринологические заболевания) в той или иной степени являются причиной развития опасных осложнений: инфаркта, инсульта, склероза, гипертонии, диабетической стопы, ретинопатии и многих других болезней. Своевременный контроль содержания сахара в крови позволяет минимизировать или вовсе исключить опасные последствия развития диабетических осложнений. Простой, доступный и точный способ измерения глюкозы в крови позволит вовремя выявлять диабетические аномалии и сохранить здоровье миллионам людей.

Существуют два основных метода измерения глюкозы в крови: инвазивный (прямой), с забором крови и неинвазивный (косвенный), без забора крови. Инвазивный метод относительно точен, в домашних условиях менее 15% погрешности, но требует проведения болезненной и небезопасной процедуры прокалывания кожи для забора крови, а неинвазивный применяется в качестве маркера - индикатора «много или мало» сахара в крови. Данный вопрос подробно проанализирован М. Ахмановым, И. Чайковским в серии статей «Неинвазивный глюкометр: обзор проблем». В этих статьях, в качестве физического метода измерений, голосовой метод авторами не рассматривается. Ими сделан вывод, что на сегодняшний день не существует надёжного и точного неинвазивного способа измерения содержания сахара в крови человека. Авторы приравнивают создание такого устройства к величайшим техническим достижениям: как выходу человека в космос или запуску адронного коллайдера.

Голос является важным источником информации о состоянии здоровья человека. Анализ голоса используется многими исследователями для различных целей. В частности, запатентован полиграф, основанный на анализе голоса, голосовой спиртометр и ряд других устройств. Главной же причиной того, что голосовой метод не рассматривался в качестве источника информации о содержании глюкозы в крови, является, по нашему мнению, стереотип мышления, заключающийся в догме, что косвенный метод заведомо не может быть точнее, прямого измерения. Однако ещё более 200 лет назад математиком Жаном Батистом Фурье был разработан мощный инструмент анализа самого широкого круга волновых явлений, в том числе и для голоса человека, который позволял решать сложные уравнения физики, описывающие динамические процессы на основе общих математических моделей.

Примером другого стереотипа является экзотический патент № 2506893 С1, выданный группе авторов в 2014 г. на «Способ неинвазивного определения содержания глюкозы в крови и устройство для его осуществления».

Вся концепция, представленного в патенте способа, построена на определении и отборе максимальных пиков интенсивности на частотном спектре голоса человека, полученном быстрым преобразованием Фурье (БПФ), и вычислении математических соотношений между различными числовыми величинами этих пиков. Авторами данного патента, к нашему удивлению, проигнорирована информативность локальных минимумов в частотном спектре, впадин на графике, которые являются неотделимой частью любого спектра. Также не указан сам метод Фурье, применённый в данный работе. В патенте отсутствует понятие релаксации голосовых связок, которые определяют взаимосвязь между химическими свойствами крови и физико-механическими свойствами самих связок. В данном случае налицо стереотип «пикового мышления», которое характерно для анализа процессов в области квантовой механики, где процессы - события протекают в миллионные доли секунды, а понятие минимумов-впадин условно отсутствует. Найденная в патенте «пиковая закономерность» малоинформативна, является вторичной по отношению к релаксационным физико-механическим процессам, что вносит существенный момент неопределённости и, как следствие, приводит к увеличению погрешности измерений в спектральном анализе БПФ и по патенту в целом.

Кроме того, метод требует проведения предварительной индивидуальной калибровки с применением стандартных инвазивных устройств диагностирования уровня сахара в крови.

Справедливости ради, следует вспомнить и пионера «голосового метода» определения содержания глюкозы в крови Фёдора Кондратьева, который первым предложил данную идею. Погрешность измерений на его «голосовом аудиометре» в виде смартфона была более 20%. Участвуя в международных выставках и конференциях, автор не раскрывал сущности используемых им физических процессов и получал награды за перспективность развития данного направления. Метод не получил продолжения и был засекречен автором, по всей видимости, в связи с нерешённой проблемой высокой погрешности измерений, что, скорее всего, также связано с «пиковым стереотипом».

По нашему мнению, важнейшим информационным носителем, коррелирующим с содержанием глюкозы в крови, являются впадины на частотном спектре графика БПФ. Этот вывод следует из рассмотрения известных физических акустических закономерностей и исследований.

 

 


Рис. 1. На фазовом графике амплитудной огибающей 6 звука 7 выделены: период атаки 1 – начальной фазы или подъёма звука; период остановки 2 – короткой стабилизации после подъёма; спад 3 – фаза перехода звука в установившееся состояние; фаза удержания (релаксации) 4 – установившееся состояние (чаще всего впадина); 5 – фаза затухания, или вместо фазы затухания может последовать новая фаза атаки.
 

Уникальность голоса

Аудиосистема источника звуковых колебаний голоса человека состоит из гортани и голосовых связок, материалом для которых является биологическая ткань (мышечная и соединительная) с циркулирующей в ней кровью. При изменении химического состава крови изменяется и коэффициент упругости биологической ткани. Проведённые исследования по измерению коэффициента упругости модели такой ткани показали, что с увеличением уровня концентрации глюкозы в крови пропорционально увеличивается и коэффициент её упругости, а эластичность уменьшается (при малых деформациях). Указанная зависимость позволяет определять уровень глюкозы в крови человека по изменению интенсивности и частотных характеристик колебаний системы гортани и голосовых связок. Были также проведены исследования соответствия спектра колебаний голоса человека показателям уровня глюкозы в крови, измеренных инвазивным методом. Результаты исследований показали, что в спектре голоса человека имеются пики и впадины интенсивности, которые изменяли своё положение на частотной координате в зависимости от концентрации глюкозы в крови по формуле (1).

Функциональная зависимость содержания глюкозы в крови от частотной характеристики и параметров интенсивности голосового спектра человека.

 (1)

n = f (w, Iw), где
n – содержание глюкозы в крови, ммоль/литр;
w – частотная характеристика голосового спектра, Гц;
Iw – значение интенсивности I (дБ) на частоте w;
 

На рис. 2 изображён график частотного спектра [1] (после программной обработки) голоса пользователя «А». На нём в зоне высоких частот [2], более 15 кГц, находим пик наибольшей интенсивности [3], который, в данном примере, соответствует частоте 15,2 кГц [4]. Пики интенсивности в областях частот [5] и [8], а также частоты [7] от 5 кГц [4] в расчёте не учитываются.
От пика интенсивности [3], равного 33,15 дБ смещаем значение на 1 дБ и находим точку [6], определяющую ширину [3-6] базовой полосы интенсивности. Исследуем график частотного распределения в зоне частот 5 кГц < w < 15,2 кГц и интенсивности в пределах -34,15 дБ < Iw < -33,15 дБ. В области [3-6-10-9] находим пик минимальной интенсивности [11], пик максимальной интенсивности [12] и наиболее глубокую впадину интенсивности между ними [13]. Проекцией точки экстремума впадины [13] на ось абсцисс находим содержание глюкозы в крови [14] пользователя «А», соответствующее, в данном случае, 12,7 ммоль/л.
Контрольное измерение инвазивным глюкометром показало значение 12,8 ммоль/л [15].

Голос - это инструмент, имеющий уникальные специфические особенности для каждого конкретного человека. На тембр голоса влияет индивидуальное строение голосовых связок: их длина, толщина и характеристики волокнистой структуры ткани. Голосовые связки отличаются от других видов тканей человека особой эластичностью и упругостью. При вдохе связки сходятся, а при выдохе расходятся. Силу голоса в децибелах (дБ) связывают с амплитудой их колебаний, частотой и фазовыми изменениями голоса. Скорость распространения колебаний связок зависит от среды, упругости, плотности и не зависит от частоты звуковых колебаний. Голос воспринимается в той последовательности, в которой его создаёт источник. Основная функция мышц голосовых связок состоит в преобразовании химической энергии в механическую работу. Именно на этом основывается корреляция интенсивности голоса и показаний глюкозы в крови человека. Главными биомеханическими показателями, характеризующими деятельность мышц голосовых связок, являются сила их натяжения и скорость изменения их длины. При возбуждении мышц голосовых связок изменяется их механическое состояние, которое называют сокращением, проявляющееся в изменении их натяжения, длины мышц, упругости, твёрдости и других параметров. Зависимость между величиной нагрузки и удлинением мышцы не пропорциональна и, следовательно, не подчиняется закону Гука. Таким образом, если мышцу голосовых связок растягивать многократно через небольшие интервалы времени, что характерно для разговорной речи, то её длина увеличивается больше, чем при аналогичном однократном растягивании.

Длина, которую стремятся принять мышцы голосовых связок без нагрузки, именуется равновесной. При равновесной длине мышцы её упругие силы равны нулю. В живом организме длина мышцы, как правило, несколько больше равновесной, в связи с чем даже расслабленные мышцы сохраняют некоторое натяжение. Голосовые связки в процессе работы преобразуют накопленную энергию упругости при колебаниях в потоке воздуха и химическую энергию в механические колебания. Свойства связок в живом организме зависят от наполненности их мышц кровью, и, поскольку кровь является неотъемлемой частью мышц голосовых связок, они, естественно, зависят от состава самой крови. Таким образом, кровь человека как питающая среда прямо и опосредованно определяет физические характеристики мышечных волокон голосовых связок и влияет на физические и, следовательно, акустические параметры голоса человека.

Извлечение звука на голосовых связках человека как колебательный процесс энергетически сбалансировано: время образования пика интенсивности относительно мало при высоких затратах энергии, а время образования впадины интенсивности относительно велико при низких затратах энергии. Эта зависимость сохраняется также и после преобразования звукового сигнала голоса человека в спектр частотного распределения.

Для мышц голосовых связок характерно свойство релаксации - снижение силы упругой деформации с течением времени. Параметром акустической релаксации является время восстановления термодинамического равновесия, которое было нарушено сжатием или растяжением в процессе извлечения звука голосовыми связками. Влияние релаксационных процессов на процесс извлечения звука - звуковой волны - зависит от соотношения между её периодом T и временем релаксации τ: чем меньше отношение τ/T, тем полнее успевает восстановиться нарушенное равновесие; чем это отношение больше, тем в меньшей степени равновесие восстановится. Слуховой аппарат человека также представляет собой биологическую структуру, которой свойственна релаксация. Для частот в полосе в 1 - 2 кГц период релаксации слухового аппарата составляет более 15 мс, а для частот ниже 500 Гц - более 60 мс. Данный физический процесс аналогичен и для голосовых связок. При извлечении звука на пиках интенсивности голосовые связки не успевают войти в состояние равновесия, и извлекаемый ими звук не несёт в себе полезной информации об их состоянии, в частности, о биохимическом составе крови, их питающей. Таким образом, информацию о состоянии голосовых связок и, соответственно, биохимическом составе крови могут нести в себе лишь параметры впадин на частотном графике интенсивности голоса человека

Голос и глюкоза

 

На рис. 3 изображён график частотного спектра [1] (после программной обработки) голоса пользователя «В». На нём в зоне высоких частот [2], более 15 кГц, находим пик наибольшей интенсивности [3], который, в данном примере, равен частоте 15,5 кГц [4]. Пики интенсивности в областях [5] и [7] для пользователя «В» не учитываются, как и зона частот [6] менее 5 кГц.

Далее исследуем график частотного распределения в диапазоне [8] частот 5 кГц < w < 15,5 кГц. В указанной области находим пик минимальной интенсивности [9], пик максимальной интенсивности [10] и наиболее глубокую впадину интенсивности между ними [11]. Проекцией точки экстремума впадины [11] на ось абсцисс находим содержание глюкозы в крови [12] пользователя «В», соответствующее, в данном случае, 9,8 ммоль/л.

Контрольное измерение инвазивным глюкометром показало значение 9,7 ммоль/л [13].

Рис. 4 Принципиальная схема программного обеспечения

Пользователь [1] посредством пользовательского интерфейса программы [2] и микрофона [3] передаёт звук своего голоса в систему, где аудио-сигнал записывается в звуковой wav-файл программн ым модулем записи звукового сигнала [4]. К записанному звуковому wav-файлу [5] в модуле обработки звукового сигнала [6] применяются процедуры нормализации по интенсивности и аудио-фильтрация. На основе данных обработанного wav-файла [7] модулем спектральной обработки [8] осуществляется преобразование wav-файла [7] в спектр Фурье и сглаживание полученного спектра. Результирующая таблица данных (частота/интенсивность) [9] передаётся в алгоритмический модуль [10], где с данными таблицы [9] осуществляются математические и логические операции, в результате которых возникает ряд новых данных (промежуточных и вспомогательных), а также искомое значение содержания глюкозы в крови [11], которое сообщается пользователю [1] посредством пользовательского интерфейса [2]. На устройствах, вычислительные мощности которых позволяют осуществлять обработку голосового сигнала «на лету», запись звукового файла [5] при этом не производится, а Фурье-спектр формируется сразу в процессе произнесения голосовой фразы.

Рис. 5 Распределённая система измерения содержания глюкозы в крови пациента

1 - Клиент – проводной телефон: голосовой поток обрабатывается сервером приложений [9], и результаты измерения возвращаются пользователю в виде голосового сообщения.
2 - Клиент – сотовый телефон: голосовой поток обрабатывается сервером приложений [9], и результаты измерения возвращаются пользователю в виде голосового сообщения или в форме SMS;
3 - Клиент – планшетный компьютер: голосовой поток частично обрабатывается на стороне клиента специализированным приложением, а серверу приложений передаются промежуточные результаты. Результаты измерения возвращаются пользователю через клиентское приложение;
4 - Клиент – смартфон: взаимодействие с системой осуществляется по типу [2], либо п о типу [3] в зависимости от желания пользователя, возможностей смартфона и наличия либо отсутствия на смартфоне специализированного приложения;
5 - Клиент – персональный компьютер: взаимодействие с системой осуществляется по типу [3], либо через специализированный WEB-интерфейс системы;
6 - Клиентские устройства, функционирующие на базе различных системных платформ (iOS, OSX, BlackBerry и пр.): взаимодействие с системой осуществляется по типу, зависящему от наличия или отсутствия для данной платформы специализированного приложения и возможностей клиентского устройства;
7 - Клиент - портативный компьютер: взаимодействие с системой осуществляется по типу [5];
8 - Сервер авторизации;
9 - Сервер приложений.


В представленной физической модели как способе измерения уровня глюкозы в крови по голосу человека в общем виде реализован анализ взаимовлияния двух основных параметров голоса: интенсивности и частотного спектра колебаний голосовых связок. Человек, уровень глюкозы в крови которого хотят измерить, произносит в микрофон голосовую фразу. Далее осуществляют запись и нормализацию звукового сигнала, т.е. приведение уровня громкости записи к максимальным значениям уровня громкости разговорной речи (20- 80 дБ). Затем с помощью программно-аппаратного звукового анализатора преобразуют голос человека в цифровую модель спектрального распределения интенсивности по частотам (см. график). Обратным преобразованием Фурье определяют интенсивность производного сигнала как базового, очищенного от шума голосового спектра.


В зоне высоких частот базового голосового спектра частотного распределения, программно определяют ширину базовой полосы интенсивности и программно выбирают на ней два пика интенсивности, соответствующие: максимальному пику (по его высоте) и первому от него минимальному пику (показано на рис. 1 на линии 6 справа), и впадину (точку) наибольшей глубины между ними (условно находится на линии 6 в области 3-4). Далее, проекцией точки на ось абсцисс определяют искомую величину концентрации глюкозы в крови.


В качестве прибора для регистрации голоса человека используют любое устройство, обладающее функцией приёма звуковых колебаний.


Метод апробирован на больных диабетом 1-го и 2-го типов и здоровых людях с контрольным измерением при помощи инвазивного глюкометра Accu-Chek. Проведённый анализ полученного массива спектральных графиков голосов пациентов демонстрирует указанную закономерность: см. рис. 2 и 3, где показатель концентрации глюкозы в крови определяют двумя схожими способами. При этом оба показывают практически точное совпадение с результатами измерения инвазивным глюкометром для домашнего использования в тот же момент времени для тестируемых пользователей.


На рис. 4 представлена разработанная авторами компьютерная система определения содержания сахара в крови по голосу.


Программные компоненты системы могут быть распределены по различным компьютерным устройствам (например, в зависимости от их вычислительных мощностей) или локализованы на одном устройстве, например, смартфоне или персональном компьютере. Распределённая компьютерная система определения сахара в крови, взаимодействующая посредством глобальной сети, представлена на рис. 5.


Например (см. рис. 5), если у пользователя смартфон [4], на нём устанавливается специализированное клиентское приложение (через Google-маркет или AppStore). При этом обработка голосового сигнала производится непосредственно клиентским приложением, а на сервер [9] передаются лишь параметры спектра Фурье. Сервер приложений [9] производит анализ этих параметров и через клиентское приложение передаёт результаты измерения пользователю. На серверах системы [8, 9] осуществляется сбор и хранение данных предыдущих измерений и их статистический анализ. Клиент взаимодействует с системой на базе пользовательского соглашения и оплачивает её работу, например, в виде клиентской подписки. При этом конкретный пользователь может производить измерения также и при помощи других устройств [1, 3-7], предварительно пройдя процедуру авторизации на сервере [8].


От вероятного - к точному


Созданию неинвазивного (косвенного) способа измерения содержания сахара в крови, не уступающего по точности инвазивному (прямому) способу, препятствует стереотип «невозможности решения поставленной задачи». Считается, что вероятностный характер рассмотренных физиологических и физических процессов неминуемо приводит к увеличению погрешности при измерении сахара в крови по голосу. Однако есть возможность сделать так, что свойства вероятностных процессов будут не понижать, а повышать точность измерений.


Решение этой задачи потребовало комплексного подхода к исследованиям, совместного анализа различных физико-механических процессов для выявления в них общей закономерности и выразилось в создании единой формулы, на которой и базируется алгоритм компьютерной программы «голосового глюкометра». Найденная общая закономерность определила построение универсального алгоритма для измерения глюкозы в крови человека по его голосу с погрешностью до10% (без дополнительных тестовых исследований).

Разработанная программа позволяет кардинально упростить диагностику и лечение сахарного диабета по известной методике, связанной с режимом питания человека: временем, количеством и химическим составом потребляемых им продуктов и других условий диеты. Возможность простого, длительного и постоянного контроля уровня глюкозы в крови, поддержание её в норме здорового человека (4,2 - 6,5) ммоль/литр, как показывают исследования, приводит к нормализации углеводных обменных процессов в организме человека и, тем самым, к исключению опасных осложнений от сахарного диабета. Сегодня мы сможем это делать.


Способ и устройство, описанные в статье, защищены «patent pending».

 

Источник: журнал «Техника молодежи»

Чтобы оставить комментарий, Вам необходимо авторизоваться (либо зарегистрироваться)

Комментарии

  • Комментариев пока нет