спектральный компьютерный анализ голоса – метод ранней и дифференциальной диагностикинарушений голосовой функции

Учреждение разработчик: ГУЗ  «Московский научно-практический центр оториноларингологии» Департамента здравоохранения г. Москвы.

Составители: д.м.н., профессор Ю.С. Василенко, кандидат физико-математических наук, профессор А.П. Мещеркин, к.м.н. О.Г. Павлихин, к.м.н. С.Г. Романенко

Рецензент: к.м.н. О.Е. Мануйлов

Предназначение: В методических рекомендациях обобщен многолетний опыт авторов по диагностике нарушений голосовой функции как объективного метода оценки функционального состояния голосового аппарата и способа диагностики голосовых расстройств. Методические рекомендации рассчитаны на врачей – оториноларингологов, врачей – фониатров, фонопедов.

Данный документ является собственностью Департамента здравоохранения Правительства Москвы и не подлежит тиражированию и распространению без соответствующего разрешения.

ВВЕДЕНИЕ

Голос – совокупность звуков, издаваемых человеком с помощью голосового аппарата, продукт его деятельности. Основными физическими характеристиками голоса являются сила (интенсивность) и высота (частота). Сила голоса – это субъективное восприятие интенсивности или уровня звукового давления голоса. Она находится в прямой зависимости от величины воздушного давления в подскладковом пространстве, степени напряжения голосовых складок и определяется амплитудой их колебаний. Сила голоса измеряется в децибеллах (дБ). Высота голоса – субъективное слуховое восприятие частоты сгущений и разряжений воздуха, образуемых смыканием и размыканием голосовых складок. Высота голоса определяется в герцах (Гц).

Человеческий голос, как и многие другие звуки, является сложным по составу и состоит из комбинации простых звуков, в котором различают основной тон и частичные тоны или обертоны.

В связи со спецификой акустической терминологии, считаем целесообразным, привести определение некоторых терминов, которые наиболее часто используются профессионалами голоса.

В голосе кроме высоты, силы звука, необходимо оценивать тембр голоса и диапазон голоса. Тембр голоса – сумма и сочетание обертонов, наличие которых обуславливает индивидуальную «окраску» голоса, придает речи человека различные эмоциональные оттенки, позволяет узнавать людей по голосу.  Эти свойства голоса специалисты описывают как голос звонкий или глухой, льющийся или жесткий, металлический или матовый и т.д. Все это бесконечное разнообразие с точки зрения акустики является следствием изменения во времени только трех важнейших акустических параметров звука: частоты колебаний, их амплитуды и звукового спектра. Тембр голоса зависит не только от спектрального состава звука, но и вибрато (Drew R., Sapir S. 1995). Вибрато придает голосу выразительность. Вибрато — сложное акустическое явление. Оно зависит от периодического изменения всех характеристик звука: высоты и силы. При частоте колебаний 5-7 раз в секунду голос красивый, льющийся При более редких колебаниях голос воспринимается как качающийся, при более частых — как тремолирующий.

Диапазон голоса – это то количество тонов, которое может быть воспроизведено голосом здорового человека без особых усилий.

Применяемые в широкой практике методы исследования традиционных акустических параметров голосовой функции — несмотря на их диагностическую значимость, не всегда позволяют в полной мере выявить его расстройства в ранней стадии заболевания и провести детальную оценку голосовой функции.   

Для повышения эффективности лечения, ранней диагностики и профилактики заболеваний голосового аппарата целесообразно внедрение в практику врача – фониатра современных объективных методов оценки состояния голосовой функции гортани, позволяющих осуществить раннюю диагностику нарушений голосовой функции. Особое значение приобретает объективная оценка голоса у лиц голосо-речевых профессий (педагогов, переводчиков, дикторов и т.п.), поскольку к его качеству, как правило, предъявляются высокие требования. Голос должен быть выразительным, приятным для восприятия слушателями.

Приоритет исследования спектрального состава голоса принадлежит С.Н. Ржевкину (1936, 1956) который в ряде своих работ проанализировал спектральный состав гласных при помощи анализатора Мадера. Результаты этих исследований показали, что спектр гласных звуков характеризуется наличием двух основных формантных областей: в области низких частот (300-600 Гц)  и области высоких частот (2500-3000 Гц). Первая форманта, придающая, по мнению автора, тембру голоса мягкость, округлость и массивность, была названа низкой формантой (НФ). Вторая, обуславливающая звонкость, полетность, яркость голоса, получила название верхней или высокой форманты (ВФ).

Исследования спектрального состава голоса, проведенные впоследствии разными авторами, показали важную роль высоких, так и низких  спектральных его составляющих (Лебедева Н.Ф. 1952, Гарбузов Н.А. 1954, Варшавский Л.А., Чистович Л.П. 1959,  Husson, 1960, Шамшева Т.Е.  1974, Морозов В.П. 1977, Klinghoz F. 1992). По данным Дмитриева Л.Б.  (1968), Морозова В.П.. (1977) для низких голосов (бас, баритон) высокая форманта составляет 2500-2800 Гц, для более высоких (тенора, сопрано) она доходит до 3200 Гц. У профессионалов голоса с большим стажем работы в области ВФ сосредоточено до 30-35 % всей звуковой энергии голоса. У начинающих она достигает только 5-7 %.

Установлено что, решающее значение в образовании основного тона, и основного соответственно звучания всего голоса в целом имеет характер смыкания голосовых складок.

    Основной тон, видоизменяется за счет резонанса в верхних (гортань, ротоглотка, придаточные пазухи носа) и нижних (трахея, грудная клетка) резонаторах. Формирование формант зависит от клинико-функционального состояния гортани, а окончательное их звучание от состояния резонаторных полостей. Высокая и низкая  форманты постоянно присутствуют в голосе квалифицированного профессионала голоса.

         Современные акустические исследования голоса, основанные на компьютерных технологиях, позволяют быстро и с высокой степенью точности определить диапазон голоса, частоту его основного тона, количество обертонов, формантный состав звукового сигнала и характеристики вибрато. Одним из наиболее объективных и информативных методов исследования является спектральный компьютерный анализ голоса.

Методика обследования

Следует подчеркнуть, что прежде ем проводить компьютерный анализ голосовой функции пациента необходимо собрать анамнез заболевания, провести общеклиническое обследование, ларингоскопию, микроларингоскопию.

Обследование проводится в специальном кабинете, обязательно снабженным звукоизоляцией. Через конденсаторный микрофон типа SM91 A  фирмы Shure осуществляется запись звучания голоса на компьютере типа IBM PC с процессором Pentium 233,  оперативной памятью 32 МВ и дисковой памятью 4,2 гБ, снабженным неспециализированной звуковой платой AWE 32  фирмы Creative Labs. Используются программы Sound Forge 4.0 в формате 16 бит с частотой сэмплирования 44,1 кГц, что позволяет адекватно представлять частотный диапазон от 0 до 22 кГц. Спектральный анализ проводится также в программе Sound Forge 4.0 методом быстрого преобразования Фурье с различными вариантами параметров усреднения.

Пациент, после 5 минутной голосовой нагрузки (чтения), необходимой для «разогрева» голоса, интонирует все ноты своего предполагаемого рабочего диапазона от нижних к верхним на “forte” и на “piano” c интервалом в терцию. Каждая нота задается на синтезаторе. 

Результаты анализа могут быть представлены в нескольких видах.

В виде графика, отражающего в режиме реального времени весь записанный диапазон голоса пациента, по которому можно будет судить о равномерности  нарастания и затухания звукового сигнала,  оценить вид «атаки звука», оценить устойчивость гласных звуков. По оси абсцисс фиксируется реальное время фонации в секундах, по оси ординат — сила преобразованного сигнала в милливольтах.

1

Рис. 1 Общий вид графически записанного  голоса вокалиста в норме

а – запись звука на «piano»

б – запись звука на «forte»

В виде изменяющейся в реальном времени спектральной диаграммы (спектрограммы), где по оси абсцисс представляется частота звука (в герцах), а по оси ординат — соответствующая ей интенсивность звука (в децибелах).

2

Рис. 2  Спектральная диаграмма  в норме

а — основной тон

б – обертоны

в — области резонансного усиления

Характеристика голосовой функции при патологии голосового аппарата по данным компьютерного спектрального анализа голоса

 Спектральный анализ голоса использовался нами при диагностике различных заболеваний голосового аппарата в сочетании с традиционными методами обследования, что позволяло уточнить степень тяжести нарушения голосовой функции при различных видах патологии и назначить адекватное лечение.

Также, при длительном, рецидивирующем течении функциональных дисфоний, исследование спектрального состава голоса, в частности, анализ устойчивости основного тона и продолжительности фонации различных гласных звуков, помогает дать прогноз течения  заболевания, оценить степень вероятности   перехода функционального заболевания в органическое.

 Наиболее информативными для оценки голосовой функции являются спектрограммы, на которых можно в режиме реального времени оценить  частоту основного тона, количество обертонов и их регулярность. 

Гипотонусная дисфония

Гипотонусная дисфония представляет собой нарушение голоса, вызванное снижением тонуса голосовых складок. Причинами, ведущими к возникновению гипотонусной дисфонии, являются постоянное перенапряжение голосового аппарата, неправильное пользование им,  работа на фоне острых воспалительных заболеваний верхних дыхательных путей (ларингиты, трахеиты). По нашим данным данная патология занимает 17-18% в структуре заболеваний голосового аппарата.

На спектрограммах, за счет слабости голосовых мышц, отмечается смещение частоты основного тона, как правило, в сторону его понижения, нерегулярность пиков обертонов и уменьшение их количества, неустойчивость гласных звуков, изменение частоты вибрато (как в сторону его увеличения — тремоляция, так и в сторону уменьшения — “качание” голоса). Имеет место падение интенсивности голоса в области отдельных тонов переходного регистра, сужение динамического диапазона.

3

Рис. 3  Типичная спектрограмма больного с гипотонусной дисфонией

Гипертонусная дисфония

Гипертонусная дисфония представляет собой нарушение голоса, характеризующееся повышением тонуса мышц голосовых складок, и встречается чаще всего у мужчин при напряженной, силовой манере разговора или пения.

При проведении спектрального исследования голоса отмечалось резкое смещение частоты основного тона (в сторону ее повышения), его неустойчивость. Сила голоса у пациентов не превышала  70-75 дБ. Также фиксируется укорочение временных интервалов между пиками обертонов и уменьшение числа обертонов, минимальное количество областей резонансного усиления голоса и аритмичное, нестабильное вибрато, с тенденцией к увеличению его частоты (тремоляция). Отмечается снижение динамического диапазона голоса

4

Рис. 4 Типичная спектрограмма больного с гипертонусной дисфонией

 Гипотонусная дисфония с ложноскладковым голосом

(гипо-гипертонус гортани)

Гипотонусная дисфония с ложноскладковым голосом (гипо-гипертонус гортани) представляет собой нарушение голоса, характеризующееся понижением тонуса мышц голосовых складок, и повышением тонуса вестибулярных. Данная патология, как правило, встречается у пациентов, которые на фоне гипотонуса голосовых складок (острый ларингит, перегрузка голосового аппарата), когда для достижения звучного голоса они вынуждены включать в процесс голосообразования вестибулярные складки. Данная патология встречается одинаково часто как у мужчин, так и у женщин.

При спектральном анализе голосовой функции отмечается сужение диапазона голоса пациента, не выраженность основного тона, преобладание сигнала обертонов над основным тоном, смещение и уменьшение количества областей резонансного усиления сигнала.

5

Рис. 5 Типичная спектрограмма больного с гипо-гипертонусом гортани

 Фонастения

Фонастения – является функциональным расстройством голоса, которое  характеризуется нарушением координации между дыханием, фонацией, артикуляцией и функции резонаторов на фоне неврастенической предрасположенности. Чаще заболевание встречается у  женщин. Это объясняется особенностями их нервной и эндокринной системы, создающих фон для развития фонастении, а также меньшей выносливостью, по сравнению с мужчинами, голосового аппарата.

При спектральном анализе голоса фиксируется  отсутствие  сигнала основного тона, стертость пиков обертонов и отсутствие областей резонансного усиления сигнала. При этом ларингоскопическая и стробоскопическая картина могут быть в пределах нормы.

6

Рис. 6 Типичная спектрограмма больного с фонастенией

  Хронический катаральный ларингит

Хронический катаральный ларингит характеризуется наличием стойкой гиперемии, утолщением слизистой оболочки, пастозностью слизистой оболочки голосовых складок, выраженной инъекцией сосудов. При фонации нередко отмечается скопление вязкой слизи в узелковой зоне

При спектральном анализе голоса отмечается невыраженность сигнала основного тона, стертость обертонов и отсутствие областей резонансного усиления, что свидетельствует о нарушении генератоной функции гортани вследствии хронического воспалительного процесса. Отмечалось снижение силы глоса по мере повышения частоты основного тона в области переходного регистра и крайних тонов диапазона. Сила голоса не превышала 80 дБ. Вибрато характеризовалось неустойчивостью, с тенденцией  у тремоляции.

7

 Рис. 7 Типичная спектрограмма больного с хроническим катаральным ларингитом

  Кровоизлияние в голосовую складку

Кровоизлияние в голосовую складку возникает, как правило, при форсированной голосовой нагрузке на фоне воспалительных заболеваний верхних дыхательных путей (ОРВИ, острые ларингиты) или во время месячных у женщин, на фоне повышенного артериального давления. Слизистая оболочка при  этом выглядит отечной, гиперимированной. Нередко отмечаются варикозно измененные сосуды.

На спектрограмме отмечается сужение диапазона голоса, неточное воспроизведение основного тона, неравномерные временные интервалы между пиками обертонов, сужение областей резонансного усиления голоса. Отмечалась тенденция к уменьшению количества формант, значительное снижение силы голоса на всем регистрируемом диапазоне. Сила голоса не превышала 65-70 дБ. Частота вибрато уменьшалась до 3-4 в сек.

8

Рис. 8 Типичная спектрограмма больного с кровоизлиянием в голосовую складку

 Вазомоторный монохордит

Вазомоторный монохордит характеризуется наличием стойкой воспалительной реакции на одной из голосовых складок, отеком свободого края слизистой оболочки голосовой складки, инъекцией сосудов. При фонации нередко фиксируется линейная щель на протяжении всей голосовой щели. Заболевание

При спектральном исследовании голосовой функции установлено сужение голосового поля за счет выпадения тонов верхнего регистра диапазона. На спектрограммах отмечается нестабильность в удержании частоты основного тона, расширение площади пиков обертонов, появление добавочных частотных пиков, нехарактерных для данного типа голоса. Уменьшается сила звука до 75-80 дБ. Вибрато неустойчиво и имеет тенденцию к увеличению частоты (тремоляция).

9

Рис. 9 Типичная спектрограмма больного с вазомоторным монохордитом

Узелки голосовых складок

При спектральном исследовании голоса наблюдалось изменение его диапазона за счет снижения уровня высокой форманты на “piano”. Отмечали также неустойчивость основного тона при фонации на “piano”,  преобладание сигнала обертонов над основным тоном, появление добавочных призвуков, уменьшение количества обертонов и их регулярности. Количество певческих формант не изменялось.

В зависимости от степени выраженности изменений можно определить насколько эффективным будет консервативное лечение, а также корректировать тактику лечения у больных после удаления узелков. 

10

Рис. 10 Типичная спектрограмма больного с узелками голосовых складок

 Большую диагностическую ценность спектральный компьютерный анализ имеет в определении  типа голоса у пациентов, предъявляющих к голосу очень высокие требования, к примеру, у вокалистов.

Установлено, что нередко заболевания голосового аппарата у певцов вызывается не только использованием неправильной вокальной техники, но и исполнением партий, несоответствующих его типу голоса.

Тип голоса (сопрано, меццо-сопрано, баритон и т.д.) определяется его диапазоном, т.е. возможностью вокалиста петь в определенном участке нотного стана (так называемой тесситуре). Также, для каждой разновидности вокального голоса существуют определенные переходные ноты (ноты на которых происходит перестройка механизма звуковедения с одного регистра на другой, например с головного на грудной) и наличием в его голосе определенных наиболее удобных для исполнения тонов, называемых примарными. 

      Наиболее соответствующие типу голоса певца спектрограммы характеризуются четко выраженным сигналом основного тона, регулярностью пиков обертонов, одинаковыми временными интервалами между ними и четко выраженными областями резонансного усиления.  В тесситуре, менее соответствующей типу голоса вокалиста, фиксируется смещение частоты основного тона в сторону его повышения или понижения, нерегулярность пиков обертонов и «размытость» областей резонансного усиления.

 ЗАКЛЮЧЕНИЕ

 Спектральный компьютерный анализ голосовой функции является высокоинформативным методом исследования, позволяющим оценить такие характеристики голоса, как частота основного тона, количество областей резонансного усиления звука (формант), число и регулярность обертонов, частота вибрато.

При обследовании пациентов с применением выше описанной методики возможно выявление, не диагностируемой традиционными методами ранее, патологии: фонастении; нарушение регистров голосоведения, провоцирующее развитие как функциональных, так и органических дисфоний. Также, спектральный анализ голоса является определяющим методом в решении спорных вопросов определения типа голоса у лиц голосо-речевых профессий, предъявляющих высокие требования к качеству голоса (педагоги, переводчики, дикторы, вокалисты).

Следовательно, спектральный компьютерный анализ голоса является объективным, информативным методом оценки голосовой функции. Метод обеспечивает раннюю и дифференциальную диагностику голосовых нарушений,  а также может быть использован при определении тактики лечения у пациентов, как с функциональными, так и с органическими заболеваниями голосового аппарата. Особенно эффективен данный метод у лиц, являющихся представителями голосо-речевых профессий.