АКУСТИЧНИ КАРАКТЕРИСТИКИ НА МАКЕДОНСКИТЕ КОНСОНАНТИ

 

Лидија РИСТОВСКА1, ЗораЈАЧОВА2,

Људмил СПАСОВ3, ТодоркаБАЛОВА4

 
ACOUSTIC CHARACTERISTICS OF MACEDONIAN CONSONANTS
 

Lidija RISTOVSKA1, ZoraJACHOVA2,

Ljudmil SPASOV3TodorkaBALOVA4

 

Вовед

 

Продукцијата на говорот бара прецизна контрола на движењата на вокалниот тракт за да се генерираат говорни звуци (фонеми) коишто се организирани во комплексни секвенци (1). Говорот се карактеризира со брзи промени во артикулацијата и нејзиниот акустичен продукт. Динамиката на говорот претставува голем предизвик за негова ана- лиза (2). Како комплексен звук, говорот може да се анализира во однос на интензитетот и фреквенцијата. Овие акустични карактерис- тики на говорниот звук зависат од полот, фонемата, содржината на конверзацијата и емоцијата (3).

Говорните  звуци,  генерално,  може  да се класифицираат во две широки катего- рии: вокали и консонанти (4). Консонантите се карактеризираат со комплетна или пар- цијална конструкција на вокалниот тракт при продукцијата и високофреквентна енер- гија (5). Тие, генерално, се многу пократки од вокалите и временски поваријабилни (6). Фреквенциите на консонантите може да варираат во зависност од претходните и од следните гласови (коартикулација) и се јаву- ваат разлики помеѓу говорителите, особено во однос на полот (7). Македонските консо- нанти се класифицираат според звучноста, местото на артикулација и начинот на арти- кулација (8). Според начинот на артикула- ција, тие може да се поделат на оклузиви, фрикативи и африкати (9).

Значајна информација за квалитетот на говорот се добива од формата на спектрогра- мот којшто содржи квантитативни податоци за звукот (10). Спектрограмот е спектро-тем- порална претстава на звукот. Хоризонталната насока на спектрограмот го претставува вре- мето, а вертикалната насока ја претставува фреквенцијата (11). Спектрограмите се кла- сифицирани во два главни типа, широкопоја- сен и теснопојасен спектрограм (12).

Спектралните карактеристики на консо- нантите може да се анализираат со одреду- вање на спектралните моменти. Првиотспек- трален момент центар на гравитација (ЦГ) или тежиште е средна вредност на фреквен- циите во спектарот. Тој ја рефлектира цен- тралната концентрација. Вториот спектра- лен момент стандардна  девијација  (СД) или варијанса ја рефлектира  дисперзијата  на фреквенциите во однос на ЦГ. Третиот спектрален момент наклон  на  спектарот  ја рефлектира асиметријата на фреквенци- ите во спектарот. Асиметријата е мерка што укажува како се дистрибуирани фреквенци- ите на спектарот околу средната вредност. Четвртиот   спектрален   момент    куртозис е индикатор за пикот на дистрибуција на фреквенциите во спектарот(13,14).

Спектралните пикови на звучниот спек- тар на вокалите се нарекуваат форманти(15). Формантот е концентрација на акустична енергија околу одредена фреквенција на звучниот бран и тој е темен појас на широ- копојасниот спектрограм, што кореспон- дира со резонанцијата на вокалниот тракт. Формантите се означени како  F1,  F2,  F3,  F4 итн. почнувајќи со најниската фреквен- ција (10). Звучните консонанти, како наза- лите и латералите, исто така имаат специ- фични форми на вокалниот тракт коишто се карактеризираат со фреквенциите на фор- мантите. Тие се разликуваат од вокалите во нивната продукција, но можат да бидат спе- цифицирани во однос на нивните фреквен- ции на форманти (16).

Целта на студијата беше да се анализи- раат спектралните карактеристики на маке- донските консонанти, односно да секалкули- раат спектралните моменти: ЦГ, СД, наклон на спектарот и куртозис, како и фреквенци- ите на формантите од F1 до F5 и основната фреквенција(Fo)наназалитеилатералитево компјутерската програмаPraat.

 

Материјал и методи

 

Оваа студија вклучува 15 изворни гово- рители на македонски јазик, пет мажи, пет жени, на возраст од 26 до 50 години (средна возраст 38,9±9,6 години) и пет деца, двемом- чиња и три девојчиња, на возраст од 9 до 14 години (средна возраст 10,6±1,9 години). Тие беа снимени при изговарање на македон- ските консонанти како изолирани фонеми. Акустичната анализа е изведена во компју- терската програма Praat, Верзија 6.0.43 (17). MP3 монозвучните фајлови на снимените консонанти беа прво отворени во Praat за да се сегментира и меморира консонантот како WAV фајл. Ги пресметавме спектралните моменти на консонантите: ЦГ, СД, наклон на спектарот и куртозис како и фреквенциитена формантите од F1 до F5 и Fo на назалите и латералите.

Параметрите за анализа ги  поставивме на следниот начин: Максимален број на фор- манти: 5 и Максимум формант (Hz): 5000 Hzзамажите,5500Hzзаженитеи8000Hzза децата. Вредноста во Поставување на спек- трограм: Преглед на опсег (Hz) беше иста како вредноста во Максимум формант(Hz).

Резултати

 

Анализирани се вкупно 390 WAV фајлови на снимени консонанти. Во македонскиот јазик има 26 консонанти. Во табелите ги прикажавме македонските консонанти и нивната транскрипција во симболите на Меѓународната фонетска азбука (МФА), а во текстот ги користевме македонските фонеми со МФА симболи во загради. Средната вред- ност на спектралните моменти беше кал- кулирана одделно за сите три групи: мажи, жени и деца.

Во Табела 1 ја прикажавме средната вредност на спектралните моменти кај пло- зивите: /б/ (b), /г/ (ɡ), /д/ (d), /к/ (k), /п/ (p) и

/т/(t).Кајситеплозиви,среднатавредностна тежиштето беше во опсег од 456 до 557 Hz кај мажите, 601 Hz до 773 Hz кај жените и 673 Hz до 788 Hz кај децата. Средната вред- ност на СД беше во опсег од 479 Hz до 727 Hz кај мажите, 632 Hz до 999 Hz кај жените и 363 Hz до 985 Hz кај децата. Сите говори- тели имаа позитивни вредности на наклон на спектарот икуртозис.

 

Introduction

 

Speech production requires a precise con- trol of vocal tract movements to generatespeech sounds (phonemes) which are organized into complex sequences (1). Speech is characterized by rapid changes in articulation and its acous- tic product. The dynamics of speech poses great challenges to its analysis (2). As a complex sound, speech can be analyzed by the intensity andfrequency.Theseacousticfeaturesofspeech sound depend on gender, phoneme, content of conversation, and emotion (3).

Speech sounds can generally be classified into two broad categories: vowels and con- sonants (4). Consonants are characterized by complete  or  partial  vocal  tract  constriction  in production and high frequency energy (5). They are generally much shorter than vowels and more variable overtime (6). Consonant frequencies can vary depending on the preceding and following sounds (coarticulation) and dif- ferences occur across talkers, especially across gender (7). Macedonian consonants are clas- sified according to the voicing, the place of articulation, and the manner of articulation (8). According to the manner of articulation, they can be divided into occlusives, fricatives, and affricates (9).

Significant information about the quality of speech is provided by the shape of the spectro- gram that contains quantitative data of a sound (10).Thespectrogramisaspectro-temporalrep- resentation of the sound. The horizontal direc- tion of the spectrogram represents time, and the vertical direction represents frequency (11). The spectrogramsareclassifiedintotwomajortypes, widebandandnarrowbandspectrogram(12).

Spectral characteristics of consonants canbe analyzed by determining the spectral moments. The first spectral moment center of gravity (COG) or centroid is a mean of frequencies in the spectrum. It reflects central concentration. The second spectral moment standard deviation (SD) or variance reflects the dispersion of fre- quencies in relation to the COG. The third spec- tral moment skewness reflects asymmetry of the frequencies in the spectrum. The asymmetry is  a measure that indicates how the frequencies of the spectrum are distributed arround the mean. The fourth spectral moment kurtosis is an indi- cator of the peak of the frequency distribution in the spectrum(13,14).

The spectral peaks of the sound spectrumof

thevowelsarecalledformants(15).Aformantis a concentration of acoustic energy around a par- ticular frequency in the speech wave, and that  is the dark band on a wideband spectrogram, which corresponds to a vocal tract resonance. The formants are labeled as F1, F2, F3, F4 etc. starting with the lowest frequency (10). Voiced consonants such as nasals and laterals also have specific vocal tract shapes that are characterized by the frequencies of the formants. They differ from vowels in their production, but they can be specified in terms of their formant frequencies (16).

The objective of the study was to analyze spectral characteristics of Macedonian conso- nants, i.e. to calculate the spectral moments: COG, SD, skewness and kurtosis, as well as, formant frequencies from F1 to F5 and funda- mental frequency (Fo) of nasals and laterals in computer program Praat.

 

Material and methods

This study included 15 native speakers of Macedonian, five males, five females, aged 26 to 50 years (mean age of 38.9±9.6 years), and five children, two boys and three girls, aged 9  to 14 years (mean age of 10.6±1.9 years). They were recorded saying the Macedonian conso- nants as isolated phonemes. The acoustic anal- ysis was performed in computer program Praat, Version 6.0.43 (17). MP3 mono sound files of the recorded consonants were first opened in Praat to segment and save the consonant as a WAV file. We calculated the spectral moments of the consonants: COG, SD, skewness and kur- tosis, as well as, formant frequencies from F1 to F5 and Fo of nasals andlaterals.

We set the analysis parameters in the fol-

lowing way: Maximum number of formants: 5 and Maximum formant (Hz): 5000 Hz for males, 5500 Hz for females and 8000 Hz for children. The value in Spectrogram settings: View range (Hz) was the same as the value in Maximum for- mant (Hz).

Results

A total of 390 WAV files of recorded con- sonants were analyzed. There are 26 conso- nants in Macedonian. In the tables we displayed Macedonian consonants and their transcription into International Phonetic Alphabet (IPA) sym- bols, and in the text we used Macedonian pho- nemes with IPA symbols in parentheses. Mean spectral moments were calculated separately for all three groups: males, females and children.

In Table 1 we displayed mean spectral moments in plosives: /б/ (b), /г/ (ɡ), /д/ (d),

/к/ (k), /п/ (p), and /т/ (t). In all plosives, mean COG was in the range from 456 to 557 Hz in males, 601 Hz to 773 Hz in females, and 673  Hz to 788 Hz in children. Mean SD was in the range from 479 Hz to 727 Hz in males, 632 Hz to 999 Hz in females, and 363 Hz to 985 Hz in children. All speakers had positive skewness and kurtosis values.

     
     

куртозис 75,9. На спектрограмот има кон- центрација на акустична енергија во ниските фреквенции.

ВоТабела2јаприкажавмесреднатавред- ност на спектралните моменти кај фрикати- вите: /в/ (v), /ж/ (ʒ), /з/ (z), /ј/ (j), /р/ (r), /с/(s),

/ф/ (f), /х/ (h) и /ш/ (ʃ). Кај сите фрикативи, средната вредност на тежиштето беше во опсег од 491 до 2207 Hz кај мажите, 529 Hz до 2842 Hz кај жените и 590 Hz до 4021 Hz кај децата. Средната вредност на СД бешево

 

In Table 2 we displayed mean spectral moments in fricatives: /в/ (v), /ж/ (ʒ), /з/ (z), /ј/ (j), /р/ (r), /с/ (s), /ф/ (f), /х/ (h), and /ш/ (ʃ). In all fricatives, mean COG was in the range from 491 to 2207 Hz in males, 529 Hz to 2842 Hz    in females, and 590 Hz to 4021 Hz in children. Mean SD was in the range from 504 Hz to 2421 Hz in males, 672 Hz to 3076 Hz in females, and 533 Hz to 3108 Hz inchildren.

 

опсег од 504 Hz до 2421 Hz кај мажите, 672 Hz до 3076 Hz кај жените и 533 Hz до 3108 Hz кај децата.

Средната вредност на наклонот на спек- тарот беше позитивна кај сите фрикативи, но еден машки говорител и две жени имаа нега- тивен наклон на спектарот на фрикативот/ш/ (ʃ) и две деца имаа негативен наклон наспек- таротнафрикативот/с/(s).Еденмашкигово- рител имаше наклон на спектарот нула на фрикативот /с/ (s) и една жена имаше наклон на спектарот нула на фрикативот /ш/(ʃ).

Средната вредност накуртозисбеше позитивна кај сите фрикативи,освенкај фрикативот /ш/ (ʃ) кајжените.Поединечно прикажано, најдовме негативенкуртозиснафрикативот ж/ (ʒ) кај еденмашкиговорител итриженскиговорители,негативенкуртозис на фрикативот /з/ (z) кај еднодете,негати- венкуртозиснафрикативотс/(s)кајтројца машки говорители и две децаинегативен куртозиснафрикативотш/(ʃ)кајтројца машки говорители, четири жени иеднодете. ВоТабела3јаприкажавмесреднатавред- ност на спектралните моментикајафрика- тите:/ѓ/(ɟ),/ѕ/(ʣ),/ќ/(c),/ц/(ʦ),/ч/(ʧ)и/џ/ (ʤ). Кај сите африкати,среднатавредност на тежиштето беше во опсег од 496до1741 Hz кај мажите, 881 Hz до 2041 Hzкајжените и 690 Hz до 2208 Hz кај децата.Средната

 

Mean skewness was positive in all frica- tives, but one male speaker and two females had negative skewness of the fricative /ш/ (ʃ), and two children had negative skewness of the frica- tive /с/ (s). One male speaker had skewnesszero of the fricative /с/ (s), and one female had skew- ness zero of the fricative /ш/ (ʃ).

Mean kurtosis was positive in all fricatives, except in fricative /ш/ (ʃ) in females. Separately displayed, we found negative kurtosis of the fricative ж/ (ʒ) in one male and three female  speakers, negative kurtosis of the fricative /з/(z) in one child, negative kurtosis of the fricativeс/

(s) in three male speakers and two children, and negative kurtosis of the fricative ш/ (ʃ) in two male speakers, four females and one child.

In Table 3 we displayed mean spectral moments in affricates: /ѓ/ (ɟ), /ѕ/ (ʣ), /ќ/ (c), /ц/ (ʦ), /ч/ (ʧ), and /џ/ (ʤ). In all affricates, mean COG was in the range from 496 to 1741 Hz in males, 881 Hz to 2041 Hz in females, and 690 Hz to 2208 Hz in children. Mean SD was in the range from 667 Hz to 1986 Hz in males, 1262 Hz to 2288 Hz in females, and 826 Hz to 2511 Hz in children.

 

вредност на СД беше во опсег од 667 Hz до 1986 Hz кај мажите, 1262 Hz до 2288 Hz кај жените и 826 Hz до 2511 Hz кај децата.

Средната вредност на наклонот на спектарот беше позитивна кај сите афри- кати. Средната вредност на куртозис беше исто така позитивна кај сите африкати, но најдовме негативен куртозис наафрикатот

/ц/ (ʦ) кај тројца машки говорители и едно дете, негативен куртозис на африкатот  /ч/ (ʧ) кај двајца машки говорители и три жени, како и негативен куртозис на африкатот /џ/ (ʤ) кај еден машки говорител и три женски говорители.

 

Mean skewness was positive in all affri- cates. Mean kurtosis was also positive in all affricates, but we found negative kurtosis of the affricate /ц/ (ʦ) in three male speakers, and one child, negative kurtosis of the affricate /ч/ (ʧ) in two male speakers and three females, and nega- tive kurtosis of the affricate /џ/ (ʤ) in one male and three female speakers.

 

In Table 4 we displayed mean spectral moments in nasals: /м/ (m), /н/ (n), and /њ/ (ɲ).

 

 

ВоТабела4јаприкажавмесреднатавред- ностнаспектралнитемоментикајназалите:

/м/ (m), /н/ (n) и /њ/ (ɲ).

Кај сите назали, средната вредност на тежиштето беше во опсег од 428 до 471 Hz кај мажите, 479 Hz до 564 Hz кај жените и 529 Hz до 587 Hz кај децата. Средната вред- ност на СД беше во опсег од 532 Hz до 651 Hz кај мажите, 605 Hz до 708 Hz кај жените и 614 Hz до 658 Hz кај децата. Сите говори- тели имаа позитивни вредности на наклон на спектарот икуртозис.

ВоТабела5јаприкажавмесреднатавред- ност на спектралните моменти кај латера- лите: /л/ (l) и /љ/ (ʎ). Средната вредност на тежиштето беше во опсег од 480 до 526 Hz кај мажите, 606 Hz до 631 Hz кај жените и 547 Hz до 621 Hz кај децата. Средната вред- ност на СД беше во опсег од 549 Hz до 591 Hz кај мажите,689Hzдо871Hz кај жените

 

In all nasals, mean COG was in the range from 428 to 471 Hz in males, 479 Hz to 564 Hz in females, and 529 Hz to 587 Hz in children. Mean SD was in the range from 532 Hz to 651 Hz in males, 605 Hz to 708 Hz in females, and 614 Hz to 658 Hz in children. All speakers had positive skewness and kurtosis values.

In Table 5 we displayed mean spectral moments in laterals: /л/ (l) and /љ/ (ʎ). Mean COG was in the range from 480 to 526 Hz in males, 606 Hz to 631 Hz in females, and 547 Hz to 621 Hz in children. Mean SD was in the range from 549 Hz to 591 Hz in males, 689 Hz to 871 Hz in females, and 458 Hz to 598 Hz in children. All speakers had positive skewness and kurtosis values.

 

и 458 Hz до 598 Hz кај децата. Сите говори- тели имаа позитивни вредности на наклон на спектарот и куртозис.

Во табела 6 ги прикажавме Fo и фреквен- циите на формантите од F1 до F5 на назалите и латералите. Средната вредност на Fo кај назалите беше во опсег од 102 Hz кај мажите

 

In Table 6 we displayed Fo and formant fre- quencies from F1 to F5 of the nasals and later- als.MeanFoinnasalswasintherangefrom102 Hz in males to 252 Hz in children, and mean Fo in laterals was in the range from 99 Hz in males to 245 Hz inchildren.

 

до 252 Hz кај децата, а средната вредност на Fo кај латералите беше во опсег од 99 Hz кај мажите до 245 Hz кај децата.

Во однос на средната вредност на фреквенциите на формантите, кај назалите, F1 беше во опсег од 420 Hz кај мажите до 758 кај децата. Најниската фреквенција на F2 беше1293кајмажитеинајвисокатафреквен- ција беше 2216 кај децата. F3 беше во опсег од 2433 Hz кај мажите до 4067 кај децата. F4 беше во опсег од 3395 Hz кај мажите до 5518 кај децата. F5 беше во опсег од 4488 Hz кај мажите до 6627 кајдецата.

Кај латералите, F1 беше во опсег од 392 Hz кај мажите до 683 кај децата. Најниската фреквенција на F2  беше  1073  кај  мажите  и највисоката фреквенција беше 2321 кај децата. F3 беше во опсег од 2530 Hz кај мажите до 4143 кај децата. F4 беше во опсег од 3397 Hz кај мажите до 5334 кај децата.F5 беше во опсег од 4496 Hz кај мажите до 6654 каj децата.

 

Дискусија

 

Ги анализиравме спектралните карак- теристики на македонските консонанти. Спектралните моменти кај сите консонанти, Fo и фреквенциите на формантите на наза- лите и латералите беа калкулирани во Praat. Praat е компјутерска програма за анализи- рање, синтетизирање и манипулирање со говор(18).

Тежиштето кај плозивите во нашата сту- дија беше во опсег на ниските фреквенции. Ние анализиравме изолирани фонеми. Тие не беа во контекст на вокали. Плозивите се продуцираат со запирање на протокот навоз- дух во вокалниот тракт, или на почетокотили на крајот на слогот (19). Botinis и сор. ја ана- лизирале акустичната структура на грчките плозиви во вокален контекст /o/. Безвучните алвеоларни плозиви покажале спектрален пик во фреквентниот опсег помеѓу 3000 Hz  и 4000 Hz. Звучните алвеоларни плозиви покажале пик во фреквентниот опсег помеѓу 2500 Hz и 4000 Hz. Безвучните веларни пло- зивипокажалееденпикоколу2000Hzиеден околу 4000 Hz. Звучните веларни плозиви покажале пик на 1000 Hz и 4000 Hz. (20). Холандските плозиви /t/ и /d/ биле испи- тувани во иницијална позиција во зборот. Тежиштето кај /t/ било 5038 Hz и кај /d/ било 4933 Hz (21). Овие вредности на тежиштето се многу повисоки од фреквенциите коишто се измерени во нашата студија кај изолирани фонеми.

Lousada и сор. снимиле корпус на европ- ски португалски реални зборови коишто содржеле шест плозиви  /p/,  /b/,  /t/,  /d/,  /k/ и /g/ во иницијална, медијална и финална позиција. Плозивот /p/ покажал  вредности на наклон на спектарот блиски до нула или позитивни вредности, што сугерира пози- тивна асиметриска дистрибуција, така што највисоките вредности на спектрална ампли- туда  биле  лево  концентрирани.  Спротивно,

/t/ обично покажувал вредности на наклон  на спектарот блиски до нула или негативни вредности, укажувајќи на високи  вредности

на спектрална амплитуда концентрирани кон десно. Плозивот /k/ имал негативни вредно- сти на наклон на спектарот кај најголем број говорители и /p/ имал позитивни вредно-  сти на наклон на спектарот (22). Во нашата студија сите плозиви имаа позитивна вред- ност на наклон  на  спектарот,  укажувајќи  на концентрација на енергија во ниските фреквенции.

Нашатаанализанаспектралнитемоменти кај фрикативите покажа највисока средна вредност на тежиште 4021 Hz кај фрика- тивот /с/ (s) изговорен од децата. Gordon и сор. прикажале просечни центри на грави- тација за /f/ 4562 Hz, за /s/ 5163 Hz и за /ʃ/ 4679 Hz кај Чикасо говорители. Фрикативите во нивната студија се појавувале во непо- средна близина на вокалот /a/ иливокалот

/i/ (23). Фрикативите /z/ и /s/ имаат енергија во фреквентниот регион од 3500 до 8000 Hz. Консонантите /h/ и /f/ имаат помалку енер- гија од останатите фрикативи (24).

Punišić и сор. ја одредиле средната вред- ност на пикот на првата концентрација на акустичнаенергијакајфрикативот/ʃ/на2800 Hz и втората концентрација на 5600 Hz (25). Според Gudurić и Petrović звучната енергија на српскиот консонант /f/ е во опсег од 400 Hz до 7000 Hz со силна концентрација на енергија над 1500 Hz, додека /h/ има концен- трација на акустична енергија во неколку појаси, почнувајќи од 140 Hz до 4800 Hz (26). Безвучните фрикативи /s/ и /ʃ/ имаат поголема енергија, со тоа што /s/ е повеќе во опсегот на високи фреквенции од околу 3500 Hz и повисоко, а /ʃ/ има најмногу енергија нешто пониско, околу 3000 Hz (27). Ние исто така измеривме пониска средна вредност на тежиштето кај фрикативот /ш/ (ʃ) во опсег од 1606 Hz до 2842Hz.

Според Maniwa и  Jongman,  безвуч-  ните фрикативи се карактеризираат со повисоки вредности на спектрално тежиште и пик, повеќе дефинирани пикови, помала варијанса, негативен  наклон  на  спекта-  рот, поголема вкупна амплитуда и подолго траење во споредба со нивните звучни пар- ници (28). Ferreira-Silva и сор. ги анализи- рале спектралните моменти кај бразилските португалски фрикативи. Средните вредности на тежиштето на лабиоденталните,алвеолар- ните и посталвеоларните фрикативи во кон- текст на /a/, /i/ и /u/ биле 5003 Hz, 7417 Hz    и 4608 Hz. Средните вредности на варијан- сата биле 2862,8 Hz, 1952,8 Hz и 1850,8 Hz. Средните вредности на асиметријата биле 0,25, -0,39 и 0,88. Средните вредности на

куртозис биле 0,74, 2,76 и 1,85 (13). Само  пет говорители во нашата студија имаа нега- тивен наклон на спектарот на фрикативите. Тоа укажува на концентрација на енергија во високитефреквенции.

Tabain го пресметала тежиштето на неколку консонанти земени од консонант-во- кал (КВ), слогови изговорени од женски говорители на австралиски англиски јазик. Средната вредност на тежиштето на /s/ била 6582Hz,на/ʃ/5323Hz,на/z/5885Hzина

/ʒ/ 4521 Hz (29). Корејскиот фрикатив /s/ е испитуванвоконтекстнавокалите/i/,/a/и

/u/. Средната вредност на тежиштето била 6133,9 Hz и 7280,2 Hz кај мажите и 8248,6Hz и8321,2Hzкајжените.Среднатавредностна наклонот на спектарот била 0,37 and 0,08 кај мажите и -0,44 и -0,31 кај жените (30). При анализата на фрикативите, ние измеривме наклон на спектарот еднаков на нула кај двајца говорители. Тоа укажува дека дист- рибуцијата на фреквенциите околу средната фреквенција е симетрична.

Koenig и сор. ги измериле спектралните моменти на англискиот фрикатив /s/ во збо- рови изговорени од адолесценти. Средната вредност на тежиштето била во опсег од 4433 Hz до 7643 Hz. Средната вредност на СД била во опсег од 1492 Hz до 2092 Hz. Средната вредност на наклонот на спектарот била во опсег од -0,102 до 0,926 и средната вредностнакуртозисбилапозитивнакајсите говорители, во опсег од 0,184 до 3,389 (31). Jongman и сор. ги анализирале англиските фрикативи и прикажале повисокоспектрално тежиштеза/s/и/z/(6133Hz)ипонискоза

/ʃ/ и /ʒ/ (4229 Hz). Наклонот наспектаротбил повисоккај/ʃ/и/ʒ/,укажувајќидекапала- то-алвеоларите имаат најсилна концентра-ција на енергија во нискитефреквенции(32). Vujasić ги анализиралахрватскителинг- валнифрикативи/s/,/ʃ/,/z/и/ʒ/вологатоми соКВКВструктура.Таа прикажала највисока  просечна вредност на тежиште за /s/ 8641 Hz и највисока просечна вредност на СД за /z/ 3130 Hz. Просечната вредност на наклонот на спектарот била позитивна за /ʃ/ и /ʒ/, и негативна за /s/ и /z/. Просечната вредностна куртозис била позитивна за сите фрикативи (33).

Во нашата студија, најголем број гово- рители имаа позитивен куртозис кај фрика- тивите. Тоа значи релативно високи пикови во спектарот. Средната вредност на кур- тозис  беше  негативна  само  кајфрикативот

/ш/ (ʃ) изговорен одженскитеговорители. Негативниот куртозис укажувадекадистри- буцијата има повеќе зарамнетипиковиилиспектар без добро дефиниранипикови.Прианализата на африкатите, истотакаизме- ривме позитивна средна вредностнанаклонна спектарот и куртозис кајситеговорители. Нашата спектрална анализананазалитепокажа средна вредност натежиштетово нискитефреквенциизаситеговорители.За консонантот /m/, Tabain исор.прикажалетежиште 2657 Hz и СД 1139 Hz.Законсонан- тот/n/тежиштетобило2708Hz,аСДбила

1130 Hz (34).

Ние ги измеривме првиот и вториотспек- трален момент кај латералите во опсегот на ниските фреквенции. Tabain и сор. измериле тежиште 2704 Hz и СД 1100 Hz налатералот

/l/ во поединечни зборови (35).

Вредностите на првиот и вториот спек- трален момент прикажани од други автори коишто ги анализирале консонантите во вокален контекст беа повисоки од вредно- стите добиени во нашата студија. Ние ги анализиравме консонантите како изолирани фонеми и го избегнавме ефектот на коарти- кулација. Тоа е феномен кај кој една фонема влијае на продукцијата на претходната и следната фонема. Артикулаторните движења при продукција на одредена фонема ја мену- ваат артикулацијата на соседните фонеми.

Ги измеривме Fo и фреквенциите на формантите од F1 до F5 кај назалите и лате- ралите. За продукција на назалните консо- нанти протокот на воздух во устата е вре- мено запрен. Мекото непце е спуштено така што воздухот може да излезе единствено преку носната празнина. Назалите бараат користење на две резонантни празнини, усна и носна, коишто се комбинирани на ком- плексен начин (36).

Tabain и сор. ги измериле назалните фор- манти на назалот /m/ N1 308 Hz, N2 1402 Hz, N32603HzиN43726Hz(34).Кајлатералите, Tabain и сор. ги добиле следните фреквенции на формантите: F1 374 Hz, F2 1619 Hz, F3 2839 Hz и F4 3804 Hz за алвеоларниот лате- рал /l/ и F1 339 Hz, F2 2104 Hz, F3 2896 Hz и F4 3998 Hz за палаталниот латерал /ʎ/ (35). Rodrigues и сор. ги измериле фреквенциите на формантите на првиот, вториот и третиот формант на латералот /l/ во вокаленконтекст. Средната вредност на F1 била во опсег од 377,79 Hz до 554,77 Hz, средната вредностна F2 was била во опсег од 947,70 Hz до 1108,67 Hz и средната вредност на F3 била во опсег од 2831,37 Hz до 3147,89 Hz (37). Овие вред- ности се слични на вредностите добиени во нашата студија.

Kostić ја испитувал акустичната струк- тура на српските консонанти. За назалите

/m/ и /n/ тој ја одредил првата концентра- ција на акустична енергија на околу 500 Hz, втората концентрација била од 1000 Hz до 1200 Hz и третата концентрација од 2200 до 2500 Hz. За назалот /ɲ/ првата концентрација на акустична енергија била на ниво околу 500 Hz, втората концентрација била од 600 Hz до 1000 Hz и третата концентрација на акустична енергија била во опсегот од 2700 до 3000 Hz (38). Овие наоди се слични на фреквенциите на првиот, вториот и третиот формант добиени за назалите кај машките говорители во нашатастудија.

Заклучок

 

Центарот на гравитација и  спектрал- ната стандардна девијација кај консонан- тите анализирани како  изолирани  фонеми се пониски од вредностите добиени во кон- текст на вокали заради ефектот на коарти- кулацијата во која една фонема влијае на продукцијата на претходната и на следната фонема. Наклонот на спектарот и куртозис се позитивни кај најголем број говорители што укажува на концентрација на енергија во ниските фреквенции и релативно високи пикови во спектарот. Највисоката средна вредност на Fo и фреквенциите на форман- тите на назалите и латералите се измерени кај децата.

 

 

In terms of the mean formant frequencies, in nasalsF1wasintherangefrom420Hzinmales to 758 in children. The lowest frequency of F2 was 1293 in males and the highest frequency was 2216 in children. F3 was in the range from 2433 Hz in males to 4067 in children. F4 was  in the range from 3395 Hz in males to 5518 in children. F5 was in the range from 4488 Hz in males to 6627 in children.

In laterals F1 was in the range from 392   Hz in males to 683 in children. The lowest fre- quency of F2 was 1073 in males and the high- est frequency was 2321 in children. F3 was in the range from 2530 Hz in males to 4143 in children. F4 was in the range from 3397 Hz in males to 5334 in children. F5 was in the range from 4496 Hz in males to 6654 in children.

 

Discussion

We analyzed spectral characteristics of Macedonian  consonants.  Spectral   moments  in all consonants, Fo and formant frequencies  of nasals and laterals were calculated in Praat. Praat is a computer program for analyzing, syn- thesizing, and manipulating speech(18).

COGinplosivesinourstudywasinlow-fre- quency range. We analyzed isolated phonemes. They were not in vowel context. Plosives are producedbystoppingtheflowofairinthevocal tract, either at the beginning or end of a syllable (19). Botinis et al. analyzed acoustic structure of the Greek plosives in the vocalic context /o/. The voiceless alveolar plosives showed a spec- tral peak in the frequency range between 3000 Hz and 4000 Hz. The voiced alveolar plosives showed a peak in the frequency range between 2500 Hz and 4000 Hz. The voiceless velar plo- sives showed one peak around 2000 Hz  and one around 4000 Hz. The voiced velar plosives showed a peak at 1000 Hz and 4000 Hz. (20). Dutch plosives /t/ and /d/ were examined in word-initial position. COG in /t/ was 5038 Hz and in /d/ was 4933 Hz (21). These COG values are much higher than frequencies measured in our study in isolatedphonemes.

Lousadaetal.recordedacorpusofEuropean

Portuguese real words containing the six plo- sives /p/, /b/, /t/, /d/, /k/, and /g/ in initial,medial and final position. Plosive /p/ presented values of skewness close to zero, or positive values, which suggested positive asymetric distribution, so the highest spectral amplitude values were left-concentrated. In contrast, /t/ usually exhib- ited skewness values close to zero or negative values indicating high spectral amplitude values concentrated to the right. Plosive /k/ had negative values of skewness in most speakers and

/p/ had positive values of skewness (22). In our study all plosives had positive skewness values indicating concentration of energy in the low frequencies.

Our analysis of spectral moments in frica- tives showed the highest mean COG 4021 Hz  in fricative /с/ (s) produced by children. Gordon et al. reported average gravity centers for /f/ 4562 Hz, for /s/ 5163 Hz, and for /ʃ/ 4679 Hz  in Chickasaw speakers. The fricatives in their study occurred adjacent to the vowel /a/ or vowel /i/ (23). Fricatives /z/ and /s/ have energy in the frequency region of 3500 through 8000 Hz. The consonants /h/ and /f/ have less energy than the rest of the fricatives (24).

Punišić et al. determined mean peak of the first concentration of acoustic energy in the fricative /ʃ/ at 2800 Hz and the second concen- tration at 5600 Hz (25). According to Gudurić and Petrović the sound energy of Serbian con- sonant /f/ ranges from 400 Hz to 7000 Hz with strong concentration of energy above 1500 Hz, whereas /h/ has concentration of acousticenergy in several bandwidths starting from 140 Hz to 4800 Hz (26). Voiceless fricatives /s/ and /ʃ/ have greater energy, with /s/ being mostly in  the high frequency range from about 3500 Hz upwards, and /ʃ/ having most energy somewhat lower, around 3000 Hz (27). We also measured lower mean COG in the fricative /ш/ (ʃ) ranging from 1606 Hz to 2842Hz.

AccordingtoManiwaandJongmanvoice-

less fricatives are characterized by higher spec- tral mean and peak values, more defined peaks, less variance, negative skewness, larger overall amplitude, and longer duration compared to their voiced counterparts  (28).  Ferreira-Silva  et al. analyzed spectral moments in Brazilian Portuguese fricatives. Mean values of the cen- troid of labiodental, alveolar and postalveolar fricatives in the context of /a/, /i/ and /u/ were 5003 Hz, 7417 Hz and 4608 Hz. Mean values of variance were 2862.8 Hz, 1952.8 Hz and 1850.8  Hz. Mean values of asymmetry were 0.25,

-0.39 and 0.88. Mean values of kurtosis were 0.74, 2.76 and 1.85 (13). Only five speakers in our study had negative skewness of fricatives.  It indicates concentration of energy in the high frequencies.

Tabain computed COG of several conso- nants taken from CV syllables produced by female speakers of Australian English. Mean COG of /s/ was 6582 Hz, of /ʃ/ 5323 Hz, of /z/ 5885 Hz, and of /ʒ/ 4521 Hz (29). Korean fric- ative /s/ was examined in vowel context /i/, /a/ and /u/. Mean COG was 6133.9 Hz and 7280.2 Hz in males and 8248.6 Hz and 8321.2 Hz in females. Mean skewness was 0.37 and 0.08 in males and -0.44 and -0.31 in females (30). In fricative analysis we measured skewness equal tozerointwospeakers.Itindicatesthatdistribu- tion of frequencies around the mean frequency issymmetrical.

Koenig et al. measured spectral momentsof

English fricative /s/ in words produced by ado- lescents.MeanCOGwasintherangefrom4433 Hz to 7643 Hz. Mean SD was in the range from 1492 Hz to 2092 Hz. Mean skewness ranged from -0.102 to 0.926, and mean kurtosis was positiveinallspeakers,rangingfrom0.184to

3.389 (31). Jongman et al. analyzed English fricatives and reported highest spectral  mean for/s/and/z/(6133Hz)andlowestfor/ʃ/and

/ʒ/ (4229 Hz). Skewness was highest for /ʃ/  and

/ʒ/, indicating that the palato-alveolars had the strongest concentration of energy in the lower frequencies (32).

Vujasić analyzed Croatian lingualfricatives

/s/,/ʃ/,/z/and/ʒ/inlogatomeswithCVCVstruc- ture.Shere ported the highest average COGvalue for/s/8641Hz,and the highest average SDfor

/z/ 3130 Hz. Average skewness was positivefor

/ʃ/ and /ʒ/, and negative for /s/ and /z/. Average kurtosis was positive for all fricatives (33).  In our study, most of the speakers had pos- itive kurtosis in fricatives. It means relatively high peaks in the spectrum. Mean kurtosis was negative only in fricative /ш/ (ʃ) produced by female speakers. Negative kurtosis indicates that the distribution has more flattened peaks, or a spectrum without well-defined peaks. In affri- cate analysis we also measured positive mean skewness and kurtosis in allspeakers.

Our spectral analysis of nasals showedmean COGinlowfrequenciesforallspeakers.Forthe consonant /m/ Tabain et al. reported CoG 2657 Hz, and SD 1139 Hz. For the consonant /n/ CoG was 2708 Hz, and SD was 1130 Hz(34).

We measured first and second spectral moment in laterals in low-frequency range. Tabain et al. measured COG 2704 Hz and SD 1100 Hz of the lateral /l/ in single words (35).

First and second spectral moment values reported from other authors who analyzed the consonants in vowel context were higher than val- ues obtained in our study. We analyzed the conso- nants as isolated phonemes and avoided the effect ofcoarticulation.Itisaphenomenoninwhichone phoneme affects the production of preceding and upcoming phoneme. The articulatory movements inproductionofcertainphonemechangetheartic- ulation of neighbouringphonemes.

We measured Fo and formant frequencies from F1 to F5 in nasals and laterals. For the pro- duction of nasal consonants the oral airflow is temporally blocked. The velum is lowered such that air can escape only through the nasal cavity. Nasals require the use of two resonancecavities, oral and nasal, which are combined in a com- plex way(36).

Tabain et al. measured nasal formants of the nasal /m/ N1 308 Hz, N2 1402 Hz, N3 2603 Hz, and N4 3726 Hz (34). In laterals Tabain et al. obtained the following formant frequencies: F1 374 Hz, F2 1619 Hz, F3 2839 Hz, and F4 3804 Hz for the alveolar lateral /l/, and F1 339 Hz,  F22104Hz,F32896Hz,andF43998Hzfor

the palatal lateral /ʎ/ (35). Rodrigues et al. mea- sured first, second and third formantfrequencies of the lateral /l/ in vowel context. Mean F1 was in the range from 377.79 Hz to 554.77 Hz,mean F2 was in the range from 947.70 Hz to 1108.67 Hz, and mean F3 was in the range from 2831.37 Hz to 3147.89 Hz (37). These values are similar to values obtained in our study.

Kostić examined the acoustic structure of theSerbianconsonants.Forthenasals/m/and

/n/ he determined first concentration of acoustic energy at about 500 Hz, second concentration wasfrom1000Hzto1200Hz,andthirdconcen- tration from 2200 to 2500 Hz. For the nasal /ɲ/ first concentration of acoustic energy was at the levelofabout500Hz,secondconcentrationwas from600Hzto1000Hz,andthirdconcentration ofacousticenergywasintherangefrom2700to 3000 Hz (38). These findings are similar to first, second and third formant frequencies obtained for nasals in male speakers in ourstudy.

Conclusion

Center of gravity and spectral standard devi- ation in consonants analyzed as isolated pho- nemes are lower than values obtained in vowel context because of the effect of coarticulation  in which one phoneme affects the production of preceding and upcoming phoneme. Skewness and kurtosis are positive in most speakers indi- cating concentration of energy in the low fre- quencies and relatively high peaks in the spec- trum. The highest mean Fo and formant fre- quencies of nasals and laterals are measured in children.

 

Референци/References

 

 

1.      Bouchard KE, Chang EF. Control of spoken vowel acoustics and the influence of phonetic context in human speech sensorimotor cortex. The Journal of Neuroscience. 2014;34(38):12662-12677.

2.      Kent RD, Vorperian HK. Static measurements of vowel formant frequencies and bandwidths: A review. Journal of Communication Disorders. 2018; 74: 74-97.

3.      Kim C, Lee S, Jin I, Kim J. Acoustic features and cortical auditory evoked potentials according to emotional statues of /u/, /a/, /i/ vowels. Journal of Audiology and Otology. 2018; 22(2):80-88.

4.      Li  N,  Loizou   PC.   The   contribution   of obstruent consonants and acoustic landmarks to speech recognition in noise. The Journal of the Acoustical Society of America. 2008; 124(6):3947-3958.

5.      Chen F, Wong LLN, Wong EYW. Assessing  the  perceptual  contributions  of vowels and consonants to Mandarin sentence intelligibility. Journal of the Acoustical Society of America. 2013; 134(2): EL178-184.

6.      Konan H, Asseu O, Soro E, Goore BT. The phonemes recognition through formant analysis in vowel-consonant transition case in “Baoule” language of Côte d’Ivoire. American Journal of Modeling and Optimization. 2016; 4(2):29-39.

7.      Kramer S, Brown DK. Audiology: science to practice, Third Edition. San Diego: Plural Publishing,2019.

8.      Леонтиќ М. Контрастивна анализа на гласовите во турскиот и во македон- скиот јазик и нивна класификација. Палимпсест. 2018; 3(5):43-57.

9.      Бојковска С, Минова-Ѓуркова Л, Пандев Д, Цветковски Ж. Општа граматика на македонскиот јазик. Скопје: Просветно дело, 2008.


10.      Gunasekar C, Sabrigirinathan C, VinayagavelK,RamkumarK.Theacoustic parameters for analyzing speech with complete dentures. International Journal of Dental Research. 2017; 5(2):115-120.

11.      ProverbioAM,MassettiG,RizziE,Zani

A. Skilled musicians are not subject to the McGurk effect. Scientific Reports. 2016; 6:30423.

12.      Anil Kumar C, Shiva Prasad KM, Manjunatha   MB,    KodandaRamaiah GN. Basic acoustic features analysis of vowels and C-V-C of Indian English language. ITSI Transactions on Electrical and Electronics Engineering. 2015; 3(1): 20-23.

13.      Ferreira-Silva  A,  Pacheco  V,  Cagliari LC. Statistical descriptors in the characterization of some Brazilian Portuguese fricatives: analysis of spectral moments. Acta Scientiarum. Language and Culture. 2015; 37(4): 371-379.

14.      SchiavettiN,WhiteheadRL,MetzDE.The effects of  simultaneous  communication on production and perception of speech. Journal of Deaf Studies and Deaf Education. 2004; 9(3): 286-304.

15.      Raina D, Chakraborty S, Velankar MR. Automatic classification of instrumental music & human voice using formant analysis.InternationalJournalofAdvanced Research in Computer Science & Technology. 2014; 2(2):242-245.

16.      Ladefoged PN. Phonetics. Encyclopaedia Britannica [Online]. 2014 [Cited 2014 August]; Available from: URL: https:// www.britannica.com/science/phonetics

17.      Boersma P, Weenink D. Praat [Computer program]. Version 6.0.43, retrieved 24.10.2018 from:http://www.fon.hum.uva.nl/praat/

 

 

 

18.      Boersma P, Weenink D. Praat, a  system for doing phonetics by computer. Glot International. 2001; 5(9/10): 341-347.

19.      Bandyopadhyay S, Young ED. Discrimination of voiced stop consonants based on auditory nerve discharges. The Journal of Neuroscience. 2004; 24(2): 531-541.

20.      Botinis A, Fourakis M, Prinou I. Acoustic structure of the Greek stop consonants. Glossologia. 2000; 11-12:167-199.

21.      Cho T, McQueen JM. Prosodic influences on consonant production in Dutch: Effects of prosodic boundaries, phrasal accent and lexical stress. Journal of Phonetics. 2005; 33: 121-157.

22.      Lousada ML, Jesus LMT, Pape D. Estimation of stops› spectral place cues using multitaper techniques. DELTA. 2012; 28(1): 1-26.

23.      Gordon M, Barthmaier P, Sands K. A cross-linguistic acoustic study of voiceless fricatives. Journal of the International Phonetic Association. 2002; 32(2): 141-174.

24.      Northern JL. Hearing in children, 6th Edition. San Diego: Plural Publishing, 2014.

25.      Punišić S, Subotić M, Čabarkapa N. Artikulacijsko-akustička       obilježja atipičnog izgovora frikativa u srpskom jeziku. Govor. 2009; 26(2): 101-118.

26.      Гудурић С, Петровић Д. Прилог про- учавању фонетске природе гласова српског језика: струјни сугласници. Јужнословенски филолог. 2008; LXIV: 73-108.

27.      Ladefoged P. Vowels and consonants: an introduction to the sounds of languages. Malden: Blackwell Publishing,2001.

28.      Maniwa K, Jongman A. Acoustic characteristics of clearly spoken English fricatives.JournaloftheAcousticalSociety of America. 2009; 125(6):3962-3973.

29.      Tabain M. Variability in fricative production and spectra: implications for the hyper- and hypo- and quantal theories of speech production. Language and Speech. 2001; 44(1):57-94.

 

30.      Han K-I. Dialect and gender variations in the place and manner of articulation of the Korean fricatives. International Scholarly and Scientific Research & Inovation.2018; 12(1): 124-130.

31.      Koenig LL, Shadle CH, Preston JL, Mooshammer CR. Toward improved spectral measures of /s/: results from adolescents. Journal of Speech, Language and Hearing Research. 2013; 56(4): 1175-1189.

32.      Jongman A, Wayland R, Wong S. Acoustic characteristics of English fricatives. Journal of the Acoustical Society of America. 2000; 108(3):1252-1263.

33.      Vujasić N. Akustička analiza spektra šuma hrvatskih lingvalnih frikativa. Govor. 2014; 31(2): 109-131.

34.      Tabain M, Butcher A, Breen G, Beare R. An acoustic study of nasal consonants in three Central Australian languages. Journal of the Acoustical Society of America. 2016a; 139(2): 890-903.

35.      Tabain M, Butcher A, Breen G,Beare

R. An acoustic study of multiple lateral consonants in three Central Australian languages. Journal of the Acoustical Society of America. 2016b; 139(1): 361-372.

36.      Nazer S, Suresh S. Acoustic analysis of nasal consonants during fast and normal speaking rate in Malayalam speaking adults. International Journal of Advance Research, Ideas and Inovations in Technology. 2017; 3(1):743-748.

37.      Rodrigues S, Martins F, Silva S, Jesus LMT. /l/ velarisation as a continuum. PLOS ONE 2019; 14(3):e0213392.

38.      Kostić  Đ.  Metodika   izgradnje   govora  u dece oštećena sluha. Beograd: Savez društava defektologa Jugoslavije,1971.

Share

Follow Us



FacebookTwitterLinkedinWikiBlogger

Share Us

MySpaceTwitterStumbleuponGoogle BookmarksRedditLinkedInMixxRSS FeedPinterest
 

Journal metrics

Publish with JSER

Indexed in