1. Въведение
Основната цел на настоящото изследване е да докаже силата на един статистически метод – факторния анализ, за доказване на лингвистични хипотези. Прилагаме този метод, наричан и метод на главните компоненти, за проучване на скрити, ненаблюдаеми с други статистически методи фактори, които се оказват значими за оценките за правилно и неправилно на 12 некодифицирани варианти в устната реч. Следователно тук се интересуваме от перцепцията на звучащата реч и оценките на респонденти за отделни отклонения от книжовната норма.
Факторният анализ е статистически метод, при който целта е да се измерят и анализират характеристики, които не могат да бъдат измерени директно. С негова помощ се откриват скрити променливи, наричани фактори. От налични множество променливи се извличат по-малък брой променливи, които не могат директно да се измерят. При факторния анализ чрез анализ на корелациите между изходните променливи се цели: „(а) да се намали техният брой до по-малко количество базови променливи, които се наричат фактори и (б) да се намери корелацията междупървоначалните променливи и новите базови променливи (фактори). По този начин всички променливи, които са силно корелирани по между си, се обединяват в един фактор (нова скрита променлива), а променливите, които са слабо корелирани помежду си, се класифицират към различни фактори (нови скрити променливи)“ (Ганева 2016: 329).
В нашия случай изходните променливи за оценките за правилност : неправилност на 12 некодифицирани варианта в устната реч. Търсим кои са скритите променливи, наричани фактори, които формират нов/нови фактор/фактори, т.е. кои оценки са силно корелирани помежду си и могат да се обединят в един нов фактор (нова обединена оценка).
Съществуват два вида факторен анализ: изследователски, когато изследователят не знае броя на скритите променливи, и потвърждаващ, при който изследователят иска да бъдат потвърдени хипотезите му. Настоящото изследване принадлежи към потвърждаващия факторен анализ, защото на базата на наблюдението на оценките на респондентите за 12-те некодифицирани варианта издигнахме хипотезата за наличието на оценки за два некодифицирани варианта, които клонят към положителната скала, т.е. преобладават положителните оценки за правилност.
Емпиричните данни за оценките по противопоставянето правилно : неправилно на 12 некодифицирани варианта в устната реч са придобити от национално представителна анкета. Тя е реализирана през м. май 2010 г. Използваната методология е лични интервюта в дома на респондентите. В рамките на проучването са интервюирани 2018 пълнолетни българи. Извадката е национално представителна за пълнолетното население на Република България по отношение на критериите пол, възраст, местожителство (тип населено място и регион), образование и етническа принадлежност. Използвана е методиката на двустепенната случайна адресна извадка. Базисната извадка е съставена от гнезда, подбрани на случаен принцип, като броят им е пропорционален на броя и гъстотата на населението в Р България. От своя страна броят и разпределението на гнездата във всяка административна област са съобразени с разпределението на населението според типа на населеното място: метрополия/областен център, градска и селска зона. Във всяко от подбраните гнезда, отново на случаен принцип, е локализиран стартов адрес. Адресите, посетени от анкетьорите, са определени според стандартните процедури на методиката за движение по „случаен маршрут“. Във всяко посетено домакинство е подбиран целеви респондент на случаен принцип (според правилото за „следващия рожден ден“). Въпросите в анкетната карта се четат от анкетьорите, като те също така записват отговорите в бланката. Словоформите (между 3 и 4), представителни за всяко отклонение от правоговора, са записани предварително на звуков файл от участниците в научния екип по проекта. Анкетираните изслушват записа и оценяват избраните 12 некодифицирани варианти на социолингвистични променливи по противопоставянията правилно : неправилно, западнобългарско : източнобългарско, звучи добре : не звучи добре. Оценките се дават по десетстепенна скала (вж. повече у Алексова 2016).
Избраните 12 некодифицирани варианта в устната реч са следните:
Таблица 1. Некодифицирани варианти
| 1. Повсеместен е-рефлекс на ятовата гласна (въпрос 1. – думи стимули бел, голем, хлеб) и при глаголите (въпрос 2. – бехме, вървехме, живехме). 2. Свръхякане във форми за мн.ч. на прилагателни и причастия (голями, бяли, видяли, живели). 3. Твърдост на съгласната пред окончанието за 1 л., ед.ч. и 3 л., мн.ч., сег. време. при глаголи от I спр. (3. разред), от II спр. (1. и 2. разред), от 2. разред на III спр., сег. вр. във всички лица (без тези, които имат пред тематичната гласна сонорни съгласни м’ и л’). В анкетата се прослушват формите вървъ̀, спъ̀, вървъ̀т, спъ̀т. 4. Твърдост на съгласната пред членната морфема на съществителни нарицателни за лица деятели с наставки -ар и -тел от м.р. ед.ч. (за -тел и при същ. имена, назоваващи уреди, съоръжения и др.), както и при съществителни имена от м.р. ед.ч. с исторически мека крайна съгласна и др. В анкетата учѝтелъ, лèкъръ, прия̀телъ. 5. Дейотация във форми на показателни местоимения, представена в анкетата с формите тòа, тàа, тѐа, онѐа. 6. Премет на ударението в аористни непрефигирани и префигирани глаголни форми, както и в съответните им аористни причастия. В анкетата говорùх, говорùл, направùх, направùл. |
7. Окончание -ме за 1 л., мн.ч., сег.вр., I и II спр. (т.нар. мекане). В анкетата хòдиме, говòриме, пу̀шиме, пѝеме. 8. Определителен член -тъ̀ (под ударение) при съществителните от ж.р., завършващи на съгласен звук, в анкетата радосттъ̀, песентъ̀, мисълтъ̀. 9 и 10. Редукция на неударена гласна е в и, както и смекчаване на съгласни пред предни гласни. В един въпрос от анкетната карта се изследват оценките едновременно и към двете явления, тъй като предварителни статистически изследвания сочат, че тези явления се намират в силна по степен положителна зависимост (коефициент 0.856). Това означава, че с нарастването на средните стойности на едната особеност растат и стойностите на другата и обратно (вж. Алексова 2009). В анкетата е включена фразата Н’ѐ, д’ит’ѐту ни пѝши. 11. Окончание -ъ (генерализирана винителна форма) при съществителни имена от ж.р. с ударение върху окончанието (т. нар. ъкане). Думите за прослушване в анкетата са главъ̀, главъ̀тъ, ръкъ̀, ръкъ̀тъ. 12. Аористна тематична гласна -а- (при отчитане на редукцията ѝ) вм. книжовната тематична гласна -о- при глаголи от I спрежение, I разред. Изслушват се формите чèта̤х, отѝда̤х, донèса̤хте, дàда̤хте. |
Легенда
PRG1_1. Как ще оцените изговора на думите бел, голем, хлеб според всяко едно от следните? 1.правилна – неправилна
PRG2_1. Как ще оцените изговора на думите бехме, вървехме, живехме според всяко едно от следните? 1.правилна – неправилна
PRG3_1. Как ще оцените изговора на думите бяли, голями, вървяли, живяли според всяко едно от следните? 1.правилна – неправилна
PRG4_1. Как ще оцените изговора на думите ходиме, говориме, пушиме, пиеме според всяко едно от следните? 1.правилна – неправилна
PRG5_1. Как ще оцените изговора на думите четъх, отидъх, донесъхте, дадъхте според всяко едно от следните? 1.правилна – неправилна
PRG6_1. Как ще оцените изговора на думите вървъ, спъ, вървът, спът според всяко едно от следните? 1.правилна – неправилна
PRG7_1. Как ще оцените изговора на думите учителъ, лекаръ, приятелъ според всяко едно от следните? 1.правилна – неправилна
PRG8_1. Как ще оцените изговора на думите тоа, таа, теа, онеа според всяко едно от следните? 1.правилна – неправилна
PRG9_1. Как ще оцените изговора на думите радосттъ, песентъ, мисълтъ според всяко едно от следните? 1.правилна – неправилна
PRG10_1. Как ще оцените изговора на думите главъ, ръкъ, главътъ, ръкътъ според всяко едно от следните? 1.правилна – неправилна
PRG11_1. Как ще оцените изговора на думите Нйe, дитйeту ни пиши (МЕК ИЗГОВОР) според всяко едно от следните? 1.правилна – неправилна
PRG12_1. Как ще оцените изговора на думите говорих, говорил, направих, направил според всяко едно от следните? 1.правилна – неправилна
Издигането на посочената по-горе хипотеза е резултат от обработката на резултатите за противопоставянето правилно : неправилно – вж. Граф. 1.
От Граф. 1 се вижда, че почти всички некодифицирани варианти са получили висок процент негативни оценки, т.е. оценки за неправилност, от висок процент от анкетираните, дали отговор, различен от „не знам“. Отговор „не знам“ е даден от около 5–6% от 2018 респонденти. Както личи от Граф. 1, само за един от некодифицираните варианти има повече оценки от скалата на правилността – това е т.нар. мекане (пишеме, четеме, ходиме, говориме) с около 51.3% оценки за правилност. Два некодифицирани варианта имат по около 30% оценки за правилност: свръхякането (бяли, голями, вървяли, живяли) и премета на ударението в аористни форми (говорùх, говорùл, направùх, направùл). Поставихме си задачата да открием скрити (латентни) фактори, които да обясняват изходните променливи и които не могат да се наблюдават пряко чрез други статистически методи.

Графика 1. Оценки за неправилност в проценти анкетирани, дали отговор, различен от „не знам“
Провеждането на факторния анализ се извърши чрез програмата IBM SPSS Statistics.
2. Ход и резултати от факторния анализ
В хода на провеждане на факторния анализ трябва да се определят кои са тези изходни променливи (в нашия случай оценки по противопоставянето правилно : неправилно на 12-те некодифицирани варианта), които силно корелират една с друга и техните корелации са статистически значими, което означава, че корелационните коефициенти са по-големи от 0.3 при коефициент на значимост Sig. < 0.05.
Приема се, че факторният анализ е адекватен, когато едновременно са изпълнени няколко условия: има големи корелационни коефициенти, КМО тестът за адекватност на извадката е по-голям от 0.5 и когато Bartlett‘s test за сферичност на облака данни има Sig. < 0,05.
В хода на провеждането на анализа с IBM SPSS Statistics се получава корелационна матрица (Табл. 2.).
Таблица 2. Корелационна матрица
| Correlation Matrixa | |||||||||||||
| PRG1_1. | PRG2_1. | PRG3_1. | PRG4_1. | PRG5_1. | PRG6_1. | PRG7_1. | PRG8_1. | PRG9_1. | PRG10_1. | PRG11_1. | PRG12_1. | ||
| Correlation | PRG1_1. | 1,000 | ,755 | ,228 | ,199 | ,305 | ,384 | ,295 | ,257 | ,217 | ,238 | ,183 | ,271 |
| PRG2_1. | ,755 | 1,000 | ,261 | ,223 | ,351 | ,441 | ,322 | ,344 | ,283 | ,236 | ,202 | ,320 | |
| PRG3_1. | ,228 | ,261 | 1,000 | ,370 | ,142 | ,111 | ,194 | ,098 | ,130 | ,076 | ,102 | ,257 | |
| PRG4_1. | ,199 | ,223 | ,370 | 1,000 | ,256 | ,144 | ,173 | ,069 | ,194 | ,036 | ,057 | ,242 | |
| PRG5_1. | ,305 | ,351 | ,142 | ,256 | 1,000 | ,454 | ,312 | ,234 | ,346 | ,247 | ,196 | ,198 | |
| PRG6_1. | ,384 | ,441 | ,111 | ,144 | ,454 | 1,000 | ,452 | ,297 | ,476 | ,352 | ,301 | ,192 | |
| PRG7_1. | ,295 | ,322 | ,194 | ,173 | ,312 | ,452 | 1,000 | ,342 | ,514 | ,430 | ,271 | ,193 | |
| PRG8_1. | ,257 | ,344 | ,098 | ,069 | ,234 | ,297 | ,342 | 1,000 | ,251 | ,345 | ,356 | ,154 | |
| PRG9_1. | ,217 | ,283 | ,130 | ,194 | ,346 | ,476 | ,514 | ,251 | 1,000 | ,429 | ,277 | ,139 | |
| PRG10_1. | ,238 | ,236 | ,076 | ,036 | ,247 | ,352 | ,430 | ,345 | ,429 | 1,000 | ,413 | ,100 | |
| PRG11_1. | ,183 | ,202 | ,102 | ,057 | ,196 | ,301 | ,271 | ,356 | ,277 | ,413 | 1,000 | ,119 | |
| PRG12_1. | ,271 | ,320 | ,257 | ,242 | ,198 | ,192 | ,193 | ,154 | ,139 | ,100 | ,119 | 1,000 | |
| PRG1_1. | PRG2_1. | PRG3_1. | PRG4_1. | PRG5_1. | PRG6_1. | PRG7_1. | PRG8_1. | PRG9_1. | PRG10_1. | PRG11_1. | PRG12_1. | ||
| Sig. (1-tailed) | PRG1_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | |
| PRG2_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| PRG3_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,001 | ,000 | ,000 | ||
| PRG4_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,003 | ,000 | ,072 | ,011 | ,000 | ||
| PRG5_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| PRG6_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| PRG7_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| PRG8_1. | ,000 | ,000 | ,000 | ,003 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| PRG9_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| PRG10_1. | ,000 | ,000 | ,001 | ,072 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| PRG11_1. | ,000 | ,000 | ,000 | ,011 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| PRG12_1. | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ,000 | ||
| a. Determinant = ,035 | |||||||||||||
Детерминантата (под Табл. 2) е 0.035, което показва, че факторният анализ може да бъде проведен. Наблюдават се корелационните коефициенти, по-големи от 0.5, като в долната половина на Табл. 2 има нива на значимост Sig. < 0.05. Получените данни доказват, че корелационните зависимости са статистически значими и участват в анализа, а тези с нива на значимост, по-големи от 0.05, са незначими.
Трябва да бъдат анализирани тестове за адекватност на факторния анализ. Наблюдава се КМО (тест на Kaiser-Meyer-Olkin), който според данните от Табл. 3 е 0.822, което е по-голямо от 0.5, следователно данните ни са подходящи за факторен анализ и моделът е адекватен. След това се анализира Бартлет тестът, който има в случая ниво на значимост Sig.=0.000 < 0.05 (вж. Табл. 3). А това означава, че облакът от данни е сферичен.
Таблица 3. Тестове за адекватност
| KMO and Bartlett’s Test | ||
|---|---|---|
| Kaiser-Meyer-Olkin Measure of Sampling Adequacy. | ,822 | |
| Bartlett’s Test of Sphericity | Approx. Chi-Square | 5469,561 |
| df | 66 | |
| Sig. | ,000 | |
Следващата стъпка е да се разгледат изчисленията за извлечените главни компоненти. За това служи Табл. 4. От нея личи, че са извлечени 12 главни компонента. От четвъртата колона се вижда какъв процент от вариацията обясняват кумулативно тези главни компоненти. Става ясно, че до петия компонент кумулативният процент е 69.479%, което значи, че първите пет главни компонента обясняват почти 70% от вариациите.
Таблица 4. Извлечени главни компоненти
| Total Variance Explained | |||||||||
|---|---|---|---|---|---|---|---|---|---|
| Component | Initial Eigenvalues | Extraction Sums of Squared Loadings | Rotation Sums of Squared Loadings | ||||||
| Total | % of Variance | Cumulative % | Total | % of Variance | Cumulative % | Total | % of Variance | Cumulative % | |
| 1 | 4,022 | 33,513 | 33,513 | 4,022 | 33,513 | 33,513 | 2,909 | 24,242 | 24,242 |
| 2 | 1,520 | 12,668 | 46,181 | 1,520 | 12,668 | 46,181 | 2,031 | 16,921 | 41,163 |
| 3 | 1,083 | 9,026 | 55,207 | 1,083 | 9,026 | 55,207 | 1,685 | 14,044 | 55,207 |
| 4 | ,955 | 7,959 | 63,166 | ||||||
| 5 | ,758 | 6,313 | 69,479 | ||||||
| 6 | ,739 | 6,159 | 75,638 | ||||||
| 7 | ,660 | 5,501 | 81,139 | ||||||
| 8 | ,587 | 4,895 | 86,034 | ||||||
| 9 | ,544 | 4,537 | 90,571 | ||||||
| 10 | ,462 | 3,847 | 94,418 | ||||||
| 11 | ,440 | 3,664 | 98,081 | ||||||
| 12 | ,230 | 1,919 | 100,000 | ||||||
| Extraction Method: Principal Component Analysis. | |||||||||
Следващата Граф. 2 показва нагледно колко фактора е добре да се вземат – обикновено се спира дотам, откъдето линията става полегата. В случая избираме първите три фактора.
Графика 2
Следващата стъпка във факторния анализ е да се разгледа началното решение за 3 фактора, като то се нарича незавъртяно – вж. Табл. 5.
Таблица 5. Незавъртяно решение за 3 фактора (главни компоненти)
| Component Matrixa | |||
|---|---|---|---|
| Component | |||
| 1 | 2 | 3 | |
| PRG2_1. | ,715 | ||
| PRG6_1. | ,711 | ||
| PRG7_1. | ,679 | ||
| PRG1_1. | ,655 | -,523 | |
| PRG9_1. | ,643 | ||
| PRG5_1. | ,599 | ||
| PRG10_1. | ,586 | ||
| PRG8_1. | ,551 | ||
| PRG11_1. | |||
| PRG4_1. | ,531 | ||
| PRG3_1. | ,529 | ||
| PRG12_1. | |||
| Extraction Method: Principal Component Analysis. | |||
| a. 3 components extracted. | |||
От Табл. 5 се вижда, че променливата PRG1_1.Как ще оцените изговора на думите бел, голем, хлеб според всяко едно от следните? 1.правилна – неправилна има тегла 0.655 в първия и -0.523 в третия главен компонент (фактор), така че не може да се групира в никой от двата фактора. Тогава се продължава анализът с т.нар. въртене.
Завъртяното решение с Варимакс метода е онагледено на Табл. 6, на която могат да се видят три фактора (три главни компонента).
Таблица 6. Завъртяно решение за 3 фактора (главни компоненти)
| Rotated Component Matrixa | |||
|---|---|---|---|
| Component | |||
| 1 | 2 | 3 | |
| PRG10_1. | ,750 | ||
| PRG9_1. | ,734 | ||
| PRG7_1. | ,698 | ||
| PRG11_1. | ,618 | ||
| PRG6_1. | ,615 | ||
| PRG8_1. | ,524 | ||
| PRG5_1. | |||
| PRG1_1. | ,871 | ||
| PRG2_1. | ,867 | ||
| PRG4_1. | ,808 | ||
| PRG3_1. | ,731 | ||
| PRG12_1. | |||
| Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a | |||
| a. Rotation converged in 5 iterations. | |||
В първия главен компонент са включени оценки за правилност : неправилност на некодифицирани варианти от източен и западен тип, които са силно корелирани помежду си. Можем да наречем този първи главен компонент „типични правоговорни отклонения“. Във втория главен компонент са включени само екането в именни форми и екането в глаголни форми. Този главен компонент може да бъде назован „идентификатор на българския езиков запад“. В третия главен компонент са мекането и свръхякането. За тях са дадени най-малко оценки за неправилност. Тъй като при перцепция тези правоговорни отклонения се оценяват относително най-високо по правилност, този главен компонент може да се назове „положителни оценки за некодифицирани варианти“.
3. Заключение
В настоящата работа бе проверена хипотезата, че при перцепция на 12 некодифицирани варианта в устната реч се получават оценки по противопоставянето правилно : неправилно, за които факторният анализ има висока обяснителна сила, тъй като се извличат скрити фактори, ненаблюдаеми с други методи. Стана ясно, че изходното пространство от оценки по правилност : неправилност на 12-те некодифицирани варианта може да бъде редуцирано до три обобщени признака (фактора): „типични правоговорни отклонения“, „идентификатор на българския езиков запад“ и „положителни оценки за некодифицирани варианти“. Доказана бе първоначалната ни хипотеза, че две са правоговорните отклонения, които привличат най-много оценки за правилност: мекането и свръхякането. Според нас това са две тенденции в устната комуникация, които най-рядко се оценяват при перцепция като неправилни. Наблюденията ни върху речевата продукция говорят за широко разпространение на тези некодифицирани вариантни в устната реч. Като се вземат предвид резултатите и от перцепцията, и от наблюденията върху речта, то може да се каже, че това са двете езикови тенденции, които са най-високо честотни в устната комуникация и които не се оценяват като неправилни от множество лица, а това значи, че трябва да бъдат специално наблюдавани и от социолингвистите, и от кодификаторите.
Цитирана литература
Алексова 2009: Алексова, Кр. Корелационни зависимости между лингвистични променливи. – В: Карагьозов, П., Ю. Стоянова, съст. Преходи и граници. Сборник доклади от ХV годишна научна конференция на Факултета по славянски филологии на Софийския университет „Св. Климент Охридски“ (18–19 май 2009 г.). София: Университетско издателство „Св. Кл. Охридски“, 2009, с. 480–495.
Алексова 2016: Алексова, Кр. Социолингвистична перцепция, езикови нагласи и социална идентификация по речта. София: Парадигма, 2016.
Ганева 2016: Ганева, З. Да преоткрием статистиката с IBM SPSS Statistics. София: Elestra,2016. https://www.elbook.eu/images/book25.pdf#%5B%7B%22num%22%3A995%2C%22gen%22%3A0%7D%2C%7B%22name%22%3A%22FitR%22%7D%2C-561%2C-4%2C1155%2C846%5D, посетен 28.01.2023.

