Страница 12 из 16
24. КОЭФФИЦИЕНТ РАНГОВОЙ КОРРЕЛЯЦИИ КЕНДАЛЛА
Как и в случае КРК Спирмена исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у. Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен. КРК Кендалла обычно обозначается и вычисляется по формуле: = (P – Q) : ((n (n – 1)) :2), где P – общее количество совпадений; Q – общее количество инверсий. Например:
Лицо
|
х
|
у
|
Совпадения
|
Инверсия
|
А С В Н Е F D G
|
1 2 3 4 5 6 7 8
|
1 2 5 7 8 4 6
|
5 6 5 3 1 0 1 0
|
2 0 0 1 2 2 0 0
|
|
|
|
Р = 21
|
Q = 7
|
При вычислении КРК Кендалла для упрощения расчетов данные располагают по одной переменной (например, х) в порядке возрастания. Так как для каждой пары может быть или совпадение или инверсия, то после подсчета совпадений количество инверсий равно количеству сравниваемых лиц (исключая себя) минус количество совпадений. = (21 – 7) : (8 (8 – 1) : 2) = 0,5. Отсюда видно, что между переменными х и у имеется прямая (положительная) средняя корреляционная связь. В случае связанных (одинаковых) КРК Кендалла, как и КРК Спирмена, вычисляется по формуле:
= (P – Q) : [ n (n – 1) :2 – Kx ] [ n (n – 1) :2 – Ky ] , где поправки Кх и Ку вычисляются по следующим формулам: k Кх = [ fi (fi – 1)] : 2, где k - количество групп совпадающих i=1 рангов по переменной х; fi - количество значений в i-той группе совпадений. m Ky = [gi (gi – 1)] : 2, где m - количество групп совпадающих i=1 рангов по переменной у, gi - количество значений в i-той группе совпадений. Наиболее часто на практике используется КРК Спирмена. Следует также отметить, что КРК Спирмена и КРК Кендалла связаны следующим приблизительным соотношением: rs = 1,3 Значимость КРК Кендалла. После вычисления КРК Кендалла необходимо проверить полученное значение КРК на значимость. Для этого воспользуемся общей схемой проверки статистической гипотезы. 1. Выдвигаются две статистические гипотезы: Н0 о том, что КРК Кендалла статистически равен 0 и Н1 о том, что этот КРК статистически отличен от 0. Н0 : =0 Н1 : / =0. 2. Выбирается уровень значимости . 3. Вычисляется наблюдаемое значение статистического критерия. Для этого сначала вычисляем величину
|
т.е. - Zкр < Zнабл. < Zкр, то в нашем случае делаем вывод о том, что на уровне значимости 0,05 КРК Кендалла статистически равен 0, т.е. не является значимым. Проверка гипотезы о равенстве двух коэффициентов корреляции. Иногда может возникать задача сравнения для двух различных групп лиц. Например: сильнее ли коррелированы способности и успеваемость у мальчиков, чем у девочек? Для решения такой задачи воспользуемся общей схемой проверки статистической гипотезы. 1. Выдвигаются две статистические гипотезы, основная нулевая Н0 о том, что КК двух рассматриваемых ГС статистически одинаковы и альтернативная Н1 о том, что эти КК статистически различны. Н0: 1 = 2, где 1 – КК между двумя исследуемыми показателями в первой ГС Н1: 1 /= 2, где 2 – КК между двумя исследуемыми показателями во второй ГС. 2. Выбираем уровень значимости . 3. Вычисляется наблюдаемое значение статистики критерия. Для этого сначала по исходным данным вычисляется КК, r1 и r2. После этого вычисленные КК с помощью преобразования Фишера преобразуются величины Z1 и Z2. Z1 = ½ ln (1+r1) : (1 – r1) Z2 = ½ ln (1+r2) : (1 – r2) Тогда наблюдаемое значение статистики критерия вычисляется по следующей формуле: Zнабл. = (Z1 – Z2) : (1 : (n – 3) + 1 : (m – 3), где n – количество лиц первой группы, а m – количество лиц второй группы. 4. Находится критическое значение статистики критерия. В нашем случае статистика критерия имеет стандартное нормальное распределение, поэтому для нахождения Zкр нужно воспользоваться статистической таблицей стандартного нормального распределения (см. параграф 17). 5. Делаем вывод о правильности той или иной гипотезы по следующему правилу: 1) если –Zкр < Zнабл < Zкр, то принимается гипотеза Н0, т.е. делаем вывод о том, что КК между исследуемыми показателями в двух рассматриваемых ГС статистически одинаковы на уровне значимости . 2) если Zнабл < -Zкр или Zнабл > Zкр, то принимается гипотеза Н1, т.е. делаем вывод о том, что эти КК статистически различны на уровне значимости .
|
Так как Zнабл > Zкр, то принимаем гипотезу Н1, т.е. корреляция между интеллектом и скоростью обмена веществ у детей сильнее (т.к. r1 > r2), чем у взрослых.
25. АНАЛИЗ ВЗАИМОСВЯЗИ НОМИНАЛЬНЫХ ПРИЗНАКОВ С ПОМОЩЬЮ КОРРЕЛЯЦИОННОГО АНАЛИЗА
Иногда оба признака (переменные) могут быть измерены в номинальной шкале. Рассмотрим частный случай номинальной шкалы, которая называется дихотомической, т.е. признак может принимать только два значения: либо 0, либо 1. В этом случае исходные данные, т.е. две выборки, представляют собой два столбца, состоящие из 0 и 1, причем каждая строка соответствует значениям двух признаков для одного и того же лица. Пример: пусть переменная х – это семейное положение, причем 1 – женат и 0 – холост; переменная у – исключение из колледжа, 1 – исключен и 0 – учится.
х |
у
|
0 1 0 0 1 1 0 1 0 0 0 1
|
0 1 1 0 1 0 0 1 0 1 0 1
|
Для анализа взаимосвязи между двумя номинальными признаками можно воспользоваться формулой КК Пирсона. Однако в нашем случае эту формулу можно заменить на более простую, эквивалентную. КК для номинальных признаков обычно обозначается . Пусть рх – доля людей, для которых переменная х = 1; gх – доля людей, для которых переменная х = 0. Очевидно, что gх = 1 - рх. pу – доля людей, для которых переменная у = 1.gу – доля людей, для которых у = 0. рху – доля людей, для которых и х и у = 1. Тогда КК вычисляется по формуле: = (pxy – px py) : px gx py gy Вычислим этот коэффициент для нашего примера. Для этого сначала найдем рх = 5/12 = 0,4167 gх = 1 – 0,4167 = 0,5833 pу = 6/12 = 0,5 gy = 1 – 0,5 = 0,5 pху = 4/12 = 0,3333 = (0,3333 – 0,4167 0,5) : 0,4167 0,5833 0,5 0,5 = 0,507 После вычисления КК нужно осуществить проверку его значимости. Проверка значимости проводится аналогично проверке значимости КРК Кендалла, только наблюдаемое значение статистики критерия вычисляется по формуле: Zнабл = n Проверим на значимость вычисленный в примере выше КК . = 0,507 n = 12 Zнабл = 12 0,507 = 1,76 = 0,05 из таблицы Zкр = 1,96
|
Так как – Zкр < Zнабл < Zкр, то мы должны принимать гипотезу Н0, т.е. делаем вывод о том, что на уровне значимости 0,05 КК статистически = 0.
|