Частный коэффициент корреляции и его значения
Содержание:
- Литература
- Множественная корреляция, её коэффициент
- Интересные профессии
- Распространенные заблуждения
- Коэффициент корреляции в Excel: что это, как рассчитать? Формула, пример, анализ данных онлайн
- Коэффициент корреляции частный, его значения
- Как восстановить доступ к аккаунту
- § 8. Методика вычисления выборочного коэффициента корреляции
- 9.1.2. Проверка статистических гипотез о связи переменных
- От Google
- Предвзятость средств массовой информации
- Расчет коэффициента корреляции
- Выборочный коэффициент корреляции
- Hard Reset средствами самой системы Android
Литература
- Гмурман В. Е.<span title=»Статья «Гмурман, Владимир Ефимович» в русском разделе отсутствует»>ru</span>uk. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 10-е издание, стереотипное. — Москва: Высшая школа, 2004. — 479 с. — ISBN 5-06-004214-6.
- Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учебник / Под ред. И. И. Елисеевой. — 4-е издание, переработанное и дополненное. — Москва: Финансы и Статистика, 2002. — 480 с. — ISBN 5-279-01956-9.
- Общая теория статистики: Учебник / Под ред. Р. А. Шмойловой. — 3-е издание, переработанное. — Москва: Финансы и Статистика, 2002. — 560 с. — ISBN 5-279-01951-8.
- Суслов В. И., Ибрагимов Н. М., Талышева Л. П., Цыплаков А. А. Эконометрия. — Новосибирск: СО РАН, 2005. — 744 с. — ISBN 5-7692-0755-8.
Множественная корреляция, её коэффициент
Множественная корреляция — это вероятностная зависимость между одной величиной с
одной стороны, и одновременно несколькими другими ,
с другой стороны.
То есть, в отличие от парной корреляции, при которой
на изменения зависимой (результирующей) переменной влияет одна независимая (объясняющая) переменная,
при множественной корреляции независимых (объясняющих) переменных две или больше.
Цель корреляционного анализа в случае множественной корреляции — установить, есть ли зависимость между
переменными и насколько тесно связаны между собой зависимая переменная, с одной стороны, и независимые
переменные, с другой стороны, и зависят ли друг от друга независимые переменные .
Для того чтобы можно было бы применять модель множественной линейной регрессии, прежде, при анализе
множественной корреляции должны быть установлены следующие факты:
- зависимая переменная тесно зависит от независимых переменных (тесноту связи, как и в случае
парной корреляции, показывают ); - нет тесной зависимости между независимыми переменными.
Коэффициент множественной корреляции в случае двухфакторной корреляции рассчитывается по следующей формуле:
.
Коэффициенты множественной корреляции между зависимой переменной
и независимыми переменными
записываются в корреляционную матрицу:
Пример 1. Аналитик предприятия решил проверить факторы, которые
влияют на размер заработной платы сотрудников . Предварительно
в качестве объясняющих факторов выбраны: возраст сотрудника ,
стаж работы , оценка теста для приёма
на работу и число подчинённых
сотрудников . Случайно были выбраны
200 сотрудников, данные которых были обобщены. В результате была получена следующая корреляционная матрица:
1 | |||||
-0,27 | 1 | ||||
0,78 | -0,63 | 1 | |||
-0,83 | 0,47 | -0,89 | 1 | ||
0,65 | -0,46 | 0,17 | -0,21 | 1 |
Установить, какие переменные можно выбрать как независимые, для того, чтобы далее
можно было бы строить модель множественной регрессии.
Решение.
Корреляционная матрица показывает, что между переменными:
- и — слабая линейная связь: -0,27;
- и — средне тесная положительная линейная связь: 0,78;
- и — тесная отрицательная линейная связь: -0,83;
- и — средне тесная линейная связь: 0,65;
- и — тесная отрицательная линейная связь: -0,89;
- и — слабая линейная связь: 0,17;
- и — слабая линейная связь: -0,21.
Таким образом, не следует включать в число переменных, влияющих на размер заработной
платы возраст сотрудников . Так как
между независимыми переменными и
установлена тесная отрицательная связь,
не включаем в число переменных, влияющих на размер заработной платы стаж работы .
Выбираем в качестве независимых переменных оценку теста для приёма
на работу и число подчинённых
сотрудников .
Чтобы установить тесноту связи между заработной платой сотрудников ,
с одной стороны, и оценкой теста для приёма
на работу и числом подчинённых
сотрудников , с другой стороны,
вычислим коэффициент множественной (двухфакторной) корреляции:
Таким образом, между заработной платой сотрудников, с одной стороны, и
оценкой теста для приёма на работу и числом подчинённых, с другой стороны, существует тесная линейная
связь.
Как показывает пример выше, в исследованиях поведения человека,
как и во многих других направлениях, важно установить, какие факторы из многих действительно влияют на
результат при учете влияния всех остальных факторов
Интересные профессии
Стюардесса
Это одна из самых интересных профессий. Но стать стюардессой очень непросто
Очень важно иметь идеальную внешность и свободно владеть несколькими иностранными языками
Помимо этого, нужно все-таки получить специальное образование и пройти жесткий отбор. Но если вам это удастся, то интересная и насыщенная жизнь вам обеспечены. Правда задумайтесь о том, не станет ли данная профессия преградой на пути к семейному счастью, ведь постоянные разъезды редко нравятся мужьям.
Проводница
Это не такая романтическая профессия, как предыдущая, тем не менее, освоив ее, вы точно не будете скучать.
Стать проводницей намного проще, чем стюардессой. Здесь кастинги никто не устраивает и языки учить не заставляют. Тем не менее, закончит специализированное учебное заведение все же нужно.
Фотограф
Фотографы способны запечатлеть самые светлые моменты жизни любого человека. Частичка радости всегда передается от клиента к фотографу.
Казалось бы, что нет ничего проще, чем купит камеру и начать фотографировать. Но фотоискусству, как и любому другому ремеслу нужно учиться. Для того чтобы сделать карьеру успешного фотографа вы должны:
- Иметь хорошую технику и аксессуары;
- Пройти обучение;
- Много практиковаться.
Дизайнер
Дизайнер – не только интересная, но и творческая профессия. Если вы обладаете чувством вкуса, умеете красиво рисовать, ваша голова полна идей, а фантазия не имеет границ, то обязательно попробуйте свои силы в качестве дизайнера.
Конечно, стать профессионалом без получения должного образования у вас не получится. Только в учебных заведениях помогут раскрыть ваш талант и дадут все необходимые знания.
Менеджер по туризму
Любое туристическое агентство в своем штате имеет одного или нескольких менеджеров по туризму.
Именно эти люди находят клиентов и продают им туры. Чаще всего такие специалисты сами посетили все туры, сопровождая туристов. Они должны хорошо разбираться в специфике своей профессии и психологии людей. А этому их учат в колледжах и институтах.
Тренер вебинаров
Это очень молодая профессия, которая появилась после того, как интернет стал доступен всем и каждому.
Но для того чтобы такая деятельность приносила желаемый доход, вы должны обладать полезными знаниями, за передачу которых люди будут платить вам деньги.
Не думайте, что если вы расскажете как печь бисквит, вам кто-то заплатит хоть копейку.
Большим спросом пользуются вебинары, где тренер рассказывает, как зарабатывать деньги или учит методам влияния на людей, психологии, а также вебинары по материнству и грудному вскармливанию и т. д.
Также прочитайте:
- Работа в интернете на дому без вложений и без обмана
- Как заработать деньги в интернете — проверенные и актуальные способы
Флорист
Во все времена сердца женщин мужчины завоевывали при помощи шикарных букетов. А ведь такую красоту создают простые девушки и женщины. Если вы любите растения, а фантазия ваша безгранична, мы предлагаем стать флористом.
Для того чтобы освоить эту специальность, нужно иметь минимальные знания о растениях и чувство стиля. Если вы будете составлять хорошие композиции и обзаведетесь постоянными клиентами, то в будущем можно будет задуматься об открытие собственного дела.
Специалист по этикету
Во всех учебных заведениях ΧΧΙ века минимум времени уделяется вопросам этикета. А ведь умение держать себя в обществе это качество, которым должен владеть каждый человек. Но сейчас очень мало специалистов, которые могут обучить искусству этикета.
Из-за большого количества клиентов и небольшого количества преподавателей, специалисты по этикету без дела никогда не сидят.
Спортивный инструктор
Здоровый образ жизни на пике популярности. ПП и восстановление после родов — это вообще одни из ТОПовых направлений сегодня.
Многие люди поняли насколько важно вести активный образ жизни и массово начинают записываться в спортзалы. Попав туда, люди с большой охотой оплачивают услуги спортивных инструкторов, которые сопровождают их на протяжении всего занятия
Чаще всего в инструктора идут профессиональные спортсмены, которые по каким-то причинам решили оставить большой спорт.
Модельер
Вы в детстве шили наряды для кукол, а сейчас создаете одежду для себя? Тогда вам определенно нужно освоить профессию модельера.
Для того чтобы стать модельером, нужно уметь не только красиво рисовать, но и досконально знать швейное искусство. Чаще всего модельеры делают свою карьеру после того, как освоят профессию швеи, а потом несколько лет проработают в ателье.
Хореограф
Танцевать любят не только дети, но и взрослые. Именно поэтому все больше людей в сознательном возрасте записываются на уроки танцев.
Из-за того, что танцевальных направлений очень много, хореографы всегда найдут себе работу. Правда осваивают такую профессию девушки, которые танцами занимались или занимаются профессионально.
Вначале своей карьеры можно только преподавать уроки танцев, а через несколько лет скопить капитал и открыть свою хореографическую студию.
Распространенные заблуждения
Корреляция и причинность
Традиционное изречение, что « корреляция не подразумевает причинно-следственную связь », означает, что корреляция не может использоваться сама по себе для вывода причинной связи между переменными. Это изречение не следует понимать как то, что корреляции не могут указывать на возможное существование причинно-следственных связей. Однако причины, лежащие в основе корреляции, если таковые имеются, могут быть косвенными и неизвестными, а высокие корреляции также пересекаются с отношениями идентичности ( тавтологиями ), где не существует причинного процесса. Следовательно, корреляция между двумя переменными не является достаточным условием для установления причинной связи (в любом направлении).
Корреляция между возрастом и ростом у детей довольно прозрачна с точки зрения причинно-следственной связи, но корреляция между настроением и здоровьем людей менее очевидна. Приводит ли улучшение настроения к улучшению здоровья, или хорошее здоровье приводит к хорошему настроению, или и то, и другое? Или в основе обоих лежит какой-то другой фактор? Другими словами, корреляция может рассматриваться как свидетельство возможной причинной связи, но не может указывать на то, какой может быть причинная связь, если таковая имеется.
Простые линейные корреляции
Четыре набора данных с одинаковой корреляцией 0,816
Коэффициент корреляции Пирсона указывает на силу линейной связи между двумя переменными, но его значение, как правило, не полностью характеризует их взаимосвязь. В частности, если условное среднее из дано , обозначается , не является линейным в , коэффициент корреляции будет не в полной мере определить форму .
Y{\ displaystyle Y}Икс{\ displaystyle X}E(Y∣Икс){\ displaystyle \ operatorname {E} (Y \ mid X)}Икс{\ displaystyle X}E(Y∣Икс){\ displaystyle \ operatorname {E} (Y \ mid X)}
Прилегающие изображение показывает разброс участков из квартет энскомбы , набор из четырех различных пар переменных , созданный Фрэнсис Анскомбами . Четыре переменные имеют одинаковое среднее значение (7,5), дисперсию (4,12), корреляцию (0,816) и линию регрессии ( y = 3 + 0,5 x ). Однако, как видно на графиках, распределение переменных сильно отличается. Первый (вверху слева), кажется, распределен нормально и соответствует тому, что можно было бы ожидать, рассматривая две коррелированные переменные и следуя предположению о нормальности. Второй (вверху справа) не распространяется нормально; Хотя можно наблюдать очевидную связь между двумя переменными, она не является линейной. В этом случае коэффициент корреляции Пирсона не указывает на то, что существует точная функциональная связь: только степень, в которой эта связь может быть аппроксимирована линейной зависимостью. В третьем случае (внизу слева) линейная зависимость идеальна, за исключением одного выброса, который оказывает достаточное влияние, чтобы снизить коэффициент корреляции с 1 до 0,816. Наконец, четвертый пример (внизу справа) показывает другой пример, когда одного выброса достаточно для получения высокого коэффициента корреляции, даже если связь между двумя переменными не является линейной.
у{\ displaystyle y}
Эти примеры показывают, что коэффициент корреляции, как сводная статистика, не может заменить визуальный анализ данных. Иногда говорят, что примеры демонстрируют, что корреляция Пирсона предполагает, что данные следуют нормальному распределению , но это неверно.
Коэффициент корреляции в Excel: что это, как рассчитать? Формула, пример, анализ данных онлайн
Выделяют 2 вида связи между ними:
- функциональная;
- корреляционная.
Корреляция в переводе на русский язык – не что иное, как связь. В случае корреляционной связи прослеживается соответствие нескольких значений одного признака нескольким значениям другого признака. В качестве примеров можно рассмотреть установленные корреляционные связи между:
- длиной лап, шеи, клюва у таких птиц как цапли, журавли, аисты;
- показателями температуры тела и частоты сердечных сокращений.
Для большинства медико-биологических процессов статистически доказано присутствие этого типа связи.
Статистические методы позволяют установить факт существования взаимозависимости признаков. Использование для этого специальных расчетов приводит к установлению коэффициентов корреляции (меры связанности).
Такие расчеты получили название корреляционного анализа. Он проводится для подтверждения зависимости друг от друга 2-х переменных (случайных величин), которая выражается коэффициентом корреляции.
Использование корреляционного метода позволяет решить несколько задач:
- выявить наличие взаимосвязи между анализируемыми параметрами;
- знание о наличии корреляционной связи позволяет решать проблемы прогнозирования. Так, существует реальная возможность предсказывать поведение параметра на основе анализа поведения другого коррелирующего параметра;
- проведение классификации на основе подбора независимых друг от друга признаков.
Для переменных величин:
- относящихся к порядковой шкале, рассчитывается коэффициент Спирмена;
- относящихся к интервальной шкале – коэффициент Пирсона.
Это наиболее часто используемые параметры, кроме них есть и другие.
Значение коэффициента может выражаться как положительным, так и отрицательными.
В первом случае при увеличении значения одной переменной наблюдается увеличение второй. При отрицательном коэффициенте – закономерность обратная.
Для чего нужен коэффициент корреляции?
Данный статистический показатель позволяет не только проверить предположение о существовании линейной взаимосвязи между признаками, но и установить ее силу.
Случайные величины, связанные между собой, могут иметь совершенно разную природу этой связи.
Не обязательно она будет функциональной, случай, когда прослеживается прямая зависимость между величинами.
Коэффициент корреляции частный, его значения
Частные коэффициенты корреляции используются для отслеживания взаимосвязи изменения величины от множества факторов. Можно сказать, то частный коэффициент показывает степень тесноты связи в случае, когда все остальные признаки исключены из рассматриваемого множества.
Частые коэффициенты могут применяться при отборе факторов воздействия, определении степени их значимости при воздействии на изучаемый объект. Для этих целей строится уравнение репрессии, которое отслеживает факторы по размеру их коэффициента. На каждом шаге исключается частный корреляционный коэффициент с наименьшим значением.
Перед применением частных коэффициентов множество данных тестируется на установление линейных связей. Если связи отсутствуют, то далее осуществляет анализ связи исследуемого объекта и факторов. Частные коэффициенты взаимосвязей позволяют сопоставить взаимное влияние величин и факторов друг на друга для общих отношений и частных соприкосновений.
Значения частного коэффициента корреляции означают следующее:
- Если R = 0, то взаимосвязь нейтральная, влияния нет.
- Значение коэффициента в промежутке от 0,09 до 0,19 говорит о незначительной слабой связи.
- Слабая связь устанавливается в диапазоне от 0,19 до 0,49
- Средняя взаимосвязь от 0,49 до 0,69
- Сильная связь от 0,69 до 0, 99.
Замечание 2
Частный коэффициент корреляции применяется в эконометрике для того, чтобы отслеживать изменение экономического процесса или явления под воздействием внутренних и внешних факторов.
Как восстановить доступ к аккаунту
Если пароль к учетной записи Гугл потерян, то рекомендуем воспользоваться сервисом Google Account Recovery. Алгоритм действий следующий:
- Переходят на страницу услуги. Процедуру удобнее проводить на ПК.
- В открывшемся окне выбирают диалог «Не помню пароль». Жмут кнопку «Затрудняюсь ответить».
- Отмечают режим восстановления при помощи сообщения на привязанный телефон. Приходит СМС с цифровым кодом подтверждения.
- В открывшемся окне вводят комбинацию, жмут ОК.
- Сервис советует придумать и ввести новый пароль к учетной записи. Изменения сохраняют.
§ 8. Методика вычисления выборочного коэффициента корреляции
Пусть требуется
по данным корреляционной таблицы
вычислить выборочный коэффициент
корреляции. Можно значительно упростить
расчет, если перейти к условным вариантам
(при этом величина rв
не изменится)
ui=(xi—С1)/h1
и υj=(yj—С2)/h2.
В этом случае
выборочный коэффициент корреляции
вычисляют по формуле
.
Величины u,
υ
и
можно найти методом произведений (см.
гл. XVII, § 4), а при малом числе данных—
непосредственно исходя из определений
этих величин. Остается указать способ
вычисления ,
где —
частота пары
условных вариант (u,
υ).
Можно доказать,
что справедливы формулы (см. пояснение
в конце параграфа):
,
где
,
,
где
.
Для контроля
целесообразно выполнить расчеты по
обеим формулам и сравнить результаты;
их совпадение свидетельствует о
правильности вычислений.
Покажем на примере,
как пользоваться приведенными формулами.
Пример 1.
Вычислить ^ «по»» П0
данным корреляционной табл. 14.
Таблица 14
Y |
X |
ny |
|||||
10 |
20 |
30 |
40 |
50 |
60 |
||
15 |
5 |
7 |
— |
— |
— |
— |
12 |
25 |
— |
20 |
23 |
— |
— |
— |
43 |
35 |
— |
— |
30 |
47 |
2 |
— |
79 |
45 |
— |
— |
10 |
11 |
20 |
6 |
47 |
55 |
— |
— |
— |
9 |
7 |
3 |
19 |
nx |
5 |
27 |
63 |
67 |
29 |
9 |
n=200 |
Решение. Перейдем
к условным вариантам: ui=(xi—С1)/h1
= = (xi
—40)/10 (в качестве
ложного нуля С1
взята варианта х=40.
расположенная
примерно в середине вариационного ряда;
шаг h1
равен разности
между двумя соседними вариантами: 20—10
= 10) и υj=(yj—С2)/h2
= (yj
—35)/10 (в качестве
ложного нуля С2
взята варианта у =35, расположенная в
середине вариационного ряда; шаг h2
равен разности между двумя соседними
вариантами: 25—15=10).
Составим
корреляционную таблицу в условных
вариантах. Практически это делают так:
в первом столбце вместо ложного нуля
С2
(варианты 35) пишут 0; над нулем последовательно
записывают —1,
—2; под нулем пишут 1, 2. В первой строке
вместо ложного нуля С1
(варианты 40) пишут 0; слева от нуля
последовательно записывают —1, —2, —3;
справа от нуля пишут 1, 2. Все остальные
данные переписывают из первоначальной
корреляционной таблицы. В итоге получим
корреляционную табл. 15 в условных
вариантах.
Таблица
15
υ |
u |
nυ |
|||||
-3 |
-2 |
— 1 |
1 |
2 |
|||
—2 |
5 |
7 |
— |
— |
— |
— |
12 |
—1 |
— |
20 |
23 |
— |
— |
— |
43 |
— |
— |
30 |
47 |
2 |
— |
79 |
|
1 |
— |
— |
10 |
11 |
20 |
6 |
47 |
2 |
— |
— |
— |
9 |
7 |
3 |
19 |
nu |
5 |
27 |
63 |
67 |
29 |
9 |
n = |
Теперь для вычисления
искомой суммы составим
расчетную табл. 16. Пояснения к составлению
табл. 16:
1. В каждой клетке,
в которой частота nuυ
≠ 0, записывают
в правом верхнем углу произведение
частоты nuυ
на варианту u.
Например, в
правых верхних углах клеток первой
строки записаны произведения: 5·(—3) =
—15; 7·(—2) = —14.
2. Складывают все
числа, помещенные в правых верхних углах
клеток одной строки и их сумму записывают
в клетку этой же строки столбца u.
Например, для первой строки
U
== —15+(—14)= —29.
3. Умножают варианту
υ
на U
и полученное произведение заци-сывают
в последнюю клетку той же строки, т. е.
в клетку столбца υU.
Например,
в первой строке таблицы υ
= —2,
U
= —29; следовательно, υU
= (—2)·(—29) = 58.
4. Наконец, сложив
все числа столбца υU,
получают сумму
,
которая равна искомой сумме .
Например, для табл.
16 имеем
=
169; следовательно, искомая сумма =
169.
Таблица 16
υ |
u ч 1 |
U= = |
υU |
|||||
-3 |
-2 |
—1 |
1 |
2 |
||||
-2 |
—15 5 -10 |
-14 7 -14 |
— |
— |
— |
— |
—29 |
58 |
-1 |
— |
—40 20 -20 |
—23 23 —23 |
— |
— |
— |
-63 |
63 |
— |
— |
-30 30 |
47 |
2 2 |
— |
—28 |
||
1 |
— |
— |
—10 10 10 |
11 11 |
20 20 20 |
12 6 6 |
22 |
22 |
2 |
— |
— |
— |
9 18 |
7 7 14 |
6 3 6 |
13 |
26 |
V= = |
—10 |
-34 |
—13 |
29 |
34 |
12 |
= |
|
uV |
30 |
68 |
13 |
34 |
« |
==169 |
Контроль |
Для контроля
аналогичные вычисления производят по
столбцам:
произведения nuυυ
записывают в левый нижний угол клетки,
содержащей частоту nuυυ
≠ 0; все числа,
помещенные в левых нижних углах клеток
одного столбца, складывают и их сумму
записывают в строку V;
далее умножают каждую варианту u
на V
и результат записывают в клетках
последней строки.
Наконец, сложив
все числа последней строки, получают
сумму
,
которая также равна искомой сумме .
Например, для табл.
16 имеем
=
169; следовательно,= 169.
Теперь, когда мы
научились вычислять ,
приведем пример на отыскание выборочного
коэффициента корреляции.
9.1.2. Проверка статистических гипотез о связи переменных
Выборочный коэффициент корреляции оценивает подразумеваемую исследователем реальную связь между переменными. Как и в случае оценки среднего значения, нас интересуют два вопроса: (1) Насколько сильна связь между переменными; (2) Насколько надежна наша оценка. Сила связи между переменными по всей генеральной совокупности существует объективно. Если ее измерять корреляцией, то она будет выражаться числом от −1 до 1. Выборочная корреляция этих переменных будет колебаться вокруг истинного показателя силы связи. Трудность состоит в том, что, получив выборочную корреляцию, мы не можем знать, ни насколько она отклоняется от истинного значения, ни даже в какую сторону. В случае корреляции оценка обычно выражается в терминах значимости.
Проделаем небольшое упражнение.
Упражнение 9.1.2(1). Возьмите две симметричные монеты достоинством в один рубль и один евро. Проведите серию четырех подбрасываний пары монет и запишите результаты в виде \( (x_1, y_1),\dots,(x_4, y_4) \) , полагая
\( x_i=0 \), если рубль выпал цифрой;
\( x_i=1 \), если рубль выпал гербом;
\( y_i=0 \), если евро выпал цифрой;
\( y_i=1 \), если евро выпал гербом.
Подсчитайте коэффициент корреляции Пирсона. Истинная корреляция между результатами двух монет равна, разумеется, нулю. Повторите процедуру несколько раз и убедитесь, что нулевое значение выборочного коэффициента корреляции выпадает примерно один раз из трех. При многократном повторении опыта можно убедиться, что его результат имеет некоторое распределение, симметричное относительно нуля. Это распределение зависит от объема выборки n: чем больше n, тем меньше дисперсия распределения, тем ближе к нулю ее вероятные значения.
В таблице 9.1.2(2) приведены двухсторонние квантили распределения выборочного коэффициента корреляции по Пирсону для \( n=10 \). Они рассчитаны для выборок, полученных испытаниями двух нормально распределенных случайных величин, теоретическая корреляция между которыми равна нулю. Дихотомический результат подбрасывания монеты не распределен нормально, однако некоторое представление о возможных результатах наших испытаний табличный квантиль все же дает.
Таблица 9.1.2(2) Двусторонние квантили распределения коэффициента Пирсона для n = 10
\( \alpha \) | 0.05 | 0.025 | 0.01 | 0.005 |
\( r_\alpha(10) \) | 0.497 | 0.576 | 0.658 | 0.709 |
Обычно при исследовании связи переменных статистической гипотезой \( H_0 \) будет гипотеза об отсутствии связи, т.е. о независимости переменных. Альтернативная гипотеза \( H_1 \) (т.е. гипотеза, к которой мы склоняемся, получив большие по модулю значения выборочной корреляции) будет утверждать только наличие связи . Можно оценить значимость относительно данного результата (полученной парной выборки) гипотез о других значениях теоретической корреляции, но это требует некоторых дополнительных усилий (см. подпараграф ). Если истинна гипотеза \( H_0 \), то выборочный коэффициент корреляции будет принимать значения, более или менее близкие к нулю. Если выборочная корреляция принимает достаточно большое по модулю значение, которому соответствует значимость, измеряемая маленьким числом, то мы склоняемся к гипотезе \( H_1 \) о наличии связи, но без указания точного значения теоретической корреляции.
Можно заметить, что если верна гипотеза об отсутствии зависимости между случайными величинами, то выборочный коэффициент при \( n=10 \) может принимать тем не менее довольно большие значения, так что уровень значимости 0.05 для принятия гипотезы о зависимости случайных величин требует, чтобы выборочный коэффициент корреляции достигал почти 0.5 (см. ). В связи с этим надо иметь в виду, что даже выборочная корреляция, например 0.6, вполне может согласовываться с истинной корреляцией, равной 0.2 .
От Google
Предвзятость средств массовой информации
Рассмотрим, как наличие корреляционной связи может быть неправильно истолковано. Группу британских студентов, отличающихся плохим поведением, опросили относительно того, курят ли их родители. Потом тест опубликовали в газете. Результат показал сильную корреляцию между курением родителей и правонарушениями их детей. Профессор, который проводил это исследование, даже предложил поместить на пачки сигарет предупреждение об этом. Однако существует целый ряд проблем с таким выводом. Во-первых, корреляция не показывает, какая из величин является независимой. Поэтому вполне можно предположить, что пагубная привычка родителей вызвана непослушанием детей. Во-вторых, нельзя с уверенностью сказать, что обе проблемы не появились из-за какого-то третьего фактора. Например, низкого дохода семей. Следует отметить эмоциональный аспект первоначальных выводов профессора, который проводил исследование. Он был ярым противником курения. Поэтому нет ничего удивительного в том, что он интерпретировал результаты своего исследования именно так.
Расчет коэффициента корреляции
Теперь давайте попробуем посчитать коэффициент корреляции на конкретном примере. Имеем таблицу, в которой помесячно расписана в отдельных колонках затрата на рекламу и величина продаж. Нам предстоит выяснить степень зависимости количества продаж от суммы денежных средств, которая была потрачена на рекламу.
Способ 1: определение корреляции через Мастер функций
Одним из способов, с помощью которого можно провести корреляционный анализ, является использование функции КОРРЕЛ. Сама функция имеет общий вид КОРРЕЛ(массив1;массив2).
- Выделяем ячейку, в которой должен выводиться результат расчета. Кликаем по кнопке «Вставить функцию», которая размещается слева от строки формул.
В списке, который представлен в окне Мастера функций, ищем и выделяем функцию КОРРЕЛ. Жмем на кнопку «OK».
Открывается окно аргументов функции. В поле «Массив1» вводим координаты диапазона ячеек одного из значений, зависимость которого следует определить. В нашем случае это будут значения в колонке «Величина продаж». Для того, чтобы внести адрес массива в поле, просто выделяем все ячейки с данными в вышеуказанном столбце.
В поле «Массив2» нужно внести координаты второго столбца. У нас это затраты на рекламу. Точно так же, как и в предыдущем случае, заносим данные в поле.
Жмем на кнопку «OK».
Как видим, коэффициент корреляции в виде числа появляется в заранее выбранной нами ячейке. В данном случае он равен 0,97, что является очень высоким признаком зависимости одной величины от другой.
Способ 2: вычисление корреляции с помощью пакета анализа
Кроме того, корреляцию можно вычислить с помощью одного из инструментов, который представлен в пакете анализа. Но прежде нам нужно этот инструмент активировать.
- Переходим во вкладку «Файл».
В открывшемся окне перемещаемся в раздел «Параметры».
Далее переходим в пункт «Надстройки».
В нижней части следующего окна в разделе «Управление» переставляем переключатель в позицию «Надстройки Excel», если он находится в другом положении. Жмем на кнопку «OK».
В окне надстроек устанавливаем галочку около пункта «Пакет анализа». Жмем на кнопку «OK».
После этого пакет анализа активирован. Переходим во вкладку «Данные». Как видим, тут на ленте появляется новый блок инструментов – «Анализ». Жмем на кнопку «Анализ данных», которая расположена в нем.
Открывается список с различными вариантами анализа данных. Выбираем пункт «Корреляция». Кликаем по кнопке «OK».
Открывается окно с параметрами корреляционного анализа. В отличие от предыдущего способа, в поле «Входной интервал» мы вводим интервал не каждого столбца отдельно, а всех столбцов, которые участвуют в анализе. В нашем случае это данные в столбцах «Затраты на рекламу» и «Величина продаж».
Параметр «Группирование» оставляем без изменений – «По столбцам», так как у нас группы данных разбиты именно на два столбца. Если бы они были разбиты построчно, то тогда следовало бы переставить переключатель в позицию «По строкам».
В параметрах вывода по умолчанию установлен пункт «Новый рабочий лист», то есть, данные будут выводиться на другом листе. Можно изменить место, переставив переключатель. Это может быть текущий лист (тогда вы должны будете указать координаты ячеек вывода информации) или новая рабочая книга (файл).
Когда все настройки установлены, жмем на кнопку «OK».
Так как место вывода результатов анализа было оставлено по умолчанию, мы перемещаемся на новый лист. Как видим, тут указан коэффициент корреляции. Естественно, он тот же, что и при использовании первого способа – 0,97. Это объясняется тем, что оба варианта выполняют одни и те же вычисления, просто произвести их можно разными способами.
Как видим, приложение Эксель предлагает сразу два способа корреляционного анализа. Результат вычислений, если вы все сделаете правильно, будет полностью идентичным. Но, каждый пользователь может выбрать более удобный для него вариант осуществления расчета.
Опишите, что у вас не получилось.
Наши специалисты постараются ответить максимально быстро.
Выборочный коэффициент корреляции
Коэффициент корреляции обычно рассчитывают по выборке. Значит, у аналитика в распоряжении не истинное значение, а оценка, которая всегда ошибочна. Если выборка была репрезентативной, то истинное значение коэффициента корреляции находится где-то относительно недалеко от оценки. Насколько далеко, можно определить через доверительные интервалы.
Согласно Центральное Предельной Теореме распределение оценки любого показателя стремится к нормальному с ростом выборки. Но есть проблемка. Распределение коэффициента корреляции вблизи придельных значений не является симметричным. Ниже пример распределения при истинном коэффициенте корреляции ρ = 0,86.
Предельное значение не дает выйти за 1 и, как бы «поджимает» распределение справа. Симметричная ситуация наблюдается, если коэффициент корреляции близок к -1.
В общем рассчитывать на свойства нормального распределения нельзя. Поэтому Фишер предложил провести преобразование выборочного коэффициента корреляции по формуле:
Распределение z для тех же r имеет следующий вид.
Намного ближе к нормальному. Стандартная ошибка z равна:
Далее исходя из свойств нормального распределения несложно найти верхнюю и нижнюю границы доверительного интервала для z. Определим квантиль стандартного нормального распределения для заданной доверительной вероятности, т.е. количество стандартных отклонений от центра распределения.
cγ – квантиль стандартного нормального распределения;N-1 – функция обратного стандартного распределения;γ – доверительная вероятность (часто 95%).Затем рассчитаем границы доверительного интервала.
Нижняя граница z:
Верхняя граница z:
Теперь обратным преобразованием Фишера из z вернемся к r.Нижняя граница r:
Верхняя граница r:
Это была теоретическая часть. Переходим к практике расчетов.