Статистика сложна. Для новичков начало изучения статистики может быть болезненным, если у них нет необходимых ресурсов, на которых можно учиться. Что ж, это мой третий блог по статистике, я очень рад начать с концепции корреляции против регрессии. Итак, давайте сначала поймем это.

Корреляция против регрессии - оба этих термина статистики, которые используются для измерения и анализа связей между двумя разными переменными и используются для составления прогнозов. Этот метод широко используется в различных отраслях промышленности; Помимо этого, он используется в повседневной жизни.

Например, вы можете увидеть, что кто-то носит дорогую одежду; вы автоматически думаете, что он / она может быть финансово успешным. Другой пример: вы думаете, чтобы похудеть, тренируясь по утрам, а затем начинаете бегать со следующего утра.

Вышеупомянутые примеры представляют собой реальные примеры корреляции против регрессии, поскольку одна переменная, то есть дорогая одежда, напрямую связана с другими переменными, то есть с богатством. Поэтому мы предоставили вам список сходств и различий корреляции и регрессии.

Какая взаимосвязь?

Поскольку корреляция сама по себе дает вам значение слова, то «со» означает вместе, а «отношение» означает связь или связь между двумя величинами. Или мы можем сказать, что если переменная изменится, то другая переменная автоматически изменится, может ли это быть прямо или косвенно.

Например, предположим, что у нас есть две разные переменные x и y. Изменения этих двух переменных принимаются как положительные или отрицательные. Всякий раз, когда две переменные изменяются в одном направлении. Или мы можем сказать, что если одна переменная увеличивается, то вторая переменная также увеличивается, тогда изменение считается положительным.

Формула соотношения

Коэффициент корреляции используется для обозначения данных о взаимосвязи между двумя переменными по следующей формуле:

Где

  • rxy - коэффициент корреляции переменных x и y.
  • xi - значение переменной x является представлением.
  • - среднее значение переменной x.
  • yi - значения переменной y в представлении.
  • ȳ - среднее значение переменной y.

Существует несколько распространенных типов тестов для измерения корреляции, а именно: Пирсон, рейтинг Спирмена и Кендалл Тау. У каждого есть свои собственные предположения о данных, которым необходимо соответствовать, чтобы тест мог точно измерить уровень корреляции. Это обсуждается далее в посте. Каждый тип корреляционного теста проверяет следующую гипотезу.

Гипотеза H0: между переменной 1 и переменной 2 нет связи.

Гипотеза высокой доступности: существует связь между переменной 1 и переменной 2.

Если полученное значение p меньше тестируемого, то можно констатировать, что между переменными существует значимая взаимосвязь. В большинстве полей используется альфа-уровень 0,05, который я также буду использовать.

Есть несколько типов корреляции:

  • Положительная корреляция: по мере увеличения одной переменной увеличивается и другая.

  • Отрицательная (обратная) корреляция: по мере увеличения одной переменной значение другой уменьшается.

  • Нет корреляции: нет связи между изменениями двух переменных.

Сила корреляции имеет значение. Чем ближе абсолютное значение к -1 или 1, тем сильнее корреляция.

Значение r Сила 0,0–0,2 Слабая корреляция 0,3–0,6 Умеренная корреляция 0,7–1,0 Сильная корреляция

Допущения корреляции Пирсона

Корреляционный тест Пирсона - это параметрический тест, который делает предположения о данных. Чтобы результаты теста корреляции Пирсона были действительными, данные должны соответствовать следующим предположениям:

  • Выборка составляется независимо и случайным образом.
  • Присутствует линейная зависимость между двумя переменными.
  • При нанесении линии образуют линию и не изогнуты.
  • Есть однородность дисперсии

Переменные, используемые в тесте корреляции, должны быть непрерывными и измеряться либо на основе пропорциональных, либо на интервальных продажах, каждая переменная должна иметь равное количество не пропущенных наблюдений, и не должно быть никаких выбросов.

Предположения ранговой корреляции Спирмена

Ранговая корреляция Спирмена - это непараметрический тест, который не делает никаких предположений о распределении данных. Допущение для теста ранговой корреляции Спирмена:

  • Между тестируемыми переменными существует монотонная связь.
  • Монотонная связь существует, когда одна переменная увеличивается вместе с другой.

Для ранговой корреляции Спирмена данные могут использоваться для ранжированных данных, если данные не распределены нормально и даже если нет однородности дисперсии.

Допущения Кендалла о корреляции тау

Корреляция Тау Кендалла - это непараметрический тест, который не делает никаких предположений о распределении данных. Единственное предположение:

  • Между тестируемыми переменными должна быть монотонная связь.

Данные следует измерять по порядковой, пропорциональной или интервальной шкале.

Что такое регресс?

Регрессия представляет, как одна переменная влияет на другую переменную, или одна переменная может отвечать за изменения в другой переменной. Это означает, что результаты зависят от одной или нескольких переменных.

Например, корреляция используется для определения взаимосвязи между двумя переменными, тогда как регрессия используется для представления влияния друг друга. Например, из-за сильных дождей несколько культур могут быть повреждены. И это тоже могло привести к наводнениям.

Формула регрессии

Регрессия используется для представления отношения между переменной и независимой переменной. Итак, это можно представить как:

Где:

  • Y - зависимая переменная.
  • X - независимая переменная.
  • a - перехват.
  • b - уклон.
  • ϵ - ошибка (Остаточная).

Теперь, прежде чем переходить к различиям корреляции и регрессии, давайте выясним их сходство.

Сходство обеих корреляций и регрессии

  • Обе терминологии используются для количественной оценки силы и направления взаимосвязи между двумя переменными.
  • Есть определенный момент, когда корреляция и наклон регрессии по отдельности отрицательны.
  • И снова наклон корреляции и регрессии может быть положительным.

Различия между корреляцией и регрессией

Помимо сходства, есть некоторые различия, которые перечислены ниже:

Параметр корреляции и регрессии:

Определение: корреляция используется для измерения статистики, определяющей связь между двумя переменными. Регрессия используется для представления связи между независимыми и зависимыми переменными.

Использование: корреляция используется, чтобы показать линейную связь между двумя переменными. Регрессия используется для получения наилучших данных и оценки одной переменной на основе других переменных.

Независимые и зависимые переменные: в корреляции t нет разницы между обеими переменными. В регрессии обе переменные отличаются друг от друга.

Укажите: коэффициент корреляции показывает степень, в которой значения двух переменных изменяются вместе. Регрессия означает влияние изменений в единицах, которые известны как переменная (X) оцениваемой переменной (Y).

Цель: корреляция помогает получить связь выражений числовых значений между переменными. Регрессия помогает определять значения выбранных переменных на основе фиксированных переменных.

Представление данных: корреляция представляет собой одну точку. Регрессия может обозначать данные линией.

Используйте математические уравнения. Нет, Корреляция не имеет прямой связи между математическими уравнениями. Да, существует прямая связь между математическими уравнениями в Регрессии.

Заключение

Вышеупомянутое обсуждение корреляции против регрессии показывает, что есть сходства и различия между двумя математическими концепциями, хотя оба изучаются вместе. Корреляция используется исследователями, когда они хотят знать, коррелирована или нет исследуемая переменная, если это так. Тогда в чем сила ассоциации. Принимая во внимание, что регрессионный анализ используется, чтобы получить функциональную взаимосвязь между двумя переменными, чтобы сделать дальнейшие прогнозы событий.

Спасибо за прочтение. Я собираюсь писать больше постов для новичков в будущем. Следите за мной, чтобы быть в курсе о них.

Хлопайте, если статья вам понравилась!