С.П.Іглін

Кореляційний аналіз

Вступ

Ця сторінка призначена для студентів, що вивчають курс теорії ймовірностей та математичної статистики. За її допомогою ви засвоїте тему "Кореляційний аналіз". Безпосередньо зі сторінки ви зможете обробити реальні дані, наприклад, виконати своє ІДЗ, навіть якщо у вас немає на комп’ютері MATLAB. Якщо ж у вас є MATLAB, перейдіть на цю сторінку: там у вас є можливість втрутитися у сценарій (програму) обчислень. А на цій сторінці задача кореляційного аналізу розв’язується за стандартним сценарієм, який зазвичай використовується у ВНЗ при вивченні курсу теорії ймовірностей та математичної статистики.

Для правильної роботи з цією сторінкою ваш браузер повинен підтримувати сценарії Java Script. Увімкніть їх, якщо вони вимкнені.

Введення вхідних даних

Вхідними даними для задачі кореляційного аналізу є багатовівимірні точки. На цій сторінці обробляються лише двовимірні точки, тобто два стовпці X та Y одинакової довжини. Оцінюється кореляція (сила взаємозв’язку) між ними з заданою довірчою ймовірністю.

Для правильної роботи сторінки потрібно, щоб усі експериментальні точки (xi,yi) були записані у звичайному текстовому форматі, 2 числа у рядку: перше − це xi, а друге − yi. Для розділення цілої та дрібної частин використовуємо десятичну точку. Між числами залишаємо хоча б один пробіл. При необхідності можна перед числом проставити знак плюс або мінус. Допускається також експоненційна форма запису чисел, тобто числа виду −1.52345E−0002 чи −1.52345e−0002, що треба розуміти як −1.52345×10−2. Декілька зразків правильного оформлення файлів вхідних даних можна завантажити звідсіля (zip-архів, 2kb, звичайний текстовий файл). Для початку їх можна використати як тестові приклади, а потім взяти свої дані. Крім того, треба задати довірчу ймовірність p для знаходження довірчого інтервалу для генерального коефіцієнта кореляції.

Занесіть ваші числа в область введення, яку ви бачите нижче. У будь-якому рядку повинно бути два числа, відокремлених хоча б одним пробілом. Не ставте між числами нияких інших розділювачів, кріме пробілів: ані ком, ані крапок з комами тощо. Загальна кількість точок повинна бути не менше 5. В наступну область введення занесіть довірчу ймовірність p. Це повинно бути одне число в межах від 0 до 1. Після запису всіх чисел в області введення натисніть кнопку "Рахувати". Скріпт сторінки проведе потрібні розрахунки.

Сюди введіть координати точок (2 числа в рядку):


Сюди введіть довірчу ймовірність p:


Перевірте, чи всі числа введені. Скріпт сторінки не відслідковує помилки, він просто відкидає нечислові дані та пропускає їх. Тому порівняйте кількість введених чисел з тим, що має бути. Якщо все правильно, йдемо далі.

Коефіцієнт кореляції та довірчий інтервал для нього

Для оцінки сили взаємного впливу випадкових величин X та Y обчислюємо вибірковий коефіцієнт кореляції:

де ~mx та ~my − вибіркові математичні сподівання, а ~σx та ~σy − вибіркові середньоквадратичні відхилення.

Тепер за вибірковим коефіцієнтом кореляції ~ρ (точковою оцінкою) можна знайти довірчий інтервал для генерального коефіцієнта кореляції ρ (інтервальну оцінку). Для цього вважаємо ρ реалізацією випадкової величини Ρ. Якщо X та Y є нормальними, то величина

має асимптотично нормальний розподіл з дисперсією 1/(n−3) (для великих об’ємів вибірок з нормально розподіленої двовимірної випадкової величины). Звідсіля можна знайти довірчий інтервал для коефіцієнта кореляції на заданому рівні довірчої ймовірності p.