Інтервал довіри

Що таке інтервал довіри:

Це оцінка діапазону, що використовується в статистиці, яка містить параметр популяції. Цей невідомий параметр популяції виявляється за допомогою зразкової моделі, обчисленої з зібраних даних .

Приклад: середнє зразка, зібране x̅, може або не може відповідати істинному середньому населенню μ. Для цього можна розглянути діапазон вибіркових засобів, де це середнє населення може міститися. Чим довший цей інтервал, тим більша ймовірність цього.

Довірчий інтервал виражається у відсотках, деномінованих за рівнем довіри, причому 90%, 95% і 99% є найбільш вказаними. На зображенні нижче, наприклад, ми маємо 90% довірчий інтервал між його верхньою і нижньою межами (a і -a ).

Приклад інтервалу впевненості 90% між його верхньою (a) і нижчою (-a) межами.

Інтервал довіри є одним з найважливіших понять у тестуванні гіпотез у статистиці, оскільки він використовується як міра невизначеності. Термін був введений польським математиком і статистиком Єжи Нейманом у 1937 році.

Яка актуальність інтервалу довіри?

Довірчий інтервал важливий для позначення межі невизначеності (або неточності) щодо зробленого розрахунку. Цей розрахунок використовує досліджуваний зразок для оцінки фактичного розміру результату у вихідній популяції.

Обчислення довірчого інтервалу є стратегією, яка враховує вибірку помилок. Розмір результату вашого дослідження та ваш довірчий інтервал характеризують передбачувані значення для початкової популяції.

Чим менший довірчий інтервал, тим більша ймовірність того, що відсоток досліджуваної популяції представляє реальну кількість вихідної популяції, даючи більшу визначеність щодо результату дослідження об'єкта.

Як інтерпретувати інтервал довіри?

Правильна інтерпретація довірчого інтервалу є, мабуть, найбільш складним аспектом цієї статистичної концепції. Прикладом найбільш поширеної інтерпретації концепції є наступне:

Існує 95% ймовірність того, що в майбутньому справжнє значення параметра популяції (наприклад, середнього) потрапляє в діапазон X (нижня межа) і Y (верхня межа).

Таким чином, довірчий інтервал інтерпретується наступним чином: 95% впевнений, що інтервал між X (нижня межа) і Y (верхня межа) містить справжнє значення параметра популяції.

Було б цілком некоректно стверджувати, що: існує ймовірність 95%, що інтервал між X (нижня межа) і Y (верхня межа) містить реальне значення параметра популяції.

Вищенаведене твердження є найбільш поширеним помилкою про довірчий інтервал. Після обчислення статистичного діапазону, він може містити лише параметр популяції чи ні.

Однак інтервали можуть змінюватися між зразками, тоді як істинний параметр популяції є однаковим незалежно від вибірки.

Отже, довірчий інтервал довіри може бути зроблений тільки в тому випадку, коли довірчі інтервали перераховуються для кількості вибірок.

Етапи обчислення інтервалу довіри

Діапазон розраховується за допомогою наступних кроків:

  • Зберіть дані зразка: n ;
  • Обчислити середнє значення вибірки x̅;
  • Визначити, чи відоме або невідоме стандартне відхилення населення ( σ );
  • Якщо відоме стандартне відхилення населення, то для відповідного рівня достовірності може бути використана z- точка;
  • Якщо стандартне відхилення населення невідоме, ми можемо використовувати статистику t для відповідного рівня довіри;
  • Таким чином, нижня і верхня межі довірчого інтервалу знаходять за допомогою наступних формул:

a) Стандартне відхилення відомої популяції :

Формула для розрахунку стандартного відхилення відомої популяції.

б) Стандартне відхилення невідомої популяції :

Формула для розрахунку стандартного відхилення невідомої популяції.

Практичний приклад довірчого інтервалу

Клінічне дослідження оцінило зв'язок між наявністю астми та ризиком розвитку обструктивної апное сну у дорослих.

Деякі дорослі були випадково набрані зі списку державних службовців, яких слід дотримуватися протягом чотирьох років.

Учасники з астмою, у порівнянні з без них, мали більший ризик розвитку апное протягом чотирьох років.

При проведенні клінічних досліджень, подібних до цього прикладу, для підвищення ефективності дослідження зазвичай набирається підгрупа зацікавленої популяції (менше витрат і менше часу).

Ця підгрупа осіб, що вивчається, складається з тих, хто відповідає критеріям включення і погоджується брати участь у дослідженні, як показано на малюнку нижче.

Пояснювальна графіка популяції, що вивчається в прикладі.

Потім дослідження завершується і розраховується розмір ефекту (наприклад, середня різниця або відносний ризик ), щоб відповісти на питання дослідження.

Цей процес, званий висновком, передбачає використання даних, зібраних з досліджуваної популяції, для оцінки розміру фактичного впливу на популяцію, що представляє інтерес, тобто популяції походження.

У наведеному прикладі дослідники набрали випадкову вибірку державних службовців (населення джерел), які мали право і погодилися брати участь у дослідженні (досліджувана популяція) і повідомили, що астма збільшує ризик розвитку апное в досліджуваній популяції.

Для врахування похибки вибірки, обумовленої набором тільки підгрупи інтересів, вони також обчислили 95% довірчий інтервал (навколо оцінки) 1.06 - 1.82, що вказує на ймовірність 95 %, що справжній відносний ризик у вихідній популяції буде між 1, 06 і ​​1, 82 .

Інтервал довіри для середнього

Якщо є інформація про стандартне відхилення популяції, можна обчислити довірчий інтервал для середнього або середнього значення цієї популяції.

Коли статистична характеристика, яка вимірюється (наприклад, дохід, IQ, ціна, висота, кількість або вага) є чисельною, в більшості випадків вважається, що середня величина для населення знайдена.

Таким чином, ми намагаємося знайти середнє населення ( μ ), використовуючи середнє значення ( ), з похибкою. Результат цього розрахунку називається довірчим інтервалом для середнього числа населення .

Коли відоме стандартне відхилення популяції, формула для довірчого інтервалу (CI) для середнього населення:

Де:

  • - середнє значення вибірки;
  • σ - стандартне відхилення населення;
  • n - розмір вибірки;
  • Represents * представляє відповідне значення стандартного нормального розподілу для бажаного рівня довіри.

Нижче наведені значення для різних рівнів довіри () * ):

Рівень довіриЗначення Z * -
80%1.28
90%1, 645 (звичайний)
95%1.96
98%2.33
99%2.58

У таблиці вище наведені значення z * для рівнів довіри. Зауважимо, що ці значення отримані зі стандартного нормального розподілу (Z-).

Площа між кожним значенням z * і негативним значенням є (приблизний) відсоток довіри. Наприклад, площа між z * = 1, 28 і z = -1, 28 становить приблизно 0, 80. Таким чином, цю таблицю можна також розширити до інших відсотків довіри. У таблиці наведено лише найбільш часто використовувані відсотки довіри.

Див. Також значення гіпотези.