Альфа Кронбаха — Вікіпедія
Альфа Кронбаха | |
Названо на честь | Lee Cronbachd |
---|
Тау-еквівалентна надійність ()[1] — коефіцієнт надійності тесту з одноразовим застосуванням (тобто надійність осіб над предметами, які мають фіксований випадок[2]), коефіцієнт, який зазвичай називають альфа або коефіцієнт альфа Кронбаха . є найвідомішим і найчастіше використовується серед коефіцієнтів надійності, але останні дослідження рекомендують не використовувати його беззастережно.[3][4][5][6][7][8] Коефіцієнти надійності на основі моделювання структурних рівнянь часто рекомендуються як його альтернатива.
Формула та розрахунок[ред. | ред. код]
Систематична та звичайна формула[ред. | ред. код]
Значенням позначають спостережуваний бал предмета і позначають суму всіх предметів тесту, що складається з предметів. Значенням позначають коваріацію між і , позначають дисперсію , і позначають дисперсію . складається з варіацій елементів та міжпозиційних коваріацій. Це є, . Значенням позначають середнє значення міжпозиційних коваріацій. Це є, .
«систематизовано»[1] формулою: > . Більш часто використовується більш важка для розуміння версія формули .
Приклад розрахунку[ред. | ред. код]
При застосуванні до відповідних даних[ред. | ред. код]
застосовується до наступних даних, які задовольняють умові бути тау-еквівалентом.
, ,
,
та .
При застосуванні до невідповідних даних[ред. | ред. код]
застосовується до наступних даних, які не відповідають умові бути тау-еквівалентом.
, ,
,
і .
Порівняйте це значення зі значенням застосування конгенеріальної надійності до одних і тих же даних.
Передумови використання тау-еквівалентної надійності[ред. | ред. код]
Для використання як коефіцієнт надійності, дані повинні відповідати наступним умовам.
1) Невимірність
2) (істотна) тау-еквівалентність
3) Незалежність від помилок
Умови бути паралельними, тау-еквівалентними та конгенеричними[ред. | ред. код]
Паралельна умова[ред. | ред. код]
У ході досліджень паралельні дані мають рівні міжрядкові коваріації (тобто недіагональні елементи матриці коваріації) та рівні дисперсії (тобто діагональні елементи матриці коваріації). Наприклад, наступні дані задовольняють паралельній умові. У паралельних даних, навіть якщо замість коваріаційної матриці використовується матриця кореляції, відсутня втрата інформації . Усі паралельні дані також є еквівалентними тау, але зворотне не відповідає дійсності. Тобто серед трьох умов паралельну умову найважче виконати.
Тау-еквівалентна умова[ред. | ред. код]
Від самого початку, дані тау-еквівалента мають рівні коваріації, але їх відхилення можуть мати різні значення. Наприклад, наступні дані задовольняють умові бути тау-еквівалентом. Усі пункти, що містяться в тау-еквівалентних даних, мають однакову дискримінацію або важливість. Усі тау-еквівалентні дані також є спільними, але зворотне не відповідає дійсності.
Початковий стан[ред. | ред. код]
На рівні популяції конгенеричні дані не повинні мати рівних варіацій або коваріацій, за умови, що вони неоднакові. Наприклад, наведені нижче дані можуть бути на початковому етапі. Усі елементи, що знаходяться в загальних даних, можуть мати різну дискримінацію або значення.
Зв'язок з іншими коефіцієнтами надійності[ред. | ред. код]
Класифікація коефіцієнтів надійності одноразового застосування[ред. | ред. код]
Звичайні назви[ред. | ред. код]
Існують численні коефіцієнти надійності. Серед них умовні назви коефіцієнтів надійності, які пов'язані та часто використовуються, узагальнені так:[1]
Split-half | Невимірний | Багатовимірність | |
---|---|---|---|
Паралельний | Формула Спірмена-Брауна | Стандартизований | (Без умовної назви) |
Тау-еквівалент | Формула Фланагана Формула Рулона Формула Фланагана-Рулона Ґуттмана | Кронбах коефіцієнт Ґуттмана KR-20 Надійність Хойт | Стратифікований |
Породжене | Коефіцієнт Ангоффа-Фельдта Коефіцієнт Раджу (1970) | композитна надійність побудувати надійність спільна надійність коефіцієнт одновимірний Коефіцієнт Раджу (1977) | коефіцієнт всього MdDonald's багатовимірність |
Поєднання назв рядків і стовпців дає передумови для відповідного коефіцієнта надійності. Наприклад, Кронбах і Гуттмана — коефіцієнти надійності, отримані за умови одновимірності та тау-еквівалента.
Систематичні назви[ред. | ред. код]
Звичайні назви невпорядковані та несистемні. Звичайні назви не дають інформації про природу кожного коефіцієнта або не вводять в оману інформації (наприклад, про складову надійність). Звичайні назви непослідовні. Одні — формули, а інші — коефіцієнти. Деякі названі на честь оригінального розробника, деякі названі на честь того, хто не є оригінальним розробником, а інші не містять імені будь-якої людини. У той час як одна формула посилається на кілька імен, на кілька формул посилається однt позначення (наприклад, альфа та омега). Запропоновані систематичні назви та їх позначення для цих коефіцієнтів надійності такі:[1]
Спліт-половина | Невимірний | Багатовимірність | |
---|---|---|---|
Паралельний | роздільна половина паралельної надійності () | паралельна надійність () | багатовимірна паралельна надійність () |
Тау-еквівалент | роздільна половина тау-еквівалентна надійність () | tau-еквівалентна надійність () | багатовимірна тау-еквівалентна надійність () |
Породжене | конгенерична надійність з розділеною половиною () | вроджена надійність () | Біфакторна модель Надійність біфактора () Факторна модель другого порядку Фактор надійності другого порядку () Корельована факторна модель Відповідність коефіцієнта надійності () |
Зв'язок з паралельною надійністю[ред. | ред. код]
часто називають коефіцієнтом альфа і часто називають стандартизованою альфа. Через стандартизований модифікатор часто помиляється за більш стандартну версію, ніж . Немає історичної підстави, на яку можна посилатися як стандартизована альфа. Кронбах (1951)[9] не називав цей коефіцієнт альфа, і не рекомендував його використовувати. рідко використовувався до 1970-х років[10] . Використання не рекомендується, оскільки паралельну умову важко виконати в реальних даних.
Зв'язок з роздільною половиною тау-еквівалентної надійності[ред. | ред. код]
дорівнює середньому значенню значення, отримані для всіх можливих розділених половин. Цей взаємозв'язок, доведений Кронбахом (1951)[9], часто використовується для пояснення інтуїтивного значення . Однак ця інтерпретація не відображає того, що недооцінює надійність при застосуванні до даних, які не є тау-рівнозначними. Максимум усіх можливих значення ближче до надійності, ніж середнє серед усіх можливих значення.[6] Цей математичний факт був відомий ще до публікації Кронбаха (1951).[11] Порівняльне дослідження[12] повідомляє, що максимум є найбільш точним коефіцієнтом надійності.
Revelle (1979)[13] відноситься до мінімуму всього можливого значення як коефіцієнт , і рекомендує це надає додаткову інформацію, яка не.[5]
Взаємозв'язок з конгенеріальною надійністю[ред. | ред. код]
Якщо припущення про одновимірність та тау-еквівалентності виконуються, дорівнює .
Якщо одновимірність задоволена, але тау-еквівалентність не задоволена, то менше, ніж [6] .
є найбільш часто використовуваним коефіцієнтом надійності після . Користувачі, як правило, представляють і те, і інше, а не замінюють [1] .
Дослідження в яких були представлені обидва коефіцієнта, повідомляє про це на .02 менше, ніж в середньому.[14]
Зв'язок з багатовимірними коефіцієнтами надійності та [ред. | ред. код]
Якщо застосовується до багатовимірних даних, його значення менше коефіцієнтів багатовимірної надійності і більше, ніж .[1]
Зв'язок із співвідношенням між класом[ред. | ред. код]
дорівнює версії посиленої консистенції коефіцієнта кореляції внутрішньокласового рівня, який зазвичай використовується в спостережних дослідженнях. Але це лише умовно. Щодо дисперсійних компонентів, ця умова стосується вибірки предмета: якщо і лише тоді, коли значення елемента (у випадку рейтингу) дисперсійної складової дорівнює нулю. Якщо цей дисперсійний компонент негативний, буде недооцінювати посилений коефіцієнт кореляції в межах класу ; якщо цей дисперсійний компонент позитивний, переоцінить цей посилений коефіцієнт кореляції внутрішньокласного типу .
Історія[10][ред. | ред. код]
До 1937 року[ред. | ред. код]
[15][16] був єдиним відомим коефіцієнтом надійності. Проблема полягала в тому, що оцінки надійності залежали від того, як елементи були розділені навпіл (наприклад, непарні / парні або спереду / ззаду). Критика висловлювалася проти цієї недостовірності, але більше двох десятиліть науковці не могли дійти спільної думки.[17]
Кудер і Річардсон (1937)[ред. | ред. код]
Кудер та Річардсон (1937)[18] розробили кілька коефіцієнтів надійності, які могли б подолати проблему . Вони не давали конкретних назв коефіцієнтам надійності. Рівняння 20 у їхній статті є . Цю формулу часто називають формулою Кудера-Річардсона 20 або KR-20. Вони мали справу з випадками, коли спостережувані бали були дихотомічними (наприклад, правильними чи неправильними), тому вираз KR-20 дещо відрізняється від звичайної формули . Огляд цього документу виявляє, що вони не представили загальної формули тому, що їм не потрібно, а не тому, що не могли. Дозволяє позначають правильне співвідношення відповідей предмета , і позначають неправильне співвідношення відповідей предмета (). Формула KR-20 така.
З тих пір , КР-20 і мають однакове значення.
Між 1937 і 1951 роками[ред. | ред. код]
Дослідження загальної формуиу KR-20[ред. | ред. код]
Кудер і Річардсон (1937) висловили непотрібні припущення . Проведено кілька досліджень іншим способіом, ніж це робили Кудер та Річардсон (1937).
Hoyt (1941)[19] похідний за допомогою ANOVA (аналіз дисперсії). Кирила Хойта можна вважати першим розробником загальної формули КР-20, але він прямо не представив формулу .
Перший вираз сучасної формули з'являється у Джексона та Фергюсона (1941)[20] . Представлена ними версія наступна. Едгертон і Томпсон (1942)[21] використовували ту саму версію.
Ґуттман (1945)[11] вивів шість формул надійності, кожну з яких позначав . Луї Ґуттман довів, що всі ці формули завжди були меншими або рівними надійності, і виходячи з цих характеристик, він назвав ці формули «нижчими межами надійності». Ґуттмана є , і є . Він це довів завжди більше або дорівнює (тобто точніше). У той час усі обчислення проводилися папером та олівцем, а з формули було простіше обчислити, він це згадав був корисний за певних умов.
Гулліксен (1950)[22] дослідив з меншою кількістю припущень, ніж попередні дослідження. Припущення, яке він використав, є суттєвою тау-еквівалентністю в сучасних умовах.
Визнання оригінальної формули та загальної формули KR-20 на той час[ред. | ред. код]
Дві формули були визнані абсолютно однаковими, і вираз загальної формули KR-20 не використовувався. Хойт[19] пояснив, що його метод «дає точно такий же результат», як і KR-20. Джексон та Фергюсон[20] констатували, що дві формули є «однаковими». — сказав Гуттман[11] є «алгебраїчно ідентичним» KR-20 (с.275). Гулліксен[22] також визнав, що дві формули є «однаковими».
Навіть дослідження, критичні щодо KR-20, не вказували на те, що оригінальну формулу KR-20 можна було застосувати лише до дихотомічних даних.[23]
Кронбах (1951)[ред. | ред. код]
Як і в попередніх дослідженнях[19][11][20][22], Кронбах (1951)[9] винайшов інший метод отримання . Його інтерпретація була інтуїтивно привабливішою, ніж у попередніх дослідженнях. Тобто він довів, що дорівнює середньому значення, отримані для всіх можливих розділених половин. Він критикував те, що назва KR-20 була дивною, і запропонував нову назву, коефіцієнт альфа. Його підхід досяг величезного успіху. Однак він не лише опустив деякі ключові факти, але й дав неправильне пояснення.
По-перше, він позиціонував коефіцієнт альфа як загальну формулу KR-20, але опустив пояснення, що існуючі дослідження опублікували точно однакову формулу. Ті, хто читав лише Кронбаха (1951) без попередніх знань, можуть неправильно зрозуміти, що він першим розробив загальну формулу KR-20.
По-друге, він не пояснив, за якої умови дорівнює надійності. Неексперти можуть помилково вважати загальним коефіцієнтом надійності, який можна було використовувати для всіх даних незалежно від необхідних умов.
По-третє, він не пояснив, чому змінив своє ставлення до . Зокрема, він не дав чіткої відповіді на проблему недооцінки , яку він сам критикував[23] .
По-четверте, він стверджував, що висока цінність у демонстрації однорідності даних.
Після 1951 року[ред. | ред. код]
Новік і Льюїс (1967)[24] довели необхідну і достатню умову , що дорівнює надійності і назвали його умовою бути по суті тау-еквівалентом.
Кронбах (1978)[2] зазначав, що причина, по якій Кронбах (1951) отримала багато цитат, була «здебільшого тому, що [він] поставив фірмове найменування на загальний коефіцієнт»[1] . Він пояснив, що спочатку планував називати інші типи коефіцієнтів надійності (наприклад, надійність між рейтингами або надійність тестування для повторного тестування) грецькими буквами (наприклад, , , ), але згодом передумав.
Кронбах та Шавельсон (2004)[25] спонукали читачів скоріше використовувати теорію узагальнення . Вони виступали проти використання імені Кронбах альфа. Безпосередньо заперечували існування поперднх досліджень, які опублікували загальну формулу KR-20 до Кронбаха (1951).
Виведення формули[1][ред. | ред. код]
Припущення 1. Спостережуваний бал предмета складається з істинної оцінки предмета та помилки предмета, яка не залежить від істинної оцінки.
Лема
Припущення 2. Помилки не залежать одна від одної.
Припущення 3. (Припущення, що по суті є тау-еквівалентом) Справжній бал предмета складається з істинного бала, загального для всіх предметів, і константи елемента.
Значенням позначають суму пункту справжніх балів.
Дисперсія називається справжньою дисперсією балів.
Визначення. Надійність — це відношення справжньої дисперсії балів до спостережуваної дисперсії балів.
З наведених припущень встановлюється наступне співвідношення.
Тому матриця коваріації між елементами виглядає наступним чином.
Відповідно, дорівнює середній коваріації між предметами. Це є,
Значенням позначають надійність при задоволенні зазначених вище припущень. є:
Примітки[ред. | ред. код]
- ↑ а б в г д е ж и Cho, E. (2016). Making reliability reliable: A systematic approach to reliability coefficients. Organizational Research Methods, 19(4), 651—682. https://doi.org/10.1177/1094428116656239
- ↑ а б Cronbach, L. J. (1978). Citation classics. Current Contents, 13, 263.
- ↑ Sijtsma, K. (2009). On the use, the misuse, and the very limited usefulness of Cronbach's alpha. Psychometrika, 74(1), 107—120. https://doi.org/10.1007/s11336-008-9101-0
- ↑ Green, S. B., & Yang, Y. (2009). Commentary on coefficient alpha: A cautionary tale. Psychometrika, 74(1), 121—135. https://doi.org/10.1007/s11336-008-9098-4
- ↑ а б Revelle, W., & Zinbarg, R. E. (2009). Coefficients alpha, beta, omega, and the glb: Comments on Sijtsma. Psychometrika, 74(1), 145—154. https://doi.org/10.1007/s11336-008-9102-z
- ↑ а б в Cho, E., & Kim, S. (2015). Cronbach's coefficient alpha: Well known but poorly understood. Organizational Research Methods, 18(2), 207—230. https://doi.org/10.1177/1094428114555994
- ↑ McNeish, D. (2017). Thanks coefficient alpha, we'll take it from here. Psychological Methods, 23(3), 412—433. https://doi.org/10.1037/met0000144
- ↑ Raykov, T., & Marcoulides, G. A. (2017). Thanks coefficient alpha, we still need you! Educational and Psychological Measurement, 79(1), 200—210. https://doi.org/10.1177/0013164417725127
- ↑ а б в Cronbach, L.J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16 (3), 297—334. https://doi.org/10.1007/BF02310555
- ↑ а б Cho, E. and Chun, S. (2018), Fixing a broken clock: A historical review of the originators of reliability coefficients including Cronbach's alpha. Survey Research, 19(2), 23–54.
- ↑ а б в г Guttman, L. (1945). A basis for analyzing test-retest reliability. Psychometrika, 10(4), 255—282. https://doi.org/10.1007/BF02288892
- ↑ Osburn, H. G. (2000). Coefficient alpha and related internal consistency reliability coefficients. Psychological Methods, 5(3), 343—355. https://doi.org/10.1037/1082-989X.5.3.343
- ↑ Revelle, W. (1979). Hierarchical cluster analysis and the internal structure of tests. Multivariate Behavioral Research, 14(1), 57–74. https://doi.org/10.1207/s15327906mbr1401_4
- ↑ Peterson, R. A., & Kim, Y. (2013). On the relationship between coefficient alpha and composite reliability. Journal of Applied Psychology, 98(1), 194—198. https://doi.org/10.1037/a0030767
- ↑ Brown, W. (1910). Some experimental results in the correlation of metnal abilities. British Journal of Psychology, 3(3), 296—322. https://doi.org/10.1111/j.2044-8295.1910.tb00207.x
- ↑ Spearman, C. (1910). Correlation calculated from faulty data. British Journal of Psychology, 3(3), 271—295. https://doi.org/10.1111/j.2044-8295.1910.tb00206.x
- ↑ Kelley, T. L. (1924). Note on the reliability of a test: A reply to Dr. Crum's criticism. Journal of Educational Psychology, 15(4), 193—204. https://doi.org/10.1037/h0072471
- ↑ Kuder, G. F., & Richardson, M. W. (1937). The theory of the estimation of test reliability. Psychometrika, 2(3), 151—160. https://doi.org/10.1007/BF02288391
- ↑ а б в Hoyt, C. (1941). Test reliability estimated by analysis of variance. Psychometrika, 6(3), 153—160. https://doi.org/10.1007/BF02289270
- ↑ а б в Jackson, R. W. B., & Ferguson, G. A. (1941). Studies on the reliability of tests. University of Toronto Department of Educational Research Bulletin, 12, 132.
- ↑ Edgerton, H. A., & Thomson, K. F. (1942). Test scores examined with the lexis ratio. Psychometrika, 7(4), 281—288. https://doi.org/10.1007/BF02288629
- ↑ а б в Gulliksen, H. (1950). Theory of mental tests. John Wiley & Sons. https://doi.org/10.1037/13240-000
- ↑ а б Cronbach, L. J. (1943). On estimates of test reliability. Journal of Educational Psychology, 34(8), 485—494. https://doi.org/10.1037/h0058608
- ↑ Novick, M. R., & Lewis, C. (1967). Coefficient alpha and the reliability of composite measurements. Psychometrika, 32(1), 1–13. https://doi.org/10.1007/BF02289400
- ↑ Cronbach, L. J., & Shavelson, R. J. (2004). My Current Thoughts on Coefficient Alpha and Successor Procedures. Educational and Psychological Measurement, 64(3), 391—418. https://doi.org/10.1177/0013164404266386
Посилання[ред. | ред. код]
- Підручник з альфа-SPSS Cronbach [Архівовано 18 липня 2020 у Wayback Machine.]
- Безкоштовний вебінтерфейс та пакет кокронів R [1] [Архівовано 26 листопада 2015 у Wayback Machine.] дозволяє статистично порівняти два чи більше залежних або незалежних альфа-коефіцієнтів cronbach.
Література[ред. | ред. код]
- Кронбах, Лі; Coefficient alpha and the internal structure of tests; Psychometrika, 16, 297—334; 1951
- Шмітт, Ніл; Uses and Abuses of Coefficient Alpha [Архівовано 15 вересня 2006 у Wayback Machine.]; Psychological Assessment, 8(4); S. 350—353; 1996