Грешки при проверка на хипотези, мощност
общ преглед
Повечето хипотези тествани се направи сравнение между група от обекти, които са засегнати от различни фактори.
Например, възможно е да се сравни ефективността на два вида лечение, за да се намали на 5-годишната смъртност от рак на гърдата. За този резултат (т.е. смърт) сравнение на интерес (например, разнообразие от смъртност в 5 години), наречена ефект или, ако е приложимо, на ефекта от лечението.
Нулевата хипотеза се изразява като липса на ефект (например 5-години смъртността от рак на млечната жлеза п идентични в двете групи, се-Ing различно третиране); двустранен алтернативна хипотеза би означавало, че разликата в ефекти не е нула.
Критерият за тестване на хипотезата, дава възможност да се определи дали има достатъчно аргументи, за да отхвърлят нулевата хипотеза. Само една от тези две решения могат да бъдат взети:
- отхвърляне на нулевата хипотеза и приемат алтер-роден хипотеза
- остават в рамките на нулевата хипотеза
Важно: В литературата, доста често концепцията е намерена "приемам нулевата хипотеза." Бих искал да стане ясно, че от статистическа гледна точка, да се приеме нулевата хипотеза не е възможно, защото нулевата хипотеза е достатъчно строг одобрение (например, средните стойности в двете групи са равни).
Затова фразата относно приемането на нулевата хипотеза трябва да се разбира като нещо, ние просто остана в хипотезата.
погрешни решения
Може би най-грешното решение при отхвърляне / не отхвърляме нулевата хипотеза, тъй като има само избрана информация.
Н0 отхвърлен неправилно
(Грешка от първи вид)
H0 е вярно, е отхвърлена
Грешката на първи вид: отхвърляме нулевата хипотеза, когато това е вярно, и заключи, че е налице въздействие, когато в действителност не е така. Максимална шанс (вероятност) от грешка на първия вид е определен алфа (алфа). Това ниво на критерий значение; нулевата хипотеза се отхвърля, ако ни р-стойност по-малко от нивото на значимост, т.е.. д., ако р <α.
Трябва ли да вземе решение за ценностите и преди данните да се събират; обикновено предписаната стойност по подразбиране на 0,05, въпреки че е възможно да се избере по-голяма от граничната стойност, например 0,01.
Шанс да се направи грешка на първо вид никога няма да надвиши избраното ниво значение, казват α = 0,05, като нулевата хипотеза се отхвърля само ако р <0,05. Если обнаружено, что p> 0.05, нулевата хипотеза не се отхвърля, поради което не позволява на грешка на първия вид.
Грешка втора вид: не отхвърляме нулевата хипотеза, когато тя е фалшива, и стигна до заключението, че няма ефект, докато в действителност той съществува. Вероятността за грешка на втори вид е определен β (бета); и стойността (1-β), наречена енергиен критерий.
Следователно властта - това е вероятността за отхвърляне на нулевата хипотеза, когато тя е фалшива, т.е. това е шанс (обикновено се изразява като процент) за откриване на реален ефект от лечението в даден обем на пробата да е статистически значима.
В идеалния случай бих искал да мощност на теста е 100%; но това е невъзможно, тъй като винаги има шанс, макар и леко, заблуждават втори вид.
За щастие, ние знаем какво фактори оказват влияние върху изхода и по този начин е възможно да се контролира енергиен критерий, да ги обмисля.
Мощност и свързаните с тях фактори
При планирането на проучването, е необходимо да се знае силата на предложеното изпитване. Очевидно е, че можете да започнете да учат, ако има "добра" шанс да открият значим ефект, ако има такъв (под "добра", имаме предвид, че силата трябва да е поне 70-80%).
Етично безотговорно да започне проучване, в което, да речем, само 40% шанс да откриете истинската ефекта от лечението; това е загуба на време и пари.
Няколко фактора имат пряка връзка с критерия за власт.
размер на пробата: изпитване мощност се увеличава с обем на пробата. Това означава, че по-голяма извадка повече възможности, отколкото малките, да намерите важен ефект, ако има такъв.
Когато обемът на пробата е малък критерий момент може да бъде недостатъчна мощност за откриване на един ефект. Тези методи могат да бъдат използвани за енергиен критерий за оценка на точно определен обем проба.
Променливост наблюдения: мощност се увеличава с променливостта на наблюденията намалени.
Интересът на изследователите ефект: силата на теста повече за по-високи ефекти. Критерият на хипотези за изпитване е по-вероятно да се открие значителен реален ефект от лек.
ниво Значение: мощност ще бъде по-голяма, ако нивото на значимост е по-висока (това е еквивалентно на увеличаване на грешките от първи вид, α, а грешките от втори вид, β, намалява).
По този начин, най-вероятно, изследователите са открили, реален ефект, ако реши на етапа на планиране, която се счита за значителна р стойност, ако е вероятно да бъде по-малко от 0,05, по-малко от 0.01.
Моля, имайте предвид, че проверката кредитни институции за ефекта на интерес показва дали адекватна сила. Голям доверителен интервал трябва да бъде на една малка извадка и / или данните, с варирали значително и показва недостатъчен капацитет.
Проверка на множество хипотези
Често е необходимо да извършите критерий за проверка на значимостта на множество хипотези на набора от данни, с много променливи и има повече от два вида лечение.
Грешката на първи вид значително увеличава с броя на сравненията, което води до погрешни изводи за хипотези. Ето защо, трябва да се провери само малък брой хипотези, избрани за постигане на първоначалните цели на изследването и точно установен априори.
Можете да използвате всяка форма на последващ стойности за уточняване P. като се има предвид броя на извършените инспекции хипотези.
Например, когато подхода Bonferroni (често се счита за сравнително консервативен) умножава всяка стойност на р от броя на тестове, извършени; като има предвид всякакви решения относно значението на този ще се основава на най-близката стойност на стр.