Pojęcie wielkości efektu na tle teorii Neymana-Pearsona testowania hipotez statystycznych
Abstract
Celem tej pracy jest zwrócenie uwagi badaczy wykorzystujących metody statystyczne
w analizie wyników swoich badań na pomieszanie dwóch różnych teorii testowania hipotez
statystycznych, teorii Fishera i teorii Neymana–Pearsona. Zawarcie, w obecnie stosowanym instrumentarium
statystycznym, pomysłów z obu tych teorii, powoduje, że znakomita większość badaczy
bez chwili namysłu za prawdziwą przyjmuje stwierdzenie, iż im mniejsze prawdopodobieństwo,
tym silniejsza zależność. Przedstawione zostały słabe strony teorii Neymana–Pearsona i wynikające
z nich problemy przy podejmowaniu decyzji w wyniku przeprowadzonych testów. Problemy te
stały się usprawiedliwionym poszukiwaniem mniej zawodnych rozwiązań, jednakże zaproponowane
mierniki wielkości efektu, jako wykorzystujące z jednej strony dogmat o związku między
wielkością prawdopodobieństwa w teście i siłą zależności, a z drugiej – brak jakichkolwiek podstaw
teoretycznych tego rozwiązania, wydają się jeszcze jednym pseudorozwiązaniem rzeczywiście występujących
problemów. Dodatkowo, wykorzystywanie mierników wielkości efektów wygląda na
próbę zwolnienia badaczy z głębokiego myślenia o uzyskanych wynikach z analizy statystycznej,
w kategoriach merytorycznych. Powstał trywialny przepis: odpowiednia wartość miernika natychmiast
implikuje siłę zależności – podejście takie wydaje się niegodne badacza. The aim of this study is to draw the attention of researchers using statistical methods
in the analysis of the results of their research on the combination of two different theories testing
statistical hypothesis, Fisher’s theory and Neyman-Pearson’s theory. Including in the presently used
statistical instruments, ideas of both of these theories, causes that the vast majority of researchers
without a moment’s thought, acknowledge that the smaller the probability the stronger relationship.
The study presents the weaknesses of Neyman-Pearson’s theory and the resulting problems with
decision-making as a result of the conducted tests. These problems have become a justified quest
for less unreliable solutions, however, the proposed measures of the size effect as using on one
hand dogma about the relationship between the degree of probability in the test and the strength of
dependence, on the other, lack of any theoretical basis of this solution, seem to be another pseudo
solution to actual problems. Moreover, the use of measures of size effect seems to be an attempt to
free researchers from the profound thinking about the results obtained from the statistical analysis.
A trivial recipe was established: the corresponding value of the measures instantly implies the
strength of the relationship – this approach seems unworthy of the researcher.
Collections