Model Selection Methods in Log-Linear Analysis
Streszczenie
The main objective of the study is to examine model selection methods in loglinear
analysis. Log-linear analysis is a tool for independence analysis of qualitative data. Cell
counts are Poisson distributed and all variables are treated as response. This method allows to
analyze any number of variables in a multi-way contingency table. In log-linear analysis we model
cell counts, where expected cell frequencies are functions of parameters representing
characteristics of the categorical variables and their relationships with each other (interaction).
The purpose of this paper is the presentation and comparison of model election criteria. The
most popular statistics are chi-square test, likelihood ratio test and information criteria (AIC
[Akaike 1973] and BIC [Raftery 1986]) but also Aitkin [Aitkin 1978] method for high dimensional
tables. Analiza logarytmiczno-liniowa jest metodą przeznaczoną do badania zależności pomiędzy
zmiennymi niemetrycznymi w tablicy kontyngencji. Zmienne o rozkładzie Poissona traktowane są
jako zmienne objaśniane. Metoda ta pozwala na analizę dowolnej liczby zmiennych, a także na
uwzględnienie interakcji zachodzących pomiędzy nimi. W analizie logarytmiczno-liniowej
modelowane są liczebności w poszczególnych komórkach tablicy, przy czym liczebności
oczekiwane są funkcją parametrów reprezentujących zmienne dyskretne oraz relacje między nimi.
Celem niniejszego artykułu jest prezentacja i porównanie kryteriów wyboru modelu
w analizie logarytmiczno-liniowej. Podstawowymi kryteriami wyboru modelu są statystyka chikwadrat
oraz iloraz wiarygodności oraz kryteria informacyjne AIC i BIC. W niniejszym artykule
zaprezentowana zostanie także metoda Aitkina, która przeznaczona jest do porównywania jakości
dopasowania modeli o dużej liczbie zmiennych.
Collections