On an Improvement of the Model-Based Clustering Method
Streszczenie
W artykule przedstawiona została modyfikacja metody taksonomii opartej na modelach
mieszanych, w przypadku gdy niemożliwym staje się oszacowanie parametrów
modelu za pomocą algorytmu EM. Gdy liczba obiektów przypisanych do klasy jest
mniejsza niż liczba zmiennych opisujących te obiekty, niemożliwym staje się oszacowanie
parametrów modelu. By uniknąć tej sytuacji estymatory największej wiarygodności
zastępowane są estymatorami o największym prawdopodobieństwie a posteriori. Wybór
modelu o najlepszej parametryzacji i stosownej liczbie klas dokonywany jest wówczas
za pomocą zmodyfikowanej statystyki BIC. An improvement o f the model-based clustering (MBC) method in the
case when EM algorithm fails as a result o f singularities is the basic aim o f this paper.
Replacement o f the maximum likelihood (MLE) estimator by a maximum a posteriori
(MAP) estimator, also found by the EM algorithm is proposed. Models with different
number o f components are compared using a modified version o f BIC, where the likelihood
is evaluated at the MAP instead o f MLE. A highly dispersed proper conjugate prior
is shown to avoid singularities, but when these are not present it gives similar results to
the standard method o f MBC.
Collections