Comparison of clustering accuracy in ensemble approach based on co-occurence data
Streszczenie
Podejście wielomodelowe dotychczas z dużym powodzeniem stosowane było w klasyfika-
cji i regresji w celu podniesienia dokładności predykcji. W ostatnich latach analogiczne propozy-
cje pojawiły się także w taksonomii, a liczne badania wykazały, że agregacja różniących się
między sobą wyników wielokrotnego grupowania, pozwala na poprawę dokładności klasyfikacji.
W badaniu uwaga została skupiona na pozyskaniu dodatkowej informacji dostarczanej
przez zbiór wyników wielokrotnie dokonanej klasyfikacji w celu konstrukcji tzw. macierzy
współwystąpień. Biorąc pod uwagę jednoczesne wystąpienie pary obiektów w tej samej klasie
jako wskazówkę istnienia związku między nimi, pierwotny zbiór obserwacji przekształcany jest
w n × n – wymiarową macierz, która opisuje podobieństwo między obiektami. Ostateczne
grupowanie dokonywane jest na podstawie uzyskanej macierzy współwystąpień.
Celem referatu jest porównanie dokładności rozpoznawania poprawnej struktury klas za-
proponowanego podejścia wielomodelowego z zastosowaniem różnych algorytmów taksonomicz-
nych do konstrukcji macierzy współwystąpień oraz jej późniejszego podziału na klas
Collections