Multidimensional Data Classification - Comparison of Isodata and Approximation by Points Methods
Streszczenie
Efekt podziału zależy nie tylko od ustalenia kryteriów podziału, ale także od wyboru
metody dzielenia. Standardowy algorytm klasyfikacji wielowymiarowych danych ISODATA
dzieli wyjściowy zbiór na ustaloną liczbę rozłącznych podzbiorów tak, aby podział
ten jak najkorzystniej spełniał przyjęte kryteria. Alternatywą wobec niego jest
algorytm oparty na metodzie aproksymacji ustaloną liczbą punktów, którego efektem
jest wskazanie obszarów zbioru o dużym stopniu zagęszczenia elementów. Artykuł zawiera
porównanie efektów użycia tych metod ze wskazaniem zalet i wad. Omawia też
pewne własności klasyfikacji wynikające z konsekwencji wyboru jednej z dwóch omawianych
metod. The effect of division is dependent not only on the criteria of division but
also on the chosen method. The standard algorithm of multidimensional data classification
ISODATA divides the given set into an assumed number of separable subsets in
such a way that the division fulfills best the accepted criteria. An alternative method is
approximation by the chosen number of points which in result indicates the areas of a set
with large congestion o f the elements. The paper compares effects of using both methods
listing their advantages and drawbacks. Apart from presenting the results of division of
various sets some characteristics of classification are discussed which are an effect of the
choice of one of the above mentioned methods.
Collections