Show simple item record

dc.contributor.authorDudek, Andrzej
dc.date.accessioned2015-06-22T09:46:22Z
dc.date.available2015-06-22T09:46:22Z
dc.date.issued2013
dc.identifier.issn0208-6018
dc.identifier.urihttp://hdl.handle.net/11089/10038
dc.description.abstractResearchers analyzing large (> 100,000 objects) data sets with the methods of cluster analysis often face the problem of computational complexity of algorithms, that sometimes makes it impossible to analyze in an acceptable time. Common solution of this problem is to use less computationally complex algorithms (like k-means), which in turn can in many cases give much worse results than for example algorithms using eigenvalues decomposition . The results of analysis of the actual sets of this type are therefore usually a compromise between quality and computational capabilities of computers. This article is an attempt to present the current state of knowledge on the classification of large datasets, and identify ways to develop and open problems.pl_PL
dc.description.abstractBadacze analizujący przy pomocy metod analizy skupień duże (> 100.000 obiektów) zbiory danych, stają często przed problemem złożoności obliczeniowej algorytmów, uniemożliwiającej niekiedy przeprowadzenie analizy w akceptowalnym czasie. Jednym z rozwiązań tego problemu jest stosowanie mniej złożonych obliczeniowo algorytmów (hierarchiczne aglomeracyjne, k-średnich), które z kolei mogą w wielu sytuacjach dawać zdecydowanie gorsze rezultaty niż np. algorytmy wykorzystujące dekompozycję względem wartości własnych. Rezultaty rzeczywistych analiz tego typu zbiorów są więc zazwyczaj kompromisem pomiędzy jakością a możliwościami obliczeniowymi komputerów. Artykuł jest próbą przedstawienia aktualnego stanu wiedzy na temat klasyfikacji dużych zbiorów danych oraz wskazania dróg rozwoju i problemów otwartych.pl_PL
dc.language.isoenpl_PL
dc.publisherWydawnictwo Uniwersytetu Łódzkiegopl_PL
dc.relation.ispartofseriesActa Universitatis Lodziensis. Folia Oeconomica;285
dc.subjectclusteringpl_PL
dc.subjectclassificationpl_PL
dc.subjectlarge data setspl_PL
dc.titleClassification of Large Data Sets. Comparison of Performance of Chosen Algorithmspl_PL
dc.title.alternativeKlasyfikacja dużych zbiorów porównanie wydajności wybranych algorytmówpl_PL
dc.typeArticlepl_PL
dc.page.number[71]-77pl_PL
dc.contributor.authorAffiliationWrocław, University of Economics, Chair of Econometrics and Informaticspl_PL
dc.referencesBock H.H., Diday E. (eds.) (2000), Analysis of symbolic data. Explanatory methods for extracting statistical information from complex data, Springer-Verlag, Berlinpl_PL
dc.referencesDiday E., Noirhomme-Fraiture M. (eds.) (2008), Symbolic Data Analysis with SODAS Software, John Wiley & Sons, Chichesterpl_PL
dc.referencesDimitriadou E., Weingessel A., Hornik K. (2001), Voting-Merging: An Ensemble Method for Clustering. [in:] G. Dorffner, H. Bischop, K. Hornik (eds.), Artificial Neural Networks – ICANN 2001, Lecture Notes in Computer Science volume 2130 Springer, Berlin / Heidelberg, 217–224pl_PL
dc.referencesEveritt B.S., Landau S., Leese M. (2001), Cluster analysis, Edward Arnold, Londonpl_PL
dc.referencesGordon A.D. (1999), Classification, Chapman & Hall/CRC, Londonpl_PL
dc.referencesHubert L.J., Arabie P. (1985), Comparing partitions. „Journal of Classification”, no. 2, 193–218pl_PL
dc.referencesKaufman L., Rousseeuw P.J. (1990), Finding groups in data: an introduction to cluster analysis, Wiley, New Yorkpl_PL
dc.referencesNg A., Jordan M., Weiss Y. (2002), On spectral clustering: analysis and an algorithm, [w:] T. Dietterich, S. Becker, Z. Ghahramani (Eds.), Advances in Neural Information Processing Systems 14. MIT Press, 849–856pl_PL
dc.referencesWalesiak M., Dudek A. (2010), Klasyfikacja spektralna z wykorzystaniem odległości GDM, Prace Naukowe UE we Wrocławiu nr 107, 161–171pl_PL
dc.referencesWalesiak M., Dudek A. (2011), clusterSim package, URL http://www.R-project.orgpl_PL


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record