dc.contributor.author | Korzeniewski, Jerzy | |
dc.date.accessioned | 2019-10-18T06:07:31Z | |
dc.date.available | 2019-10-18T06:07:31Z | |
dc.date.issued | 2012 | |
dc.identifier.citation | Korzeniewski J., Metody selekcji zmiennych w analizie skupień. Nowe procedury, Wydawnictwo Uniwersytetu Łódzkiego, Łódź 2012, doi: 10.18778/7525-695-6 | pl_PL |
dc.identifier.isbn | 978-83-7525-695-6 | |
dc.identifier.uri | http://hdl.handle.net/11089/30654 | |
dc.description | Problem selekcji zmiennych w analizie skupień można rozpatrywać w różnych ujęciach w odniesieniu do założeń mniej lub bardziej ograniczających stosowalność konstruowanych metod. Niektóre ograniczenia zostały wymienione w celach rozprawy. Należy jeszcze wspomnieć o tym, że w swej najogólniejszej postaci, w problemie selekcji dopuszcza się możliwość istnienia kilku struktur skupień w tym samym zbiorze danych, przy czym zbiory zmiennych tworzących te struktury nie muszą być rozłączne. Ta najogólniejsza forma problemu jest na tyle skomplikowana, że metody, które ją rozważają spisują się bardzo słabo w zawężonych formach problemu, na przykład, w najprostszej postaci, w której zakładamy, że istnieje tylko jeden zbiór zmiennych tworzących strukturę skupień. Propozycje autora mają przede wszystkim na uwadze ujęcie problemu, w którym zakładamy rozłączność zbiorów zmiennych tworzących różne struktury skupień. | pl_PL |
dc.description.sponsorship | Udostępnienie publikacji Wydawnictwa Uniwersytetu Łódzkiego finansowane w ramach projektu „Doskonałość naukowa kluczem do doskonałości kształcenia”. Projekt realizowany jest ze środków Europejskiego Funduszu Społecznego w ramach Programu Operacyjnego Wiedza Edukacja Rozwój; nr umowy: POWER.03.05.00-00-Z092/17-00. | pl_PL |
dc.language.iso | pl | pl_PL |
dc.publisher | Wydawnictwo Uniwersytetu Łódzkiego | pl_PL |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Międzynarodowe | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | analiza skupień | pl_PL |
dc.subject | nauczanie bez nadzoru | pl_PL |
dc.subject | taksonomia | pl_PL |
dc.title | Metody selekcji zmiennych w analizie skupień. Nowe procedury | pl_PL |
dc.title.alternative | Methods of Variable Selection in Cluster Analysis. New procedures | pl_PL |
dc.type | Book | pl_PL |
dc.page.number | 190 | pl_PL |
dc.contributor.authorAffiliation | Uniwersytet Łódzki, Wydział Ekonomiczno-Socjologiczny, Katedra Metod Statystycznych | pl_PL |
dc.contributor.authorBiographicalnote | Dr Jerzy Korzeniewski jest adiunktem w Katedrze Metod Statystycznych Instytutu Statystyki i Demografii Uniwersytetu Łódzkiego. Jego zainteresowania naukowo-badawcze koncentrują się wokół analizy skupień, analizy obrazów, wcześniej odporności statystycznej. Dr Jerzy Korzeniewski jest autor około 30
artykułów naukowych oraz wielu opracowań w ramach projektów badawczych. Dr Jerzy Korzeniewski prezentował wyniki swoich badań na wielu konferencjach naukowych w kraju i za granicą, w tym w Singapurze, Niemczech, RPA, Anglii, Czechach i Portugalii. W 1999 roku obronił rozprawę doktorską Metody badania odporności testów statystycznych, przygotowaną pod kierunkiem prof. Czesława Domańskiego. W latach 1991–1992 był na sześciomiesięcznym stypendium naukowym na University of Swansea, w Walii. W roku 1993 był na czteromiesięcznym Business Course na University of Nijmegen, w Holandii. W latach 1994–1997 współuczestniczył w realizacji międzynarodowego programu COST zatytułowanego: Unemployment During Economic Transition, a w latach 2010–2011 był kierownikiem i głównym wykonawcą projektu KBN na temat: Metody wybierania zmiennych w analizie skupień i ich zastosowania. Od wielu lat prowadzi wykłady specjalistyczne na kierunku „Informatyka i Ekonometria”
na Wydziale Ekonomiczno-Socjologicznym oraz wykłady i ćwiczenia z kilku przedmiotów o charakterze matematycznym, statystycznym jak również z teorii ryzyka i matematyki finansowej. Ponadto w ramach programu Erasmus prowadzi zajęcia z tych przedmiotów dla studentów obcokrajowców. Niniejsza monografia stanowi podsumowanie badań i doświadczeń autora dotyczących metodologii selekcji zmiennych w analizie skupień. Zaproponowane nowe procedury selekcji zmiennych są efektywniejsze od
dotychczas opracowanych a ponadto elastyczniejsze pod względem możliwości aplikacyjnych. Opracowane metody stanowią istotny wkład do teorii selekcji zmiennych w analizie skupień. | pl_PL |
dc.references | Agrawal R., Gehrke J., Gunopulos D., Raghavan P.(1998), Automatic subspace clustering of high dimensional data for data mining applications , Proc. 1998 ACM-SIGMOD Int. Conf. Management of Data, Seattle, Washington. | pl_PL |
dc.references | Arabie P., Hubert L., (1994), Cluster analysis in marketing research, Advanced methods of marketing research, Oxford, Blackwell. | pl_PL |
dc.references | Atkinson A., Riani C., Cerioli A., (2004), Exploring Multivariate Dat with the Forward Search, Springer, New York. | pl_PL |
dc.references | Atlas R., Overall J., (1994), Comparative Evaluation of Two Superior Stopping Rules for Hierarchical Cluster Analysis, Psychometrika, 59. | pl_PL |
dc.references | Bajgier S., Aggarwal L., (1991), Powers of goodness-of-fit tests in detecting balanced mixed normal distributions, Educational and Psychological Measurement, 51. | pl_PL |
dc.references | Benzecri J. (1973), L’Anayse des donees. Tome 2: L’Analyse des correspondances, Dunod. | pl_PL |
dc.references | Blashfield R., (1976), Mixture Model Tests of Cluster Analysis: Accuracy of Four Agglomerative Hierarchical Methods, Psychological Bulletin, 83. | pl_PL |
dc.references | Brusco M, Stahl M., (2004), Variable Selection for Cluster Analysis , Springer New York; | pl_PL |
dc.references | Brusco M., Cradit D., (2001), A Variable-Selection Heuristic for K-Means Clustering, Psychometrika, 66. | pl_PL |
dc.references | Carmone F. Jr., Kara A., Maxwell S., (1999), HINoV: A New Model to Improve Market Segment Definition by Identifying Noisy Variables , Journal of Marketing Research, Vol. 36, No. 4 | pl_PL |
dc.references | Chang W., (1983), On using principal components before separating a mixture of two multivariate normal distributions, Applied Statistics, 32. | pl_PL |
dc.references | Cormack R., (1971), A review of classification (with discussion), Journal of Royal Statistical Society, series A, 134. | pl_PL |
dc.references | Dash M, Liu H., (2000) Feature selection for clustering , Proceedings of Fourth Pacific-Asia Conference on Knowledge Discovery and Data Mining, (PAKDD). | pl_PL |
dc.references | Denoeud L., Garreta H., Guénoche A. (2005), Comparison of distance indices between partition, Conference „International Symposium on Applied Stochastic Models and Data Analysis” (ASMDA2005). | pl_PL |
dc.references | De Soete G. (1986), Optimal variable weighting for ultrametric and additive tree clustering, Quality & Quantity, 20. | pl_PL |
dc.references | De Soete G. (1988), OVWTRE: a program for optimal variable weighting for ultrametric and additive tree fitting, Journal of Classification, 5. | pl_PL |
dc.references | De Soete G., Carroll J., (1994), K-means clustering in a low-dimensional Euclidean space, New approaches in classification and data analysis, Berlin, Springer. | pl_PL |
dc.references | DeSarbo W.S., Carroll J.D., Clark L.A., Green P.E. (1984), Synthesized clustering: a method for amalgamating clustering bases with differential weighting of variables, Psychometrika, vol. 49, no. 1, 57-78. | pl_PL |
dc.references | Devaney M. , Ram A., (1997), Efficient feature selection in conceptual clustering, Proceedings of the Fourteenth International Conference on Machine Learning, Nashville. | pl_PL |
dc.references | Dietterich, T. G., (1998). Approximate Statistical Tests for Comparing Supervised Classification Learning Algorithms, Neural Computation, 10. | pl_PL |
dc.references | Domański Cz., (1979), Statystyczne Testy Nieparametryczne, PWE Warszawa. | pl_PL |
dc.references | Domański Cz., Pruska K., (2007), Nieklasyczne metody statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa. | pl_PL |
dc.references | Donoghue J.R. (1995), Univariate screening measures for cluster analysis, Multivariate Behavioral Research, 30. | pl_PL |
dc.references | Duda R., Hart P., (1973), Pattern Classification and Scene Analysis, Wiley, New York. | pl_PL |
dc.references | Dy J., Brodley C., (2000), Feature subset selection and order identification for unsupervised learning, Proc. 17th International Conf. on Machine Learning. | pl_PL |
dc.references | Everitt B., (2001), Cluster Analysis, HEB, London. | pl_PL |
dc.references | Fisher D., (1987), Knowledge acquisition via incremental conceptual clustering, PhD. Thesis, University of California, Irvine. | pl_PL |
dc.references | Fletcher J., Satz P., (1985), Cluster Analysis and the search for learning disabilities subtypes, w red. Rourke B., Neuropsychology of learning disabilities: Essentilas of subtypes analysis. New York, Guilford. | pl_PL |
dc.references | Fowlkes E.B., Gnanadesikan R., Kettenring J.R. (1987), Variable selection in clustering and other contexts, W: C.L. Mallows (red.), Design, data, and analysis, Wiley, New York. | pl_PL |
dc.references | Fowlkes E.B., Gnanadesikan R., Kettenring J.R. (1988), Variable selection in clustering, Journal of Classification 5. | pl_PL |
dc.references | Fraiman R., Justel A., Svarc M., (2008), Selection of Variables for Cluster Analysis and Classification Rules, JASA, 103. | pl_PL |
dc.references | Friedman J., Meulman J. (2004), Clustering Objects on Subsets of Attributes, Journal of the Royal Statistical Society, Series B 66. | pl_PL |
dc.references | Friedman J.H., Meulman J.J. (2004), Clustering objects on subsets attributes, Journal of the Royal Statistical Society: Series B, 66. | pl_PL |
dc.references | Gatnar E., Walesiak M., (2004), Metody Statystycznej Analizy Wielowymiarowej w Badaniach Marketingowych, Wydawnictwo AE we Wrocławiu. | pl_PL |
dc.references | Gatnar E., Walesiak M., (2009), Statystyczna analiza danych z wykorzystaniem programu R, PWN. | pl_PL |
dc.references | Gnanadesikan R., Kettenring J.R., Tsao S.L. (1995), Weighting and selection of variables for cluster analysis, Journal of Classification, 12. | pl_PL |
dc.references | Goeffe W., Ferrier G., Rogers J., (1994), Global Optimization of Statistical Functions with Simulated Annealing, Journal of Econometrics 60. | pl_PL |
dc.references | Gold E., Hoffman P., (1976), Flange Detection Cluster Analysis, Multivariate Behavioral Research, 11. | pl_PL |
dc.references | Grabiński T., (1992), Metody taksonometrii, Wydawnictwo AE, Kraków. | pl_PL |
dc.references | Green P., Carmone F., Kim J.,(1990), A preliminary study of optimal variable weighting in k-means clustering, Journal of Classification, 7. | pl_PL |
dc.references | Green P., Krieger A., (1995), Alternative approaches to cluster-based market segmentation, Journal of the Market Research Society, 37. | pl_PL |
dc.references | Guyon I., Elisseeff A. (2003), An introduction to variable and feature selection, Journal of Machine Learning Research, 3. | pl_PL |
dc.references | Hoff P., (2006), Model-based subspace clustering, Bayesian analysis 1. | pl_PL |
dc.references | Hubert L., Arabie P., (1985), Comparing Partitions, Journal of Classification 2. | pl_PL |
dc.references | Ichino M. (1994), Feature Selection for Symbolic Data Classification, [w] New Approaches in Classification and Data Analysis, Springer-Verlag. | pl_PL |
dc.references | Ichino M., Sklansky J., (1985), The relative neighborhood graph for mixed feature variabless, Pattern Recognition 18. | pl_PL |
dc.references | Jajuga K., (1989), Podstawowe metody analizy wielowymiarowej w przypadku występowania zmiennych mierzonych na różnych skalach, Praca w ramach CPBP, AE Wrocław. | pl_PL |
dc.references | Kaufman L., Rousseeuw P., (1990), Finding Groups in Data, John Wiley&Sons. | pl_PL |
dc.references | Kendall M., Buckland W., (1986), Słownik terminów statystycznych, PWE Warszawa. | pl_PL |
dc.references | Kleinberg J., (2002), An Impossibility Theorem for Clustering. Advances in Neural Information Processing Systems (NIPS). | pl_PL |
dc.references | Korzeniewski J., (2005), Propozycja nowego algorytmu wyznaczającego liczbę skupień, Prace Naukowe Akademii Ekonomicznej we Wrocławiu, Taksonomia 12. | pl_PL |
dc.references | Korzeniewski J., (2009), An entropy based non-wrapper approach for choosing variables in cluster analysis, Acta Universitatis Lodziensis, Folia Oeconomica, 172. | pl_PL |
dc.references | Korzeniewski J., (2010), Badanie odporności metody HINoV na błędnie zadaną liczbę skupień w zbiorze danych, Taksonomia 17: Klasyfikacja i analiza danych – teoria i zastosowania, Nr 107, Wrocław. | pl_PL |
dc.references | Korzeniewski J., (2012), Ocena efektywności metody uśredniania zmiennych i metody Ichino selekcji zmiennych w analizie skupień, Taksonomia 19, Klasyfikacja i analiza danych – teoria i zastosowania, WUE Wrocław. | pl_PL |
dc.references | Kruskal W., (1972), Linear transformation of multivariate data to reveal clustering, in Shepard R., Romney A. and Nerlove S., (eds), Multidimensional scaling: Theory and Applications in the Behavioural Sciences, Vol. 1, Seminar Press, London. | pl_PL |
dc.references | Kuiper F., Fisher L., (1975), A Monte Carlo Comparison for Six Clustering Procedures,. Biometrics, 31. | pl_PL |
dc.references | Law M., Jain A., Figueiredo M. (2003), Feature Selection in Mixture-Based Clustering , IEEE Transactions on Pattren Analysis and Machine Inteligence. | pl_PL |
dc.references | Makarenkov V., Legendre P. (2001), Optimal variable weighting for ultrametric and additive trees and K-means partitioning methods and software, Journal of Classification, 18. | pl_PL |
dc.references | Martinez W., Martinez A., (2001) , Computational statistics handbook with MATLAB . Boca Raton: Chapman&Hall. | pl_PL |
dc.references | McIntyre R., Blashfield R., (1980), A Nearest-Centroid Technique for Evaluating the Minimum Variance Clustering Procedure, Multivariate Behavioral Research, 15. | pl_PL |
dc.references | Migdał-Najman K., Najman K. (2005), Analityczne metody ustalania liczby skupień, Taksonomia 12: Klasyfikacja i analiza danych – teoria i zastosowania, Nr 1076, Wrocław. | pl_PL |
dc.references | Mikulec A., (2010), Zastosowanie metod statystycznych do oceny efektywności i klasyfikacji systemów emerytalnych, nieopublikowana praca doktorska na Wydziale Ekonomiczno-Socjologicznym Uniwersytetu Łódzkiego. | pl_PL |
dc.references | Milligan G., (1980), An examination of the effect of six types of error perturbation on fifteen clustering algorithms , Psychometrika, 45. | pl_PL |
dc.references | Milligan G., (1985), An Algorithm for Generating Artificial Test Clusters , Psychometrika, 50. | pl_PL |
dc.references | Milligan G., Cooper M., (1987), Methodological review: Clustering methods, Applied Psychological Measurement, 11. | pl_PL |
dc.references | Milligan G., Cooper M., (1988), A study of variable standarization, Journal of Classification, 5. | pl_PL |
dc.references | Milligan G., (1989), A validation study of a variable weighting algorithm for cluster analysis, Journal of Classification, 6. | pl_PL |
dc.references | Milligan G., (1994), Issues in applied classification: selection of variables to cluster, Classification Society of North America Newsletter, 37. | pl_PL |
dc.references | Milligan G., (1996), Clustering Validation: Results and Implications for Applied Analyses, [w] Clustering and Classification, red, P. Arabie, L. Hubert, G. de Soete, World Scientific, Singapore . | pl_PL |
dc.references | Mojena R. (1977), Hierarchical grouping methods and stopping rules: an evaluation, Computer Journal 1977, Vol. 20, No 4. | pl_PL |
dc.references | Montanari A. and Lizzani L. (2001) A projection pursuit approach to variable selection, Computational Statistics and Data Analysis, Vol. 35(4). | pl_PL |
dc.references | Najman K., Migdał-Najman K., (2006), Wykorzystanie indeksu Silhouette do ustalania optymalnej liczby skupień, Wiadomości Statystyczne, 6. | pl_PL |
dc.references | Nowak E. (1985), Wskaźnik podobieństwa wyników podziałów, Przegląd Statystyczny, 1. | pl_PL |
dc.references | Pawełek B., (2008), Metody normalizacji zmiennych w badaniach porównawczych złożonych zjawisk ekonomicznych, Wydawnictwo Uniwersytetu Ekonomicznego w Krakowie. | pl_PL |
dc.references | Pearson K., (1894), Contributions to the theory of mathematical evolution, Philosophical Transactions of the Royal Society of London, series A, 185. | pl_PL |
dc.references | Pełka M., Wilk J., (2010), Metody selekcji zmiennych symbolicznych w zagadnieniach klasyfikacji, Klasyfikacja i analiza danych – teoria i zastosowania, Taksonomia 17, Prace Naukowe UE we Wrocławiu nr 107. | pl_PL |
dc.references | Pociecha J. (1982), Kryteria oceny procedur taksonomicznych, Przegląd statystyczny, Nr 1/2. | pl_PL |
dc.references | Press W., Flannery B., Teukolsky S., Vetterling W., (1986) Numerical Recipes , The Art of Scientific Computing, Cambridge, Cambridge University Press. | pl_PL |
dc.references | Price L., (1993), Identifying Cluster Overlap with NORMIX Population Membership Probabilities, Multivariate Behavioral Research, 28. | pl_PL |
dc.references | Qiu W., Joe H., (2006), Generation of random clusters with specified degree of separation, Journal of Classification 23. | pl_PL |
dc.references | Raftery, A.E. and Dean, N. (2006). Variable Selection for Model-Based Clustering, Journal of the American Statistical Assocation, 101. | pl_PL |
dc.references | Ratkowsky, Lance, (1978), A criterion for determining the number of groups in a classification, Australian Computer Journal, 10. | pl_PL |
dc.references | Schaffer C., Green P., (1998), Cluster-based market segmentation: Some further comparisons of alternative approaches, , Journal of the Market Research Society, 40. | pl_PL |
dc.references | Sokołowski A. (1992), Empiryczne testy istotności w taksonomii, Zeszyty Naukowe AE w Krakowie, Seria specjalna: Monografie nr 108. | pl_PL |
dc.references | Steinley D., (2004), Standardising variables in K-means clustering , [w] Banks D., House L., McMorris F., Arabie P., Gaul W. (red.), Classification, Clustering and Data Mining Applications, Springer, New-York. | pl_PL |
dc.references | Steinley D., (2006), K-means clustering, A half-century synthesis , British Journal of Mathematical and Statistical Psychology, 59. | pl_PL |
dc.references | Steinley D., Brusco M. (2007a), A New Variable Weighting and Selection Procedure for K-means Cluster Analysis, Multivariate Behavioral Research. | pl_PL |
dc.references | Steinley D., Brusco M. (2007b), Initializing k-means batch clustering: A critical evaluation of several techniques, Journal of Classification 24. | pl_PL |
dc.references | Steinley D., Brusco M. (2008), Selection of Variables in Cluster Analysis: An Empirical Comparison of Eight Procedures, Psychometrika 73. | pl_PL |
dc.references | Steinley D., Henson R., (2005), OCLUS: An Analytic Method for Generating Clusters with Known Overlap , Journal of Classification 22. | pl_PL |
dc.references | Stoddard M., (1979), Standarisation of measures prior to cluster analysis, Biometrics 35. | pl_PL |
dc.references | Tadesse M., Sha N., Vanucci M., (2005), Bayesian Variable Selection in Clustering High-Dimensional Data, Journal of the American Statistical Association v. 100. | pl_PL |
dc.references | Tadesse M., Kim S., Vanucci M., (2006), Variable selection in clustering via Dirichlet process mixture models, Biometrika 93. | pl_PL |
dc.references | Talavera L., (2000), Dependency-Based Feature Selection for Clustering Symbolic Data, Intelligent Data Analysis 4. | pl_PL |
dc.references | Tibshrani R., Walther G., Hastie T., (2001), Estimating the Number of Clusters in a Datase via the Gap Statistic, Journal of the Royal Statistical Society 32. | pl_PL |
dc.references | Torgerson W., (1952), Multidimensional Scaling: I.Theory and method, Psychometrika 17. | pl_PL |
dc.references | van Buuren S., Heiser W., (1989) Clustering N Objects into K Groups Under Optimal Scaling of Variables, Psychometrika 54. | pl_PL |
dc.references | Walesiak M., (1993), Strategie postępowania w badaniach statystycznych w przypadku zbioru zmiennych mierzonych na skalach różnego typu, Badania Operacyjne i Decyzje 1. | pl_PL |
dc.references | Walesiak M., (2002), Uogólniona miara odległości w statystycznej analizie wielowymiarowej, Wydawnictwo AE Wrocław. | pl_PL |
dc.references | Walesiak M., (2005), Problemy selekcji i ważenia zmiennych w zagadnieniu klasyfikacji, W: K. Jajuga, M. Walesiak, Klasyfikacja i analiza danych – teoria i zastosowania, Taksonomia 12, Prace Naukowe AE we Wrocławiu nr 1076. | pl_PL |
dc.references | Walesiak M., (2011), Uogólniona miara odległości GDM w statystycznej analizie wielowymiarowej z wykorzystaniem programu R, Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu. | pl_PL |
dc.references | Walesiak M., Dudek A., (2008), Identification of noisy variables for nonmetric and symbolic data in cluster analysis, W: C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker (red.), Data analysis, machine learning and applications, Springer-Verlag, Berlin, Heidelberg. | pl_PL |
dc.references | Walesiak M., Gatnar E., (2009), Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa. | pl_PL |
dc.references | Waller N., Underhill J, Kaiser H., (1999), A Method for Generating Simulated Plasmodes and Artificial Test Clusters with User-Defined Shape, Size and Orientation. Multivariate Behavioral Research, 34. | pl_PL |
dc.references | Wieczorkowski R., Zieliński R., Komputerowe generatory liczb losowych, Wydawnictwa Naukowo Techniczne, Warszawa 1997. | pl_PL |
dc.references | Witten D., Tibshirani R., (2010), A framework for feature selection in clustering, Journal of the American Statistical Association 105. | pl_PL |
dc.references | Zhou J., He X., (2008), Dimension Reduction Based on Canonical Correlation and Variable Filtering, Annals of Statistics 36. | pl_PL |
dc.identifier.doi | 10.18778/7525-695-6 | |