Pokaż uproszczony rekord

dc.contributor.authorKorzeniewski, Jerzy
dc.date.accessioned2019-10-18T06:07:31Z
dc.date.available2019-10-18T06:07:31Z
dc.date.issued2012
dc.identifier.citationKorzeniewski J., Metody selekcji zmiennych w analizie skupień. Nowe procedury, Wydawnictwo Uniwersytetu Łódzkiego, Łódź 2012, doi: 10.18778/7525-695-6pl_PL
dc.identifier.isbn978-83-7525-695-6
dc.identifier.urihttp://hdl.handle.net/11089/30654
dc.descriptionProblem selekcji zmiennych w analizie skupień można rozpatrywać w różnych ujęciach w odniesieniu do założeń mniej lub bardziej ograniczających stosowalność konstruowanych metod. Niektóre ograniczenia zostały wymienione w celach rozprawy. Należy jeszcze wspomnieć o tym, że w swej najogólniejszej postaci, w problemie selekcji dopuszcza się możliwość istnienia kilku struktur skupień w tym samym zbiorze danych, przy czym zbiory zmiennych tworzących te struktury nie muszą być rozłączne. Ta najogólniejsza forma problemu jest na tyle skomplikowana, że metody, które ją rozważają spisują się bardzo słabo w zawężonych formach problemu, na przykład, w najprostszej postaci, w której zakładamy, że istnieje tylko jeden zbiór zmiennych tworzących strukturę skupień. Propozycje autora mają przede wszystkim na uwadze ujęcie problemu, w którym zakładamy rozłączność zbiorów zmiennych tworzących różne struktury skupień.pl_PL
dc.description.sponsorshipUdostępnienie publikacji Wydawnictwa Uniwersytetu Łódzkiego finansowane w ramach projektu „Doskonałość naukowa kluczem do doskonałości kształcenia”. Projekt realizowany jest ze środków Europejskiego Funduszu Społecznego w ramach Programu Operacyjnego Wiedza Edukacja Rozwój; nr umowy: POWER.03.05.00-00-Z092/17-00.pl_PL
dc.language.isoplpl_PL
dc.publisherWydawnictwo Uniwersytetu Łódzkiegopl_PL
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Międzynarodowe*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectanaliza skupieńpl_PL
dc.subjectnauczanie bez nadzorupl_PL
dc.subjecttaksonomiapl_PL
dc.titleMetody selekcji zmiennych w analizie skupień. Nowe procedurypl_PL
dc.title.alternativeMethods of Variable Selection in Cluster Analysis. New procedurespl_PL
dc.typeBookpl_PL
dc.page.number190pl_PL
dc.contributor.authorAffiliationUniwersytet Łódzki, Wydział Ekonomiczno-Socjologiczny, Katedra Metod Statystycznychpl_PL
dc.contributor.authorBiographicalnoteDr Jerzy Korzeniewski jest adiunktem w Katedrze Metod Statystycznych Instytutu Statystyki i Demografii Uniwersytetu Łódzkiego. Jego zainteresowania naukowo-badawcze koncentrują się wokół analizy skupień, analizy obrazów, wcześniej odporności statystycznej. Dr Jerzy Korzeniewski jest autor około 30 artykułów naukowych oraz wielu opracowań w ramach projektów badawczych. Dr Jerzy Korzeniewski prezentował wyniki swoich badań na wielu konferencjach naukowych w kraju i za granicą, w tym w Singapurze, Niemczech, RPA, Anglii, Czechach i Portugalii. W 1999 roku obronił rozprawę doktorską Metody badania odporności testów statystycznych, przygotowaną pod kierunkiem prof. Czesława Domańskiego. W latach 1991–1992 był na sześciomiesięcznym stypendium naukowym na University of Swansea, w Walii. W roku 1993 był na czteromiesięcznym Business Course na University of Nijmegen, w Holandii. W latach 1994–1997 współuczestniczył w realizacji międzynarodowego programu COST zatytułowanego: Unemployment During Economic Transition, a w latach 2010–2011 był kierownikiem i głównym wykonawcą projektu KBN na temat: Metody wybierania zmiennych w analizie skupień i ich zastosowania. Od wielu lat prowadzi wykłady specjalistyczne na kierunku „Informatyka i Ekonometria” na Wydziale Ekonomiczno-Socjologicznym oraz wykłady i ćwiczenia z kilku przedmiotów o charakterze matematycznym, statystycznym jak również z teorii ryzyka i matematyki finansowej. Ponadto w ramach programu Erasmus prowadzi zajęcia z tych przedmiotów dla studentów obcokrajowców. Niniejsza monografia stanowi podsumowanie badań i doświadczeń autora dotyczących metodologii selekcji zmiennych w analizie skupień. Zaproponowane nowe procedury selekcji zmiennych są efektywniejsze od dotychczas opracowanych a ponadto elastyczniejsze pod względem możliwości aplikacyjnych. Opracowane metody stanowią istotny wkład do teorii selekcji zmiennych w analizie skupień.pl_PL
dc.referencesAgrawal R., Gehrke J., Gunopulos D., Raghavan P.(1998), Automatic subspace clustering of high dimensional data for data mining applications , Proc. 1998 ACM-SIGMOD Int. Conf. Management of Data, Seattle, Washington.pl_PL
dc.referencesArabie P., Hubert L., (1994), Cluster analysis in marketing research, Advanced methods of marketing research, Oxford, Blackwell.pl_PL
dc.referencesAtkinson A., Riani C., Cerioli A., (2004), Exploring Multivariate Dat with the Forward Search, Springer, New York.pl_PL
dc.referencesAtlas R., Overall J., (1994), Comparative Evaluation of Two Superior Stopping Rules for Hierarchical Cluster Analysis, Psychometrika, 59.pl_PL
dc.referencesBajgier S., Aggarwal L., (1991), Powers of goodness-of-fit tests in detecting balanced mixed normal distributions, Educational and Psychological Measurement, 51.pl_PL
dc.referencesBenzecri J. (1973), L’Anayse des donees. Tome 2: L’Analyse des correspondances, Dunod.pl_PL
dc.referencesBlashfield R., (1976), Mixture Model Tests of Cluster Analysis: Accuracy of Four Agglomerative Hierarchical Methods, Psychological Bulletin, 83.pl_PL
dc.referencesBrusco M, Stahl M., (2004), Variable Selection for Cluster Analysis , Springer New York;pl_PL
dc.referencesBrusco M., Cradit D., (2001), A Variable-Selection Heuristic for K-Means Clustering, Psychometrika, 66.pl_PL
dc.referencesCarmone F. Jr., Kara A., Maxwell S., (1999), HINoV: A New Model to Improve Market Segment Definition by Identifying Noisy Variables , Journal of Marketing Research, Vol. 36, No. 4pl_PL
dc.referencesChang W., (1983), On using principal components before separating a mixture of two multivariate normal distributions, Applied Statistics, 32.pl_PL
dc.referencesCormack R., (1971), A review of classification (with discussion), Journal of Royal Statistical Society, series A, 134.pl_PL
dc.referencesDash M, Liu H., (2000) Feature selection for clustering , Proceedings of Fourth Pacific-Asia Conference on Knowledge Discovery and Data Mining, (PAKDD).pl_PL
dc.referencesDenoeud L., Garreta H., Guénoche A. (2005), Comparison of distance indices between partition, Conference „International Symposium on Applied Stochastic Models and Data Analysis” (ASMDA2005).pl_PL
dc.referencesDe Soete G. (1986), Optimal variable weighting for ultrametric and additive tree clustering, Quality & Quantity, 20.pl_PL
dc.referencesDe Soete G. (1988), OVWTRE: a program for optimal variable weighting for ultrametric and additive tree fitting, Journal of Classification, 5.pl_PL
dc.referencesDe Soete G., Carroll J., (1994), K-means clustering in a low-dimensional Euclidean space, New approaches in classification and data analysis, Berlin, Springer.pl_PL
dc.referencesDeSarbo W.S., Carroll J.D., Clark L.A., Green P.E. (1984), Synthesized clustering: a method for amalgamating clustering bases with differential weighting of variables, Psychometrika, vol. 49, no. 1, 57-78.pl_PL
dc.referencesDevaney M. , Ram A., (1997), Efficient feature selection in conceptual clustering, Proceedings of the Fourteenth International Conference on Machine Learning, Nashville.pl_PL
dc.referencesDietterich, T. G., (1998). Approximate Statistical Tests for Comparing Supervised Classification Learning Algorithms, Neural Computation, 10.pl_PL
dc.referencesDomański Cz., (1979), Statystyczne Testy Nieparametryczne, PWE Warszawa.pl_PL
dc.referencesDomański Cz., Pruska K., (2007), Nieklasyczne metody statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa.pl_PL
dc.referencesDonoghue J.R. (1995), Univariate screening measures for cluster analysis, Multivariate Behavioral Research, 30.pl_PL
dc.referencesDuda R., Hart P., (1973), Pattern Classification and Scene Analysis, Wiley, New York.pl_PL
dc.referencesDy J., Brodley C., (2000), Feature subset selection and order identification for unsupervised learning, Proc. 17th International Conf. on Machine Learning.pl_PL
dc.referencesEveritt B., (2001), Cluster Analysis, HEB, London.pl_PL
dc.referencesFisher D., (1987), Knowledge acquisition via incremental conceptual clustering, PhD. Thesis, University of California, Irvine.pl_PL
dc.referencesFletcher J., Satz P., (1985), Cluster Analysis and the search for learning disabilities subtypes, w red. Rourke B., Neuropsychology of learning disabilities: Essentilas of subtypes analysis. New York, Guilford.pl_PL
dc.referencesFowlkes E.B., Gnanadesikan R., Kettenring J.R. (1987), Variable selection in clustering and other contexts, W: C.L. Mallows (red.), Design, data, and analysis, Wiley, New York.pl_PL
dc.referencesFowlkes E.B., Gnanadesikan R., Kettenring J.R. (1988), Variable selection in clustering, Journal of Classification 5.pl_PL
dc.referencesFraiman R., Justel A., Svarc M., (2008), Selection of Variables for Cluster Analysis and Classification Rules, JASA, 103.pl_PL
dc.referencesFriedman J., Meulman J. (2004), Clustering Objects on Subsets of Attributes, Journal of the Royal Statistical Society, Series B 66.pl_PL
dc.referencesFriedman J.H., Meulman J.J. (2004), Clustering objects on subsets attributes, Journal of the Royal Statistical Society: Series B, 66.pl_PL
dc.referencesGatnar E., Walesiak M., (2004), Metody Statystycznej Analizy Wielowymiarowej w Badaniach Marketingowych, Wydawnictwo AE we Wrocławiu.pl_PL
dc.referencesGatnar E., Walesiak M., (2009), Statystyczna analiza danych z wykorzystaniem programu R, PWN.pl_PL
dc.referencesGnanadesikan R., Kettenring J.R., Tsao S.L. (1995), Weighting and selection of variables for cluster analysis, Journal of Classification, 12.pl_PL
dc.referencesGoeffe W., Ferrier G., Rogers J., (1994), Global Optimization of Statistical Functions with Simulated Annealing, Journal of Econometrics 60.pl_PL
dc.referencesGold E., Hoffman P., (1976), Flange Detection Cluster Analysis, Multivariate Behavioral Research, 11.pl_PL
dc.referencesGrabiński T., (1992), Metody taksonometrii, Wydawnictwo AE, Kraków.pl_PL
dc.referencesGreen P., Carmone F., Kim J.,(1990), A preliminary study of optimal variable weighting in k-means clustering, Journal of Classification, 7.pl_PL
dc.referencesGreen P., Krieger A., (1995), Alternative approaches to cluster-based market segmentation, Journal of the Market Research Society, 37.pl_PL
dc.referencesGuyon I., Elisseeff A. (2003), An introduction to variable and feature selection, Journal of Machine Learning Research, 3.pl_PL
dc.referencesHoff P., (2006), Model-based subspace clustering, Bayesian analysis 1.pl_PL
dc.referencesHubert L., Arabie P., (1985), Comparing Partitions, Journal of Classification 2.pl_PL
dc.referencesIchino M. (1994), Feature Selection for Symbolic Data Classification, [w] New Approaches in Classification and Data Analysis, Springer-Verlag.pl_PL
dc.referencesIchino M., Sklansky J., (1985), The relative neighborhood graph for mixed feature variabless, Pattern Recognition 18.pl_PL
dc.referencesJajuga K., (1989), Podstawowe metody analizy wielowymiarowej w przypadku występowania zmiennych mierzonych na różnych skalach, Praca w ramach CPBP, AE Wrocław.pl_PL
dc.referencesKaufman L., Rousseeuw P., (1990), Finding Groups in Data, John Wiley&Sons.pl_PL
dc.referencesKendall M., Buckland W., (1986), Słownik terminów statystycznych, PWE Warszawa.pl_PL
dc.referencesKleinberg J., (2002), An Impossibility Theorem for Clustering. Advances in Neural Information Processing Systems (NIPS).pl_PL
dc.referencesKorzeniewski J., (2005), Propozycja nowego algorytmu wyznaczającego liczbę skupień, Prace Naukowe Akademii Ekonomicznej we Wrocławiu, Taksonomia 12.pl_PL
dc.referencesKorzeniewski J., (2009), An entropy based non-wrapper approach for choosing variables in cluster analysis, Acta Universitatis Lodziensis, Folia Oeconomica, 172.pl_PL
dc.referencesKorzeniewski J., (2010), Badanie odporności metody HINoV na błędnie zadaną liczbę skupień w zbiorze danych, Taksonomia 17: Klasyfikacja i analiza danych – teoria i zastosowania, Nr 107, Wrocław.pl_PL
dc.referencesKorzeniewski J., (2012), Ocena efektywności metody uśredniania zmiennych i metody Ichino selekcji zmiennych w analizie skupień, Taksonomia 19, Klasyfikacja i analiza danych – teoria i zastosowania, WUE Wrocław.pl_PL
dc.referencesKruskal W., (1972), Linear transformation of multivariate data to reveal clustering, in Shepard R., Romney A. and Nerlove S., (eds), Multidimensional scaling: Theory and Applications in the Behavioural Sciences, Vol. 1, Seminar Press, London.pl_PL
dc.referencesKuiper F., Fisher L., (1975), A Monte Carlo Comparison for Six Clustering Procedures,. Biometrics, 31.pl_PL
dc.referencesLaw M., Jain A., Figueiredo M. (2003), Feature Selection in Mixture-Based Clustering , IEEE Transactions on Pattren Analysis and Machine Inteligence.pl_PL
dc.referencesMakarenkov V., Legendre P. (2001), Optimal variable weighting for ultrametric and additive trees and K-means partitioning methods and software, Journal of Classification, 18.pl_PL
dc.referencesMartinez W., Martinez A., (2001) , Computational statistics handbook with MATLAB . Boca Raton: Chapman&Hall.pl_PL
dc.referencesMcIntyre R., Blashfield R., (1980), A Nearest-Centroid Technique for Evaluating the Minimum Variance Clustering Procedure, Multivariate Behavioral Research, 15.pl_PL
dc.referencesMigdał-Najman K., Najman K. (2005), Analityczne metody ustalania liczby skupień, Taksonomia 12: Klasyfikacja i analiza danych – teoria i zastosowania, Nr 1076, Wrocław.pl_PL
dc.referencesMikulec A., (2010), Zastosowanie metod statystycznych do oceny efektywności i klasyfikacji systemów emerytalnych, nieopublikowana praca doktorska na Wydziale Ekonomiczno-Socjologicznym Uniwersytetu Łódzkiego.pl_PL
dc.referencesMilligan G., (1980), An examination of the effect of six types of error perturbation on fifteen clustering algorithms , Psychometrika, 45.pl_PL
dc.referencesMilligan G., (1985), An Algorithm for Generating Artificial Test Clusters , Psychometrika, 50.pl_PL
dc.referencesMilligan G., Cooper M., (1987), Methodological review: Clustering methods, Applied Psychological Measurement, 11.pl_PL
dc.referencesMilligan G., Cooper M., (1988), A study of variable standarization, Journal of Classification, 5.pl_PL
dc.referencesMilligan G., (1989), A validation study of a variable weighting algorithm for cluster analysis, Journal of Classification, 6.pl_PL
dc.referencesMilligan G., (1994), Issues in applied classification: selection of variables to cluster, Classification Society of North America Newsletter, 37.pl_PL
dc.referencesMilligan G., (1996), Clustering Validation: Results and Implications for Applied Analyses, [w] Clustering and Classification, red, P. Arabie, L. Hubert, G. de Soete, World Scientific, Singapore .pl_PL
dc.referencesMojena R. (1977), Hierarchical grouping methods and stopping rules: an evaluation, Computer Journal 1977, Vol. 20, No 4.pl_PL
dc.referencesMontanari A. and Lizzani L. (2001) A projection pursuit approach to variable selection, Computational Statistics and Data Analysis, Vol. 35(4).pl_PL
dc.referencesNajman K., Migdał-Najman K., (2006), Wykorzystanie indeksu Silhouette do ustalania optymalnej liczby skupień, Wiadomości Statystyczne, 6.pl_PL
dc.referencesNowak E. (1985), Wskaźnik podobieństwa wyników podziałów, Przegląd Statystyczny, 1.pl_PL
dc.referencesPawełek B., (2008), Metody normalizacji zmiennych w badaniach porównawczych złożonych zjawisk ekonomicznych, Wydawnictwo Uniwersytetu Ekonomicznego w Krakowie.pl_PL
dc.referencesPearson K., (1894), Contributions to the theory of mathematical evolution, Philosophical Transactions of the Royal Society of London, series A, 185.pl_PL
dc.referencesPełka M., Wilk J., (2010), Metody selekcji zmiennych symbolicznych w zagadnieniach klasyfikacji, Klasyfikacja i analiza danych – teoria i zastosowania, Taksonomia 17, Prace Naukowe UE we Wrocławiu nr 107.pl_PL
dc.referencesPociecha J. (1982), Kryteria oceny procedur taksonomicznych, Przegląd statystyczny, Nr 1/2.pl_PL
dc.referencesPress W., Flannery B., Teukolsky S., Vetterling W., (1986) Numerical Recipes , The Art of Scientific Computing, Cambridge, Cambridge University Press.pl_PL
dc.referencesPrice L., (1993), Identifying Cluster Overlap with NORMIX Population Membership Probabilities, Multivariate Behavioral Research, 28.pl_PL
dc.referencesQiu W., Joe H., (2006), Generation of random clusters with specified degree of separation, Journal of Classification 23.pl_PL
dc.referencesRaftery, A.E. and Dean, N. (2006). Variable Selection for Model-Based Clustering, Journal of the American Statistical Assocation, 101.pl_PL
dc.referencesRatkowsky, Lance, (1978), A criterion for determining the number of groups in a classification, Australian Computer Journal, 10.pl_PL
dc.referencesSchaffer C., Green P., (1998), Cluster-based market segmentation: Some further comparisons of alternative approaches, , Journal of the Market Research Society, 40.pl_PL
dc.referencesSokołowski A. (1992), Empiryczne testy istotności w taksonomii, Zeszyty Naukowe AE w Krakowie, Seria specjalna: Monografie nr 108.pl_PL
dc.referencesSteinley D., (2004), Standardising variables in K-means clustering , [w] Banks D., House L., McMorris F., Arabie P., Gaul W. (red.), Classification, Clustering and Data Mining Applications, Springer, New-York.pl_PL
dc.referencesSteinley D., (2006), K-means clustering, A half-century synthesis , British Journal of Mathematical and Statistical Psychology, 59.pl_PL
dc.referencesSteinley D., Brusco M. (2007a), A New Variable Weighting and Selection Procedure for K-means Cluster Analysis, Multivariate Behavioral Research.pl_PL
dc.referencesSteinley D., Brusco M. (2007b), Initializing k-means batch clustering: A critical evaluation of several techniques, Journal of Classification 24.pl_PL
dc.referencesSteinley D., Brusco M. (2008), Selection of Variables in Cluster Analysis: An Empirical Comparison of Eight Procedures, Psychometrika 73.pl_PL
dc.referencesSteinley D., Henson R., (2005), OCLUS: An Analytic Method for Generating Clusters with Known Overlap , Journal of Classification 22.pl_PL
dc.referencesStoddard M., (1979), Standarisation of measures prior to cluster analysis, Biometrics 35.pl_PL
dc.referencesTadesse M., Sha N., Vanucci M., (2005), Bayesian Variable Selection in Clustering High-Dimensional Data, Journal of the American Statistical Association v. 100.pl_PL
dc.referencesTadesse M., Kim S., Vanucci M., (2006), Variable selection in clustering via Dirichlet process mixture models, Biometrika 93.pl_PL
dc.referencesTalavera L., (2000), Dependency-Based Feature Selection for Clustering Symbolic Data, Intelligent Data Analysis 4.pl_PL
dc.referencesTibshrani R., Walther G., Hastie T., (2001), Estimating the Number of Clusters in a Datase via the Gap Statistic, Journal of the Royal Statistical Society 32.pl_PL
dc.referencesTorgerson W., (1952), Multidimensional Scaling: I.Theory and method, Psychometrika 17.pl_PL
dc.referencesvan Buuren S., Heiser W., (1989) Clustering N Objects into K Groups Under Optimal Scaling of Variables, Psychometrika 54.pl_PL
dc.referencesWalesiak M., (1993), Strategie postępowania w badaniach statystycznych w przypadku zbioru zmiennych mierzonych na skalach różnego typu, Badania Operacyjne i Decyzje 1.pl_PL
dc.referencesWalesiak M., (2002), Uogólniona miara odległości w statystycznej analizie wielowymiarowej, Wydawnictwo AE Wrocław.pl_PL
dc.referencesWalesiak M., (2005), Problemy selekcji i ważenia zmiennych w zagadnieniu klasyfikacji, W: K. Jajuga, M. Walesiak, Klasyfikacja i analiza danych – teoria i zastosowania, Taksonomia 12, Prace Naukowe AE we Wrocławiu nr 1076.pl_PL
dc.referencesWalesiak M., (2011), Uogólniona miara odległości GDM w statystycznej analizie wielowymiarowej z wykorzystaniem programu R, Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu.pl_PL
dc.referencesWalesiak M., Dudek A., (2008), Identification of noisy variables for nonmetric and symbolic data in cluster analysis, W: C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker (red.), Data analysis, machine learning and applications, Springer-Verlag, Berlin, Heidelberg.pl_PL
dc.referencesWalesiak M., Gatnar E., (2009), Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa.pl_PL
dc.referencesWaller N., Underhill J, Kaiser H., (1999), A Method for Generating Simulated Plasmodes and Artificial Test Clusters with User-Defined Shape, Size and Orientation. Multivariate Behavioral Research, 34.pl_PL
dc.referencesWieczorkowski R., Zieliński R., Komputerowe generatory liczb losowych, Wydawnictwa Naukowo Techniczne, Warszawa 1997.pl_PL
dc.referencesWitten D., Tibshirani R., (2010), A framework for feature selection in clustering, Journal of the American Statistical Association 105.pl_PL
dc.referencesZhou J., He X., (2008), Dimension Reduction Based on Canonical Correlation and Variable Filtering, Annals of Statistics 36.pl_PL
dc.identifier.doi10.18778/7525-695-6


Pliki tej pozycji

Thumbnail
Thumbnail
Thumbnail

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord

Attribution-NonCommercial-NoDerivatives 4.0 Międzynarodowe
Poza zaznaczonymi wyjątkami, licencja tej pozycji opisana jest jako Attribution-NonCommercial-NoDerivatives 4.0 Międzynarodowe