Wrażliwość regionalnych rynków pracy Unii Europejskiej na kryzys ekonomiczny. Klasyfikacja metodą Warda z warunkiem spójności
Streszczenie
Popularne procedury grupowania zastosowane do grupowania jednostek administracyjnych
(regionów, powiatów, gmin), prowadzą bardzo często do wyodrębnienia niespójnych grup,
co bywa trudne do zaakceptowania przez odbiorców analiz. Także podejście intuicyjne każe
poszukiwać podziałów koherentnych, bowiem znakomicie ułatwia to zarówno interpretację
wyników jak i ich praktyczne wykorzystanie.
W pracy przedstawiono modyfikację metody Warda poprzez wprowadzenie warunku
spójności skupień na każdym etapie aglomeracji. Punktem wyjścia procedury grupowania jest
zatem nie tylko macierz odległości pomiędzy obiektami, ale także macierz ich wzajemnego
sąsiedztwa, najczęściej rozumianego dosłownie, w sensie geograficznym. Poszukując dwóch najbliższych sobie skupień, pod uwagę brane są tylko te z nich, które ze sobą sąsiadują.
Zmodyfikowany algorytm grupowania zaimplementowano jako rozszerzenie programu
STATISTICA.
Ilustracją zmodyfikowanego algorytmu grupowania są wyniki klasyfikacji regionów Unii
Europejskiej ze względu na wrażliwość na kryzys ekonomiczny. Celem analizy było
wyodrębnienie spójnego podziału regionów unijnych względem wybranych zmiennych
diagnostycznych, ilustrujących zmiany na regionalnych rynkach pracy UE w latach 2008-2012. The popular clustering procedures applied in administrative units clustering (regions,
districts, municipalities) frequently result in distinguishing incoherent groups, which is difficult to
accept by the analyses addressees. The intuitive approach also imposes the investigation of
coherent divisions, since it greatly facilitates both the interpretation of results and their practical
application.
The study presents the modification of Ward method by applying the condition of cluster
coherence at every agglomeration stage. Therefore the starting point of the clustering procedure
is not only the distance matrix between objects, but also their mutual neighbourhood matrix, most
often understood literally, in the geographical sense. While searching for two closest clusters only
the neighbouring ones were considered. The modified clustering algorithm was implemented
as the extension of STATISTICA software.
The modified clustering algorithm is illustrated by the classification results of the European
Union regions regarding sensitivity to economic crisis. The objective of analysis was to distinguish
the coherent division of EU regions against the selected diagnostic variables illustrating changes
on the EU labour markets in the period 2008-2012.
Collections