Pokaż uproszczony rekord

dc.contributor.authorKorzeniewski, Jerzy
dc.date.accessioned2019-07-12T11:41:39Z
dc.date.available2019-07-12T11:41:39Z
dc.date.issued2019
dc.identifier.issn0208-6018
dc.identifier.urihttp://hdl.handle.net/11089/29430
dc.description.abstractIn recent years a couple of methods aimed at time series symbolic representation have been introduced or developed. This activity is mainly justified by practical considerations such memory savings or fast data base searching. However, some results suggest that in the subject of time series clustering symbolic representation can even upgrade the results of clustering. The article contains a proposal of a new algorithm directed at the task of time series abridged symbolic representation with the emphasis on efficient time series clustering. The idea of the proposal is based on the PAA (piecewise aggregate approximation) technique followed by segmentwise correlation analysis. The primary goal of the article is to upgrade the quality of the PAA technique with respect to possible time series clustering (its speed and quality). We also tried to answer the following questions. Is the task of time series clustering in their original form reasonable? How much memory can we save using the new algorithm? The efficiency of the new algorithm was investigated on empirical time series data sets. The results prove that the new proposal is quite effective with a very limited amount of parametric user interference needed. en_GB
dc.description.abstractW ostatnich latach pojawiły się metody symbolicznego reprezentowania szeregów czasowych. Te badania są zasadniczo motywowane względami praktycznymi, takimi jak oszczędzanie pamięci lub szybkie przeszukiwanie baz danych. Niektóre wyniki w temacie symbolicznego reprezentowania szeregów czasowych sugerują, że zapis skrócony może nawet poprawić wyniki grupowania. Artykuł zawiera propozycję nowego algorytmu ukierunkowanego na zagadnienie skróconej symbolicznej reprezentacji szeregów czasowych, a w szczególności na efektywne grupowanie szeregów. Idea propozycji polega na wykorzystaniu techniki PAA (piecewise aggregate approximation) z następną analizą korelacji otrzymanych segmentów szeregu. Podstawowym celem artykułu jest modyfikacja techniki PAA ukierunkowana na możliwość dalszego grupowania szeregów w ich skróconym zapisie. Próbowano również znaleźć odpowiedzi na następujące pytania: „Czy zadanie grupowania szeregów czasowych w ich oryginalnej postaci ma sens?”, „Ile pamięci można oszczędzić, stosując nowy algorytm?”. Efektywność nowego algorytmu została zbadana na empirycznych zbiorach danych szeregów czasowych. Wyniki pokazują, że nowa propozycja jest dość efektywna przy bardzo nikłym stopniu parametryzacji wymaganym od użytkownika.pl_PL
dc.language.isoenen_GB
dc.publisherWydawnictwo Uniwersytetu Łódzkiegoen_GB
dc.relation.ispartofseriesActa Universitatis Lodziensis. Folia Oeconomica; 341
dc.rightsThis work is licensed under the Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 License.en_GB
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0en_GB
dc.subjectclusteringen_GB
dc.subjecttime seriesen_GB
dc.subjectsymbolic representationen_GB
dc.subjectdata miningen_GB
dc.subjectanaliza skupieńpl_PL
dc.subjectszereg czasowypl_PL
dc.subjectreprezentacja symbolicznapl_PL
dc.subjectdata miningpl_PL
dc.titleAbridged Symbolic Representation of Time Series for Clusteringen_GB
dc.title.alternativeSkrócona reprezentacja symboliczna szeregów czasowych dla analizy skupieńpl_PL
dc.typeArticleen_GB
dc.page.number43-50
dc.identifier.eissn2353-7663
dc.referencesAgrawal R., Faloutsos C., Swami A. (1993), Efficient similarity search in sequence databases, “Lecture Notes in Computer Science”, vol. 730, pp. 69–84.pl_PL
dc.referencesBagnall A., Janacek G. (2005), Clustering time series with clipped data, “Machine Learning”, vol. 58(2–3), pp. 151–178.pl_PL
dc.referencesFu T. (2011), A review on time series data mining, “Engineering Applications of Artificial Intelligence”, vol. 24, Issue 1, pp. 164–181.pl_PL
dc.referencesGatnar E., Walesiak M. (2004), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław.pl_PL
dc.referencesGavrilov M., Anguelov D., Indyk P., Motwani R. (2000), Mining the stock market: which measure is best, Proceedings of the eighth ACM SIGKDD international conference on knowledge discovery and data mining, Boston, pp. 487–496.pl_PL
dc.referencesGrabiński T., (1992), Metody taksonometrii, Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków.pl_PL
dc.referencesKorzeniewski J. (2012), Metody selekcji zmiennych w analizie skupień. Nowe procedury, Wydawnictwo Uniwersytetu Łódzkiego, Łódź.pl_PL
dc.referencesMöller‑Levet C. S., Klawonn F., Cho K., Wolkenhauer O. (2003), Fuzzy clustering of short time‑series and unevenly distributed sampling points, “Lecture Notes in Computer Science”, vol. 2811, pp. 330–340.pl_PL
dc.referencesStruzik Z. R., Siebes A. (1999), Measuring time series’ similarity through large singular features revealed with wavelet transformation, Proceedings of tenth international workshop on database & expert systems applications, Berlin, pp. 12–22.pl_PL
dc.referencesYeh M. Y., Dai B. R., Chen M. S. (2007), Clustering over multiple evolving streams by events and correlations, “IEEE Transactions on Knowledge and Data Engineering”, vol. 19(10), pp. 1349–1362.pl_PL
dc.referencesYin J., Gaber M. M. (2008), Clustering distributed time series in sensor networks, Proceedings of the eighth IEEE international conference on data mining, Washington, pp. 678–687.pl_PL
dc.contributor.authorEmailjurkor@wp.pl
dc.identifier.doi10.18778/0208-6018.341.03
dc.relation.volume2en_GB
dc.subject.jelC22en_GB


Pliki tej pozycji

Thumbnail

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord

This work is licensed under the Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 License.
Poza zaznaczonymi wyjątkami, licencja tej pozycji opisana jest jako This work is licensed under the Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 License.