CAQDAS, Data Mining i odkrywanie wiedzy w danych jakościowych
Abstract
Celem artykułu jest refleksja metodologiczna nad procesem rozwoju wspomaganej komputerowo analizy danych jakościowych (CAQDAS) od tradycyjnej analizy jakościowej (Qualitative Analysis) opartej przede wszystkim na teorii ugruntowanej, poprzez analizę treści (Qualitative Content Analysis), w kierunku wykorzystania w socjologii jakościowej czy naukach społecznych zaawansowanych metod eksploracji danych i odkrywania wiedzy (Data Mining, DM and Knowledge Discovery in Datasets, KDD). Rozwój technologii informatycznych w zakresie gromadzenia i przetwarzania informacji oraz algorytmów i technik analitycznych doprowadził do sytuacji, w której wykorzystywanie ich osiągnięć na gruncie socjologii jakościowej i nauk społecznych staje się naturalnym procesem rozwoju CAQDAS. Obecnie wykorzystywanie CAQDAS w obszarze socjologii jakościowej jest na tyle powszechne, że nie budzi zdziwienia, że coraz więcej badaczy, także w Polsce, sięga po oprogramowanie komputerowe w analizie danych jakościowych. Specyfika CAQDAS uczy swoistego rygoryzmu metodologicznego, dokładności i precyzji w procesie analizy danych jakościowych, co pozytywnie odbija się na jakości prowadzonych analiz i badań. Jednakże analiza danych jakościowych wykorzystująca metodologię Data Mining to novum na gruncie socjologii jakościowej. Wiąże się to nie tylko z rozwojem nowych algorytmów czy technik analitycznych, ale także ze zmianami w podejściu do komputerowej analizy danych jakościowych, wzbogacaniem programów o możliwości pogłębionej analizy treści i struktury lingwistycznej dokumentów tekstowych. W obszarze CAQDAS towarzyszy temu zjawisku obserwowany od kilku lat zwrot metodologiczny w kierunku paradygmatu mixed-methods w naukach społecznych, a w szczególności w badaniach jakościowych. Jego konsekwencją jest implementacja wielowymiarowych technik statystycznej analizy danych, technik eksploracji danych tekstowych (Text Mining), a także algorytmów z dziedziny inteligencji komputerowej czy przetwarzania języka naturalnego w programach do wspomaganej komputerowo analizy danych jakościowych (QDA Miner, Qualrus czy T-Lab). Zdecydowana większość tych rozwiązań ma swe korzenie właśnie w dynamicznie rozwijającej się od kilkunastu lat metodologii Data Mining. Jeśli oprogramowanie CAQDAS wykorzystuje się najczęściej do pracy z mniejszymi zbiorami danych jakościowych, to Data Mining pozwala na prowadzenie analiz, w których wielkość zbioru danych jest w zasadzie nieograniczona. Celem tego artykułu jest przybliżenie środowisku badaczy jakościowych w Polsce metodologii Data Mining i odkrywania wiedzy w danych, a tym samym zachęcenie do eksperymentowania z nowymi podejściami w obszarze CAQDAS. W artykule staram się także ukazać relacje pomiędzy CAQDAS i teorią ugruntowaną a Data Mining i procesem odkrywania wiedzy w danych na gruncie socjologii jakościowej i szerzej – nauk społecznych. The aim of this article is methodological reflection over the process of the development of the computer-assisted qualitative data analysis (CAQDAS) from traditional qualitative analysis based primarily on grounded theory procedures by qualitative content analysis techniques, towards the use of advanced methods and techniques of Data Mining and Knowledge Discovery in Datasets, in the field of qualitative sociology and social sciences. This process is accompanied by expansion of information technology in the qualitative sociology, the evolution of ways of collection and processing informations, and erosion of the new algorithms and analytical techniques, what has led to a situation in which the usage of their achievements in the field of qualitative sociology and social science is a natural process of development of CAQDAS. Currently the use of CAQDAS in the area of qualitative sociology is rather common and that it is not surprising that more and more researchers, including Poland, reaches for the computer software in qualitative data analysis. CAQDAS teaches methodological rigor, accuracy and precision in qualitative data analysis, what positively affects the quality of the analyzes and research. However, the analysis of qualitative data using the methodology of Data Mining is a novelty in the field of qualitative sociology. This involves not only the use of new algorithms and analytical techniques, but also with changes in the approach to computer- aided analysis of qualitative data, adding new functionalities such as the possibility the analysis of the content and structure of the linguistic text documents. The changes in the area of CAQDAS are accompanied by observed for several years methodological return towards mixed-methods in the sociology and social sciences, particularly in qualitative research and data analysis. Its consequence is the implementation of multivariate statistical techniques, textual data mining techniques, algorithms of computer intelligence and natural language processing into programs for computer-assisted qualitative data analysis (QDA Miner, Qualrus or T-Lab). The majority of these solutions have its roots in the booming Data Mining methodology. Generally CAQDAS software are mostly used to work with smaller data sets, but Data Mining allows to conduct analyzes in which the size of the data set is basically unlimited. The purpose of this article is to present to the community of qualitative researches in Poland the methodology of Data Mining and procedures of knowledge discovery in data, and thus encourage them to experiment with new approaches in the area of CAQDAS. I also try to show the relationship between CAQDAS and grounded theory, Data Mining and process of knowledge discovery in data in the field of qualitative sociology, and broadly in the social sciences.
Collections
The following license files are associated with this item: