Od CAQDAS do Text Miningu. Nowe techniki w analizie danych jakościowych
Abstract
Celem artykułu jest refleksja metodologiczna nad procesem rozwoju komputerowo wspomaganej analizy danych jakościowych (CAQDAS), który zmierza w kierunku metod eksploracji danych tekstowych służących odkrywaniu wiedzy (Knowledge Discovery in Text Databases, Text Mining). W rozważaniach tych skupiamy się na naukach społecznych, szczególnie w socjologii jakościowej. Zastosowanie wspomaganej komputerowo analizy danych jakościowych w obszarze socjologii jakościowej stało się już poniekąd faktem. Środowisko badaczy jakościowych w Polsce coraz częściej sięga po oprogramowanie CAQDAS w projektach badawczych. Praca z różnorodnymi programami CAQDAS prowadzi do wzrostu świadomości metodologicznej, co przekłada się na większą dokładność i precyzję w procesie analizy danych jakościowych. Jednakże analiza danych jakościowych wykorzystująca metodologię, algorytmy i techniki Text Mining to swoiste novum na gruncie socjologii jakościowej. Text Mining (TM) to zestaw technik, w które wyposażone są programy przeznaczone do automatycznego lub semiautomatycznego wydobywania informacji z danych tekstowych. Text Mining polega na wykorzystaniu oprogramowania komputerowego do znajdowania ukrytych dla człowieka, z uwagi na ograniczone możliwości percepcyjne i czasowe, prawidłowości zawartych w danych tekstowych. Jeśli algorytmy analityczne CAQDAS wykorzystuje się w pracy z mniejszymi zbiorami danych jakościowych, to techniki Text Mining pozwalają na prowadzenie analiz, w których wielkość zbioru danych jest w zasadzie nieograniczona. W artykule staramy się ukazać proces rozwoju algorytmów analitycznych CAQDAS w kierunku Text Mining. Staramy się także znaleźć odpowiedź na pytanie, czy te podejścia są względem siebie konkurencyjne czy raczej komplementarne? The aim of this article is methodological reflection on the development of computer-assisted qualitative data analysis in the direction of Knowledge Discovery in Textual Databases and Text Mining. In our consideration we focus on the social sciences area, especially qualitative analysis. In the last few years the usage of computer-assisted qualitative data analysis in the field of qualitative sociology has become a fact. Environment of qualitative researchers are increasingly reaching for CAQDAS software in their research projects. Our experience show that possibility of working with various CAQDAS programs leads to increased methodological awareness, which moves to greater accuracy and precision in the process of qualitative data analysis. The idea of usage Text Mining techniques, Natural Language Processing and Data Mining methodology is a novelty in the field of qualitative sociology. Text Mining is a set of techniques, which are equipped with programs designed for automatic or semiautomatic extracting and analyzing informations from textual data. Text Mining involves the use of computer software in finding relationships in the unstructured, textual data, which are hidden for a human due to its limited perceptual and temporal abilities. If CAQDAS analytical algorithms are rather used to work with a smaller qualitative data sets, Text Mining techniques allows to analyze unlimited textual data sets. In this article we would like to approach the key elements of the process of Text Mining analysis and try to answer the question whether these approaches compete with each other, or are rather complementary?
Collections
The following license files are associated with this item: