Frequency Dictionaries from Lazar Baranovych’s Collection of Sermons Трубы на дни нарочитыя праздніков (Kyiv, 1674) – Tokenization and Lemmatization Analysis (dataset)
Streszczenie
The dataset contains a compilation of lexemes derived from the text of the collection of sermons Трубы на дни нарочитыя праздніков (Kyiv, 1674) by Lazar Baranovych, representing the Ukrainian recension of the Church Slavonic language. The data is structured into two frequency dictionaries: the first presents the results of tokenization and includes lexemes in the form in which they appear in the text, while the second contains words in their base forms (lemmas). This compilation provides material for research on the interference of the Ukrainian language with the Ukrainian recension of Church Slavonic, as well as an analysis of the differences between the language of the main text and that of the prefaces. It also enables quantitative studies, such as frequency analysis, repetition rate examination, and the concentration of unique vocabulary in different sections of the text. Dataset zawiera zestawienie leksemów pochodzących z tekstu zbioru kazań Трубы на дни нарочитыя праздніков (Kijów, 1674) autorstwa Łazara Baranowicza, reprezentującego ukraińską redakcję języka cerkiewnosłowiańskiego. Dane zostały ujęte w dwóch słownikach częstotliwości: pierwszy przedstawia wyniki tokenizacji i zawiera leksemy w takiej formie, w jakiej występują w tekście, drugi obejmuje wyrazy w ich formach podstawowych (lematy). Zestawienie dostarcza materiału do badań nad interferencją języka ukraińskiego z ukraińską redakcją języka cerkiewnosłowiańskiego oraz analizą różnic między językiem tekstu głównego a językiem przedmów. Umożliwia także przeprowadzenie badań ilościowych, takich jak m.in. analiza częstotliwościowa, badanie wskaźnika powtórzeń oraz koncentracji unikalnego słownictwa w poszczególnych częściach tekstu.
Collections
Z tą pozycją powiązane są następujące pliki licencyjne: