MOKOMASIS LIETUVIŲ KALBOS TEKSTYNAS: NAUJAS IŠTEKLIUS BESIMOKANTIESIEMS LIETUVIŲ KALBOS
DOI:
https://doi.org/10.2478/sm-2020-0019Keywords:
mokomasis tekstynas, lietuvių kalbos kaip svetimosios mokymas(is), Bendrieji Europos kalbų mokymosi, mokymo ir vertinimo metmenys, rašytinė kalba, sakytinė kalba, automatinis tekstų klasifikavimasAbstract
Straipsnyje pristatomas pirmasis mokomasis lietuvių kalbos tekstynas, t. y. vienakalbis specialusis tekstynas, skirtas mokyti(s) lietuvių kalbos kaip svetimosios. Tekstynas kuriamas vykdant projektą „Užsienio baltistikos centrų ir Lietuvos mokslo ir studijų institucijų bendradarbiavimo skatinimas“. Tokio ištekliaus atsiradimą paskatino tai, kad bendrojo pobūdžio tekstynuose, pvz., Dabartinės lietuvių kalbos tekstyne, pateikiami duomenys ir jų dydis besimokantiesiems lietuvių kalbos kaip užsienio kalbos yra per sudėtinga mokymosi medžiaga. Mokomajame tekstyne yra autentiškos lietuvių kalbos vartosenos tekstų, kurie atrinkti pagal tokius kriterijus, kad būtų suprantami ir aktualūs skirtingų lygių besimokantiesiems. Visi tekstai pagal Bendruosius Europos kalbų mokymosi, mokymo ir vertinimo metmenis suklasifikuoti į A1, A2, B1 ir B2 lygius. Tekstyną sudaro skirtingų kalbos atmainų (rašytiniai ir transkribuoti sakytiniai) tekstai. Iš viso mokomąjį lietuvių kalbos tekstyną sudaro 669 000 žodžių: 111 000 žodžių A1–A2 lygio rašytinės ir natūraliosios spontaninės kalbos tekstų, 558 000 žodžių B1–B2 lygio rašytinės ir spontaninės sakytinės kalbos tekstų. Šiame straipsnyje išsamiai aprašomas rašytinės kalbos patekstynis, kurį sudaro vadovėliniai ir nevadovėliniai tekstai, šio patekstynio dydis – apie 620 000 žodžių. Vadovėlinių tekstų kalbos lygis dažniausiai būdavo aiškus, o nevadovėliniai tekstai buvo automatiškai suklasifikuoti atliekant straipsnyje aprašytą tyrimą. Vadovėliniai ir nevadovėliniai tekstai suklasifikuoti į 29 žanrus (dialogus, pasakojimus, informacinius tekstus ir kt.) ir keturias grupes pagal komunikacinius tikslus (informacinius, pažintinius, apeliacinius ir meninius). Rašytinės kalbos patekstynyje daugiausiai yra informacinių tekstų; skiriasi dažniausi vadovėlinių ir nevadovėlinių tekstų žanrai: trys dažniausi vadovėlinių tekstų žanrai yra pažintiniai tekstai, pasakojimai ir dialogai (kartu šių trijų žanrų tekstai sudaro apie 78 proc. visų vadovėlinių tekstų). Nevadovėlinių tekstų patekstynio žanrų įvairovė didesnė: didžiąją dalį (apie 73 proc.) sudaro penkių žanrų tekstai: subtitrai, informaciniai tekstai, pažintiniai tekstai, proza, patarimai. Straipsnio apibendrinamosiose pastabose paminėta, kokie laukia tolesni darbai, susiję su mokomuoju tekstynu, kaip jis gali būti panaudotas.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Sustainable Multilingualism

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.