«Қазақ тілінің ұлттық корпусы» атты смарт база таныстырылды

«Қазақ тілінің ұлттық корпусы» атты смарт база таныстырылды

Х.Досмұхамедов атындағы Атырау университетінде Ахмет Байтұрсынов атындағы Тіл білімі институтының директоры Анар Фазылжановамен кездесу өтті. Тіл жанашыры «Қазақ тілінің Ұлттық корпусы» деп аталатын қазақ мәтіндерінің смарт базасын профессор оқытушылар құрамы мен студенттерге таныстырды. 
Тілдің грамматикасы мен сөздік қорын бір базаға жинақтап, қолданушының мүмкін болатын сұраныстарына қарай жасалған іздеу жүйесі бар ресурстың мәтіндік базасының көлемі – 50 миллион сөзқолданысты құрайды. Оның ішінде көлемі 14 миллион сөзқолданыстан тұратын мәтінге 16-21 параметрлік метабелгіленім енгізілген. Жинақталған мәтіндер қазақ тілінің 5 стилінен алынған. 
«Біздің онлайн ресурстің басқа платформадан айырмашылығы метабелгіленім арқылы іздеген сөзіңіздің қандай мәтіннен алынғанын, мәтіннің авторын, тақырыбын, жарияланған мерзімін, дереккөзін, стилін, таралу типін, т.б. көрсетеді. Мысалға паралелль мәтіндер корпусын алайық. Абай жолының бір сөйлемінің орысша аудармасы қасында қоса тұрады. Мәтіндегі кез-келген сөзді бассаңыз толық лингвистикалық ақпарат ала аласыз. Бұл сайт кез келген қолданушыға қол жетімді, ашық. Бұл корпусты қазақ тілін үйренуге ниетті адамдар да қолдана алады»,- дейді филология ғылымдарының кандидаты Анар Мұратқызы. 
Бұл маңызды жобаны Ахмет Байтұрсынов атындағы Тіл білімі институтының мамандары жасап шығарған. Сондай-ақ институт қорындағы қазақ сөздерінің картотекалық қоры толықтай цифрлік форматқа көшірілген.

ПІКІРЛЕР

Тізімге қайта оралу