МИЛЛИЙ КОРПУС ЯРАТИШНИНГ ТЕХНОЛОГИК ЖАРАЁНИ ХУСУСИДА

Guli TAIROVA
2020 Foreign Languages in Uzbekistan  
Мақолада тилнинг интернет, компьютер технологиялари тилига айланиши математик лингвистика, унинг давоми бўлган компьютер лингвистикасининг шаклланганлиги ва ривожланиш даражаси билан боғлиқлиги, айниқса, сунъий интеллект учун табиий тилларни моделлаштириш муаммоси хусусида мушоҳада юритилган. Ўзбек тилининг халқаро мақомини оширишда ўзбек тили миллий корпуси катта аҳамиятга эга. Компьютер лингвистикаси фани доирасида амалга оширилаётган ишлар ўзбек тилидаги мавжуд муаммоларни ҳал этишда муҳим
more » ... ль ўйнайди. Мақолада миллий корпус яратишнинг заруратлари нимада эканлиги, таълим жараёнида сўзнинг нозик қиррасини ўрганиш, уни нутқида қўллаш кўникмасини шакллантиришда нимага таяниш кераклиги, ўзбек тили миллий корпуснинг фан ва миллат учун нима аҳамияти борлиги, ўзбек тили миллий корпуснинг асосий фойдаланувчилари ким бўла олиши мумкинлиги хусусида асосли фикр-мулоҳазалар билдирилди. Корпуснинг асосий фойдаланувчилари, албатта, турли йуналишларда иш олиб бораётган тилшунос тадқиқотчилардир. Маълум бир даврдаги тилга оид ишончли статистик маълумотлар адабиётшунослар, тарихчилар ва бошка гуманитар соҳалар вакилларини ўзига жалб этиб келгандир. Тилни ўқитишда ҳам миллий корпуснинг ахамияти каттадир. Миллий корпус яратишнинг технологик жараёни хусусида фикр-мулоҳазалар баён қилинди. Жумладан, миллий корпус технологик жараёни: танланган матнлар асосида лексема ва сўз шаклларининг такрорланиши луғатини яратиш; олинган такрорланиш луғатининг ҳар қандай бирлиги учун матнни кўриб чиқиш; графикли сўзни бўғинга ажратиш ва бўғинларнинг такрорланиш луғатини тузиш; сўз захираларини саралаш; бир вақтнинг ўзида чекланмаган файлларни қайта ишлаш; ташқи белгиларга эга бўлган матнлар корпусларини яратиш кабилардан иборатлиги изоҳлаб берилган
doi:10.36078/1588232876 fatcat:bvyimvwlo5ga7nmnm4mowf5seq