Lematizasyon ve Türkçe için bir lematizasyon uygulaması: elemanTR

Bekir Tahir TAHİROĞLU
2021 Rumelide dil ve edebiyat dergisi  
R u m e l i D E D i l v e E d e b i y a t A r a ş t ı r m a l a r ı D e r g i s i 2 0 2 1 . 2 4 ( E y l ü l ) / 4 7 5 Lematizasyon ve Türkçe için bir lematizasyon uygulaması: elemanTR / B. T. Tahiroğlu (475-486. s.) , phone: +90 505 7958124, +90 216 773 0 616 trained with machine learning with approximately 1 million 200 thousand sentences prepared from 184 novels and story texts in Turkish, was found to be 99.01% in the test data. It is thought that this success rate will be a sustainable
more » ... ture with the new data to be added to the training data, and a general Turkish lemmatization application of this model will be a pioneer for further studies. It is predicted that the trained model will also be useful in automatic part of speech identification, syntactic analysis, and automatic identification of new words. , phone: +90 505 7958124, +90 216 773 0 616 (Mikolov vd., 2013, s.1) . elemanTR uygulaması için platformun varsayılan vektör boyutu olan 100 boyut ayarı kullanılmıştır. Şekil 2. Sözcüklerin skip-gram modeli yapısı (Mikolov vd., 2013, s.5) 5 https://github.com/danielfrg/word2vec 4 82 / Ru m el iDE J ou rn a l o f L an gu a ge an d Li t er at u r e S t ud i es 2 0 2 1 .2 4 ( S ep t em b er ) Lemmatization and a lemmatization application for Turkish: elemanTR / B. T. Tahiroğlu (pp. 475-486) , phone: +90 505 7958124, +90 216 773 0 616 Şekil 4. "Denizlerdeki koyun her iki yakasını görmüşlerdi." cümlesinin lematizasyon sunucu. Şekil 4'te görüldüğü gibi uygulama "koyun" sözcüğünü "koy" biçiminde lematize edememiştir. Diğer sözcükler (denizlerdeki -> deniz, yakasını -> yaka, görmüşlerdi -> görmek, her -> her, iki -> iki) doğru biçimde işlenmiştir. Örnek cümle 2: "Yemekleri masaya koyun dedi." Cümlede olması gereken hedef çıktı koy-un biçiminde koymak fiilidir. Şekil 5. "Yemekleri masaya koyun dedi." cümlesinin lematizasyon sunucu. Şekil 5'te "koyun" sözcüğü dışındaki sözcükler doğru olarak lematize edilmiştir. 4 84 / Ru m el iDE J ou rn a l o f L an gu a ge an d Li t er at u r e S t ud i es 2 0 2 1 .2 4 ( S ep t em b er ) Lemmatization and a lemmatization application for Turkish: elemanTR / B. T.
doi:10.29000/rumelide.995343 fatcat:lslyy2pqrjahjjqoues5vdolyi