Türkçe Hedef Tabanlı Duygu Analizi İçin Alt Görevlerin İncelenmesi – Hedef Terim, Hedef Kategori Ve Duygu Sınıfı Belirleme

Fatih Samet ÇETİN, Gülşen Eryiğit
2018 Bilişim Teknolojileri Dergisi  
Özet-Geleneksel olarak doküman veya cümle seviyesinde yürütülen duygu analizi çalışmaları, hedef tabanlı duygu analizi çalışmalarının ortaya çıkması ile yeni bir seviyeye taşınmıştır. Hedef tabanlı duygu analizi (Aspect based sentiment analysis) kısaca, bir metnin içinde yer alan farklı duyguların ilgili oldukları hedef varlıklar ile birlikte tespit edilmesi olarak tanımlanabilir. Güncel tanımlamalar, hedef tabanlı duygu analizini, üç temel alanla (hedef terim, hedef kategori ve duygu sınıfı)
more » ... msil edilen duygu tanımlama gruplarını belirlemeyi amaçlayan aşamalı bir görev olarak betimlemektedir. Bu makalede, Türkçe hedef tabanlı duygu analizi konusunda yapılan incelemeler sunulmaktadır. Yürütülen çalışmalar, ABSA 2016 yarışmasındaki görevler (1-Hedef kategori belirleme, 2-Hedef terim belirleme, 3-Hedef kategori ve hedef terimin aynı anda belirlenmesi ve 4-Duygu sınıfı belirleme) takip edilerek tasarlanmış ve yine burada sağlanan Türkçe restoran yorumları veri kümesi üzerinde değerlendirilmişlerdir. Hedef kategori, hedef terim ve ikisinin aynı anda belirlenmesi görevleri için, kelime vektörleri (word vectors) ve doğal dil işleme çıktıları (sözcük ve cümle analizi bilgileri) kullanan koşullu rastgele alanlara (CRFconditional random fields) dayalı bir dizilim etiketleme algoritması tasarlanmış ve her üç görevi de tek aşamada çözebildiği gösterilmiştir. Elde edilen sonuçlar ile bu ilk üç görev için literatürdeki en yüksek başarımların elde edildiği görülmüştür: Hedef kategori belirlemede %66,7 F1-skoru, hedef terim belirleme %53,2 F1-skoru, hedef kategori ve hedef terimin aynı anda belirlenmesinde %46,7 F1-skoru. Bunun yanı sıra, duygu sınıfı belirleme için cümle analizi sonucunda hedef terime yakın kelimelerden özellik seçimine dayalı bir lineer sınıflandırma yöntemi sunulmuş ve literatürde sınırlı sistemler tarafından raporlanan en başarılı sonuç (%76,1 F1-skoru) elde edilmiştir. Anahtar Kelimeler-hedef tabanlı duygu analizi, Türkçe, doğal dil işleme Abstract-Sentiment analysis studies conducted traditionally at document or sentence level have been moved to a new level with the emergence of aspect based sentiment analysis studies. Aspect-based sentiment analysis can be briefly defined as the detection of different opinions contained within a text together with the target entities to which they relate. Current definitions describe aspect based sentiment analysis as a gradual task aiming to identify opinion tuples represented by three main fields (target term, target category, sentiment class). This article presents our investigations on aspect based Turkish sentiment analysis. The work carried out in this article is designed by following ABSA 2016 competition tasks (1-Aspect category identification, 2-Aspect term identification, 3-Identification of aspect category and aspect term together and 4-sentiment category classification) and evaluated on the Turkish restaurant reviews dataset provided in the same event. For the first three tasks, a sequence labeling algorithm (based on conditional random fields (CRF)) which uses word vectors and natural language processing outputs (word and sentence analyses) is proposed and shown to solve these three tasks in one step. Experimental results show that the proposed system achieves the highest performances for these tasks: 66.7% F1-score for aspect category identification, 53.2% F1-score for aspect term identification, 46.7% F1score for both aspect category and aspect term at the same time. Additionally, a linear classification method based on feature selection from positionally and syntactically neighboring tokens is proposed for sentiment category classification task and shown to perform as the best constrained system reported in the literature with 76.1% F1-score.
doi:10.17671/gazibtd.325865 fatcat:tlxxrwcjdng77npqx7x5t3nrii