The importance of context and semantic descriptions in object recognition: Studies in computer vision and human vision

Selim Aksoy, Huseyin Boyaci, Didem Gokcay
2008 2008 IEEE 16th Signal Processing, Communication and Applications Conference  
Ozet~e Sahne slniflandlrmaSl ve nesne tanlma, bilgisayarla g6rme alanlnda fok uzun Ylllardlr uzerinde falz~zlan temel problemlerdir. Bilgisayarlara kazandlrzlmaya falz~zlan, sahnelerin ve iferdikleri nesnelerin otomatik olarak tanlnmaSl ve etiketlendirilmesi yetenegi, yapay zeka konusunda onemli bir adlm olma potansiyeli ta~lmaktadlr. Bu yetenek, her gefen gun artan hesaplama kapasitesi ile birle~tirildiginde de henuz f6zumu mumkun olmayan birfok uygulamanln da gerfekle~tirilmesi mumkun
more » ... r. Yazlmlzda, nesne tanlmayl kolayla~tlran anlambilimseI slniflandlrma yakla~lmlarz, hem bilgisayarda hem de insanda g6rme alanlarzndaki literatur uzerinden ozetlenmektedir. Abstract . Object recognition and scene classification are among the main interests in computer vision which have been investigated for long. Automatic recognition and classification ofobjects and scenes is an important skill to be gained by computers, especially in the field of artificial intelligence. Merging this skill with the ever increasing computing power of the computers will help in the development ofmany applications that are yet to be resolved. In this article, we present a survey on contextual and semantic approaches for object recognition by reviewing both computer vision and human vision literatures 978-1-4244-1999-9/08/$25.00 ©2008 IEEE 1. GiriB ilgisayarla gorme a~lslndan baktldlglnda, sahne SlnlflandlrmaSI ve nesne tanlma probleminde iki ana bile~en vardlr: i~erik modelleme ve anlambilimsel Slnlflandlrma. 1.1. i~erik Modelleme Bilgisayarla gorme a~lslndan baktldlglnda, sahnelerin i~eriklerinin modellenmesi konusunda geleneksel olarak izlenilen yontem, goruntiilerin biiruniinden~lkanlan dii~iik seviyeli (low-level) ozniteliklerin (feature) kullanllmasldlr. Bu konuda, renk ve doku histogramlan gibi oznitelikler goruntiileri i~mekan/dl~mekan,~ehir/doga gibi slnlflara ayn~t1rmak i~in kullantlml~t1r. 6megin, Vailaya ve ekibi [1] renk ve aynt yonelim histogramlan kullanarak Bayes~i slnlflandlnctlar ile gorunruleri bu rur ikili gruplara aYlrml~t1r. Bu tUr yontemlerle kii~iik ve sffilrh veri kiimelerinde ba~anh sonu~lar elde edilmesine kar~ln, gorunrulerdeki nesneleriñ e~itliligi ve karma~lk arkaplanIar gorunrulerin slnlflandlnlmasl i~in bolge temelli yerel ozniteliklerin analizini gerektirmektedir. Bu konuda son zamanlardaki en popiiler yontemlerden biri, goruntiilerde ilgi noktalannln (interest points) [2] bulunmaslna, bu noktalann~evrelerindeñ lkanlan ozniteliklerin nicemlenmesi ile bir kod tablosu olu~turulmaslna, ve gorunrulerin bu kod tablosundaki gorsel kelimeler (visual words) kullantlarak modellenmesine dayanmaktadlr. Omegin, Fei-Fei ve Perona [3], bu tiir gorsel kelimeleri ve olu~turduklan gruplarl ogreticisiz bir~ekilde ogrenen yontemleri sahne slnlflandlrmasl i~in kullanml~lardlf. Quelhas ve ekibi [4] de benzer modelleri goruntii bolgelerini
doi:10.1109/siu.2008.4632760 fatcat:jtq3hfw3ira3zcd3mchfvbnj2q