Prepoznavanje krajšav v besedilih

Mojca Kompara
2015 Jezikoslovni zapiski  
V prispevku so predstavljene krajšave, vsesplošno rastoči fenomen, ki je prisoten v vseh jezikih. V slovenskem prostoru so se s krajšavami ukvarjali številni slovničarji, podrobno jih je klasificiral Matej Rode, zadnja obsežna klasifikacija pa je v Slovenskem pravopisu iz leta 2001. Krajšave so zajete v splošnih, specializiranih, eno- in dvojezičnih slovarjih, zaradi hitre dinamike nastajanja so težje ulovljive, slovarji v pisni obliki pa izhajajo preredko, da bi jih ažurno beležili v same
more » ... eležili v same slovarje. V zadnjih letih nastaja vse več spletnih zbirk, ki so prosto dostopne in ažurne ter uporabniku omogočajo tudi vnos novih krajšav. Zbirke temeljijo na besedilnih korpusih ali spletnih virih in se s pomočjo pravil in algoritmov lahko oblikujejo tudi samodejno. V nadaljevanju prispevka so predstavljeni pristopi samodejnega prepoznavanja krajšav v zbirki ADAM ter metoda Sateve in Nikolova. Ob pomoči slednjega sledi primer algoritma za prepoznavanje krajšav v slovenskih besedilih.
doi:10.3986/jz.v15i1-2.2423 fatcat:adyzytg7rnbybngaohujqetnqe