A copy of this work was available on the public web and has been preserved in the Wayback Machine. The capture dates from 2022; you can also visit the original URL.
The file type is application/pdf
.
Preliminary Report of Fertilizing Science and Technology Thesaurus from Large-Scale Bibliographic Datasets using Word Embedding
単語意味ベクトルを用いた大規模論文抄録データからの科学技術用語シソーラス拡充手法の検討
JSAI Technical Report, Type 2 SIG
単語意味ベクトルを用いた大規模論文抄録データからの科学技術用語シソーラス拡充手法の検討
近年,科学計量学での活用を意図してさまざまな科学技術用語シソーラスの構築が進め られている.しかし,人手での整備には多大なコストと時間を必要とするため,自動構築・改訂手法 の研究が盛んである.そこで本論では,人手で十分に整備された情報がない新興,先端学術分野にお いても適用できるよう,文献抄録に書かれた自然文を入力として単語ベクトルを構築し,ベクトル演 算に基いて新語を既存シソーラス階層内に適切に位置づける手法を検討する.そのため,まず予備実 験として医療系論文 56.7 万編から単語ベクトルを構築し,単語間の is-a や part-of,関連語といった 関係性がベクトル空間内に表されていることを確認した.そして,単語ベクトルの加法構成性を用い て,新語に対して何らかの関係性を持つ用語を JST シソーラス内から検索する実験を行い,可能性 を示した.今後は,用語の持つ意味役割の活用や,単語ベクトルを入力した機械学習手法を検討し, 現在構築中の大規模正解データを用いた評価を行っていく. 1 はじめに 近年,複雑で多岐に渡る科学技術・学術活動の状況
doi:10.11517/jsaisigtwo.2016.swo-038_01
fatcat:fr5txcdqpjebnb6txku2ao6sha