A proposal of calculation method for degree of cooperation between open data using predicate vector

Tadanori HISANAGA, Takayasu FUCHIDA
2020 Joho Chishiki Gakkaishi  
近年,多くの行政・団体がオープンデータの公開,活用に取り組んでいるが政府の推進する「オー プンデータは,機械判読可能で人手を多くかけずにデータの2次利用が可能である」というデータ活 用までには至っていない.本研究では,地方公共団体のオープンデータの可能性を探るために,開 示されているCSVデータの項目名,列データをベクトル化することによりデータの連携度を測る述語 ベクトル法を提案する.またその述語ベクトル法を用いて,各データ間の連携可能性について実験 を行い,オープンデータ間における項目名のみの連携度と列データのみの連携度を比較した.結果 として列データのみから算出した連携度が高いオープンデータは特定の列の類似度が高くなり,デ ータ連携を取りやすいことが示された. In recent years, many administrative organizations and local governments are engaged in opening and utilizing open data but until the data utilization has not
more » ... hed where the government promotes "Open data can be secondarily used without much manpower being machine-readable". In this research, we propose a predicate vector method that measures the similarity of data by vectorizing item names and item values of CSV data disclosed to explore the possibility of open data of a local government. In addition, using the predicate vector method, we experimented on the possibility of cooperation between 情報知識学会誌
doi:10.2964/jsik_2020_001 fatcat:d5pmnptwarfvrbp67hbuka7l5y