추상화 메모리 문맥을 이용한 바이너리 코드기반 표절 탐지 (Binary-based Plagiarism Detection using Abstract Memory Context)

Yong, Suk Choi, Jong Moo, Choi
2013 unpublished
There has been increasingly interest in the protection of the intellectual property right due to the software plagiarism being issued recently. Nevertheless, it becomes difficult to cope with such problem because of the appearance of a variety of plagiarism methods such as code obfuscation. The existing technique for static plagiarism detection is based on the contents, which are vulnerable to the change of code. Any attempt to detect plagiarism might be possibly failed if the codes are
more » ... e codes are converted using semantic-based obfuscation methods. This paper proposes an effective tool for detecting the plagiarized location through the semantic-based analysis process by integrating the advantages of static and dynamic analysis techniques under the situation where binary code is available only. The structure of the tool suggested in the study consists of four components, plagiarism area explorer, memory changes tracer, abstract memory context constructor, and similarity comparator. The tool has been implemented and tested under x86-based LINUX environment. Experiments using several original and plagiarized-binary executable files show that our proposal can detect plagiarism effectively, compared with the existing tool. 1. 서 론 최근 표절에 의한 지적재산권 침해에 우려와 관심이 높아지면서 다양한 표절 감정 도구가 연구되고 있지만, 다양한 표절 유형과 넓은 분석 범위에 어려움을 겪고 있다. 현존하는 표절 분석도구 대부분은 소스코드 기반 정적 분석도구이기 때문에 실제 표절 검증이 요구될 경 우 소스코드를 제공받지 못하여 바이너리 수준에서 판 단 할 수밖에 없다. 또한 표절 흔적을 감추기 위해 난독 화를 수행한다면 바이너리 실행 코드 정보만으로 표절 분석이 매우 어려워 새로운 방법이 필요한 실정이다. 기존의 표절 탐지 도구는 대부분 작성된 소스 코드의 구문 특징을 이용한 내용기반 분석 도구가 대부분이다. 그러나 난독화 같은 의미기반 소스코드 표절일 경우 코 드 구문의 외형적 특징 변화만을 탐지하여 표절 검색에 실패할 확률이 높다. 예를 들어 소스코드의 제어, 분기 점을 이용한 새로운 함수의 분리와 결합 경우 코드의 연결고리를 외형상 재조합하여 버린다. 따라서 기존의 프로그램 의존 그래프(PDG)[1]나 버스마크(Birthmark) 같은 기법은 표절 위치를 탐지하기 어렵다. PDG[1]의 경우 난독화 처리되지 않는 소스코드 분석에서는 높은 표절 탐지력을 갖지만 반대의 경우 높지 않다. 본 논문은 소스코드 없이 바이너리 실행파일만 존재 하는 상황에서 표절되어진 위치를 효과적으로 탐지 할 수 있는 기법을 제시하고 있다. 이러한 목표에 도달하기 위해 정적과 동적 분석 기법의 장점을 적절히 결합하고
fatcat:m54bgdj2hnhttl5hos44eux3mq