Analyzing Problem Instance Space Based on Difficulty-distance Correlation
난이도-거리 상관관계 기반의 문제 인스턴스 공간 분석

So-Yeong Jeon, Yong-Hyuk Kim
2012 Journal of Korean institute of intelligent systems  
Finding or automatically generating problem instance is useful for algorithm analysis/test. The topic has been of interest in the field of hardware/software engineering and theory of computation. We apply objective value-distance correlation analysis to problem spaces, as previous researchers applied it to solution spaces. According to problems, we define the objective function by (1) execution time of tested algorithm or (2) its optimality; this definition is interpreted as difficulty of the
more » ... difficulty of the problem instance being solved. Our correlation analysis is based on the following aspects: (1) change of correlation when we use different algorithms or different distance functions for the same problem, (2) change of that when we improve the tested algorithm, (3) relation between a problem instance space and the solution space for the same problem. Our research demonstrates the way of problem instance space analysis and will accelerate the problem instance space analysis as an initiative research. Key Words : Problem instance space, objective value-distance correlation, sorting problem, 0/1 knapsack problem, travelling salesperson problem 난이도-거리 상관관계 기반의 문제 인스턴스 공간 분석 415 프로그램을 생성하고자 하였다. 소프트웨어 분야에서 수행된 문제 인스턴스 탐색 연구들은 McMinn[5]이 조 사한 것을 참고하자. 알고리즘 분야에서는 Cotta와 Moscato[6], Hemert[7]가 시간 복잡도 측면에서 알고리 즘의 최악의 문제 인스턴스를 찾고자 하였다. Johnson 과 Kosoresow[8], Jeon과 Kim[9]은 최적성(optimality) 의 관점에서 최악의 문제 인스턴스를 찾고자 하였다. 한편, 최선의 문제 인스턴스 1) 탐색 또한 중요함을 보여 준 연구도 있었다[10]. 임의의 프로그램(알고리즘)에 대해 주어진 목적값을 최대/최소화하는 입력 데이터(문제 인스턴스)를 탐색하 는 문제는 McMinn[5]이 언급한 것처럼 결정 불능 문제 (undecidable problem)이다. 이러한 문제에 대해서는 유 전 알고리즘(genetic algorithm, GA)[11]과 같은 메타휴 리스틱 혹은 이에 기반한 알고리즘이 널리 사용되어 왔 다.([1, 2, 3, 4, 6, 7, 8] 모두 GA에 기반한 탐색 알고리 즘을 사용하였다.) 그러나, 문제 인스턴스를 탐색하는 연구가 이처럼 다양함에도 불구하고, 탐색해야할 문제 인스턴스 공간에 대한 연구는 저자가 아는 한 거의 없 는 것으로 보인다. 문제 인스턴스 공간을 연구해야 하는 이유는 무엇인 가? 이는 탐색 공간에 대한 지식을 쌓아 탐색을 보다 빠르게 하기 위한 것이다. 해(解) 공간의 분석의 경우, Boese 등[12]은 순회판매원 문제(travelling salesperson problem, TSP)와 그래프 이등분 문제에 대해 비용-거 리(cost-distance) 상관관계를 분석하여 해 공간의 목적 값이 그리는 지형을 추측하였다. Kim과 Moon[13]은 [12]의 해 공간 분석을 좀더 확장하여 그래프 이분할 문제에서 지역 최적점(local optimum)들의 중앙점이 우 수한 목적값을 가짐을 보였다. 이는 해 공간의 분석을 통해 얻어낸 지식이 해의 탐색에 도움을 준 사례이다. 문제 인스턴스 공간의 분석도 문제 인스턴스 공간의 탐 색에 도움을 주기 위한 것이다. 어떤 방법으로 문제 인스턴스 공간을 분석할 것인 가? 본 논문은 [12]에서 사용되었던 상관관계 분석 방법을 사용한다. [12]의 분석 기법은 진화연산 분야에 서 탐색 공간의 연구에 널리 사용되어온 기법이다[14, 15, 16]. 분석을 통해 얻은 상관관계를 이용하면, 유전 알고리즘으로 주어진 공간을 탐색하는 것이 얼마나 어 려운 지 가늠할 수 있다[14]. 본 논문에서는 문제 인스 턴스 공간을 탐색 공간으로 삼아 상관관계를 분석하려 고 한다. Jeon과 Kim[17]은 [12]의 상관관계 분석 기법을 문제 인스턴스 공간에 적용하여 0/1 배낭 문제 (0/1 knapsack problem, 0/1KP)의 탐욕 알고리즘을 분석하 였다. 그러나 [17]에서는 분석 대상 알고리즘, 그리고 목적 함수 및 거리 함수를 한 가지로 고정하였고, 알고 리즘 개선 후의 상관관계 분석은 수행되지 않았다. 문 제 인스턴스 공간은 분석 대상 알고리즘, 거리 함수, 목 적 함수에 따라서 결정되므로, 이러한 요소들이 상관관 계 분석에 어떤 영향을 미치는 지 알아보는 것이 문제 인스턴스 공간을 분석하는 기본적인 접근일 것이다. 또 한 위의 요소들에 대한 분석은 일반적으로 모든 문제에 1) 최적성의 관점에서 최선의 문제 인스턴스란, 주어진 알고리 즘이 알려진 최적해에가장 가까운 해를 찾는 문제 인스턴스를 의미하며, 최악의 인스턴스는 이와 정확히 반대 개념이다.
doi:10.5391/jkiis.2012.22.4.414 fatcat:c2gvy7vfqzfqxn5h6nahj2yi5q