467 0

코드클론 탐지 프로그램의 공정한 재현율 측정

Title
코드클론 탐지 프로그램의 공정한 재현율 측정
Other Titles
Impartial Recall Assessment of Code-Clone Detection Tools
Author
최성하
Alternative Author(s)
Choi, Sungha
Advisor(s)
도경구
Issue Date
2016-02
Publisher
한양대학교
Degree
Master
Abstract
코드 클론은 소스 코드에서 모양이 같거나 유사한 코드조각을 말한다. 코드 클론을 탐지하는 목적은 다양하다. 코드의 중복된 부분을 리팩토링하여 코드가 간결해지며 유지보수를 쉽게 할 수 있다. 그리고 코드의 재사용 오류를 예방할 수 있다. 또 소프트웨어의 소스 코드 버전 관리를 할 때 변경된 부분을 찾을 수 있다. 특히 소프트웨어의 도용이나 표절의 시비를 가리기 위해 필요하다. 코드 클론을 자동으로 탐지하는 도구의 성능은 정확도와 재현율을 기준으로 평가한다. 그런데 정확도는 오탐을 찾아서 측정할 수 있으므로 상대적으로 용이하지만, 재현율을 측정하기 위해서는 참고를 할 기준이 되는 클론 모음집이 있어야 한다. 현재 시중에 공개되어있는 대표적인 클론 모음집으로 벨론 레퍼런스 코퍼스가 있다. 벨론 레퍼런스 코퍼스는 기존 코드 클론 탐지 도구들을 사용하여 도출된 클론의 일부를 표본으로 수집해 놓은 클론 모음집이다. 하지만 벨론 레퍼런스 코퍼스에는 잘 못된 클론의 세 가지 유형이 있다. “클론의 범위가 부족한 클론”, “클론을 포함하는 클론”, “잘못 탐지된 클론”의 세 가지 유형이 있어서 정확한 재현율을 측정할 수 없다. 본 논문은 잘못된 클론을 수정한 보정된 벨론 레퍼런스 코퍼스를 만들었다. 그리고 보정된 벨론 레퍼런스 코퍼스를 가지고“exEyes”의 재현율을 측정했다. exEyes는 한국저작권위원회에서 소프트웨어 표절 여부를 탐지하기 위해 자체 개발하여 사용 중인 코드 클론 탐지 도구이다. 기존의 벨론 레퍼런스 코퍼스의 잘못된 클론을 수정하여 보정된 벨론 레퍼런스 코퍼스를 가지고 exEyes의 재현율을 측정하니 평균 74%의 재현율을 나타냈다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/126515http://hanyang.dcollection.net/common/orgView/200000428908
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE & ENGINEERING(컴퓨터공학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE