274 0

블록 단위 그래프 모델을 통한 효율적인 정보추출 Wrapper 생성과 유지 관리

Title
블록 단위 그래프 모델을 통한 효율적인 정보추출 Wrapper 생성과 유지 관리
Other Titles
Effective Information Extraction Wrapper Generation and Maintenance by Using a Block-Based Graph Model
Author
최중민
Issue Date
2007-10
Publisher
한국정보과학회
Citation
한국정보과학회 2007 가을 학술발표 논문집, v. 34, No. 2, Page. 322 - 327
Abstract
기존의 정보 추출에서는 웹 문서의 구조가 변경되었을 때 Wrapper가 원하는 정보를 추출할 수 없었다. 또한 웹 문서의 구조가 바뀌는 경우 동일한 정보를 Wrapping함에도 불구하고 사용자는 정보를 추출할 수 없었던 이유를 찾지 못하는 경우가 대부분이었다. 이 문제를 해결하기 위해 본 논문에서는 Web 페이지를 시각적 블록 단위로 잘라 인접한 블록들을 통해 그래프를 형성하여 웹 문서의 구조가 일부 변경되어도 기존의 Wrapper를 통해 정보를 추출할 수 있도록 보다 효율적으로 Wrapper를 생성하고 유지 관리 하는 방법을 제안한다. 또한 웹 문서를 블록 단위로 분할 하여 그래프를 생성함으로써 블록 내부에 추출하고자 하는 정보에 대한 규칙이 좀 더 유연하게 표현 될 수 있으며 문서의 구조가 아닌 추출하고자 하는 정보를 중심으로 규칙을 생성함으로써 그래프의 구조뿐 아니라 그래프를 구성하고 있는 블록 내부의 구조가 일부 변하더라도 기존의 규칙을 이용하여 정보를 추출할 수 있도록 하였다.
URI
http://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE00905456&language=ko_KRhttps://repository.hanyang.ac.kr/handle/20.500.11754/107023
Appears in Collections:
COLLEGE OF ENGINEERING SCIENCES[E](공학대학) > COMPUTER SCIENCE AND ENGINEERING(컴퓨터공학과) > Articles
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE