421 241

Full metadata record

DC FieldValueLanguage
dc.contributor.author이춘화-
dc.date.accessioned2016-09-12T01:52:58Z-
dc.date.available2016-09-12T01:52:58Z-
dc.date.issued2015-02-
dc.identifier.citation한국지식정보기술학회 논문지(Journal of Knowledge Information Technology and Systems), v. 10, NO 1, Page. 69-78en_US
dc.identifier.issn1975-7700-
dc.identifier.urihttp://www.kkits.or.kr/pds/2015/2015-10-1-07.pdf-
dc.identifier.urihttp://hdl.handle.net/20.500.11754/23097-
dc.description.abstractIn query processing, query optimization is an important function of a database management system since overall query execution time can be significantly affected by the quality of the plan chosen by the query optimizer. Under cost-based optimization, a query optimizer estimates the cost for every possible query plans based on the underlying data distribution in synopses of database relations. The most common synopses in commercial databases have been histograms. However, when there is correlation among datum, one-dimensional histograms can provide poor estimation quality. Motivated by this, we propose a new approach to perform more accurate selectivity estimation, even for correlated data. To deal with the correlation that may exist among datum, we adopt well-known techniques in data mining and extract attribute values that occur together frequently using frequent itemsets mining. Through experimentation, we found that our approach is effective in modeling correlations and that this method approximates intermediate relations more accurately. In fact, it gives precise estimates, particularly for the correlated data. 쿼리 최적화기에 의해 선택된 쿼리 계획은 전체 쿼리 실행 속도에 지대한 영향을 미치기 때문에, 데이터 베이스관리시스템의 쿼리 최적화 기능은 쿼리 처리과정에 있어 중요하다. Cost 기반 최적화에서 쿼리 최적화기는 모든 가능한 쿼리 계획들의 비용을 데이터베이스의 데이터 분포 정보를 기반으로 추정한다. 일반적으로 상용화되고 있는 DBMS에서 가장 흔하게 사용되는 데이터 분포 통계 정보는 히스토그램 방식으로 구축된 형태이다. 그러나 각각의 데이터들에 상호현관성이 있는 경우, 일차원 히스트그램 방법은 형편없는 추정치를 계산해낸다. 본 논문에서는 쿼리 최적화 과정에서 보다 정확한 쿼리 비용을 계산하여 쿼리계획을 선출할 수 있도록 하기 위해 데이터마이닝의 기술 중 하나인 빈발항목 마이닝Frequent Itemsets Mining) 방법을 적용하였다. 실험을 통해 제안하는 방법이 상호 연관관계 있는 데이터들에 있어 히스토그램보다 좋은 추정치를 보여 줌을 확인하였다.en_US
dc.description.sponsorshipICT R&D program of MSIP/IITP. [2014-044-042-001,Development of Open Screen Service Platform with Cooperative and Distributed Multiple Irregular Screens] and by Basic Science Research Program through the National Research Foundation of Korea(NRF) funded by the Ministry of Education(No. 2013R1A1A2007616)en_US
dc.language.isoenen_US
dc.publisher한국지식정보기술학회en_US
dc.subjectQuery optimizationen_US
dc.subjectCorrelated dataen_US
dc.subjectDatabase management systemen_US
dc.subjectFrequent itemsetsen_US
dc.titleSelectivity Estimation Using Frequent Itemset Miningen_US
dc.typeArticleen_US
dc.relation.no2-
dc.relation.volume10-
dc.relation.page69-78-
dc.relation.journal한국지식정보기술학회 논문지-
dc.contributor.googleauthorEom, Boyun-
dc.contributor.googleauthorJermaine, Christopher-
dc.contributor.googleauthorLee, Choonhwa-
dc.relation.code2015041354-
dc.sector.campusS-
dc.sector.daehakCOLLEGE OF ENGINEERING[S]-
dc.sector.departmentDEPARTMENT OF COMPUTER SCIENCE-
dc.identifier.pidlee-


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE