191 0

사회연결망에서 커뮤니티 분석을 위한 데이터 마이닝 기술

Title
사회연결망에서 커뮤니티 분석을 위한 데이터 마이닝 기술
Other Titles
Data Mining Techniques for Community Analysis in Social Networks
Author
윤석호
Alternative Author(s)
Yoon, Seok-Ho
Advisor(s)
김상욱
Issue Date
2012-02
Publisher
한양대학교
Degree
Doctor
Abstract
커뮤니티는 타겟 마케팅을 위한 다양한 비즈니스 정책에 활용되고 질 좋은 정보의 공유를 가능하게 하며 사회연결망 활성화에 이용 될 수 있기 때문에 중요하다. 본 학위 논문에서는 이러한 커뮤니티를 추출하는 방안과 커뮤니티 추출방안에 이용되는 객체들 간의 유사도를 계산하는 방안 그리고 커뮤니티를 이용한 샘플링 방안에 대해서 논의한다. 먼저, 블로그 월드에서 잠재적 커뮤니티를 추출 하는 방안을 제안한다. 제안하는 방안은 주어진 주제에 대한 시드 포스트들 을 선택하고, 이 시드 포스트들을 통해서 주제와 관련된 블로거들을 선택한다. 다음으로, 선택된 블로거들을 통해서 주제와 관련된 포스트들을 선택한다. 이와같은 과정을 반복해 나가면서 블로그 월드에 존재하는 주어진 주제와 관련된 블로거들과 포스트들을 선발한다. 실험을 통하여 기존 연구에 비해서 제안하는 방안이 우수하다는 것을 보인다. 두 번째로 논문 데이터에서 논문들 간의 유사도를 정확하게 계산하는 링크 기반 유사도 계산 방안과 텍스트 기반 유사도 계산 방안에 대해서 각각 논의한다. 링크 기반 유사도 계산 방안에 대한 논의에서는 먼저, 기존 링크 기반 유사도 계산 방안을 논문 데이터에 적용할 때에 발생하는 문제점을 제시하고 이러한 문제점을 해결하는 새로운 링크 기반 유사도 계산 방안을 제안한다. 제안하는 링크 기반 유사도 계산 방안은 인링크와 아웃링크를 양방향 링크로 간주함으로써인링크와 아웃링크를 동시에 이용하여 논문들 간의 유사도를 적절하게 계산한다. 텍스트 기반 유사도 계산 방안에 대한 논의에서는 먼저, 크롤링과 파싱의 기술적 한계로 인한 논문 데이터의 텍스트 정보 손실 문제를 제시하고 이러한 문제를 해결하는 새로운 텍스트 기반 유사도 계산 방안을 제안한다. 제안하는 방안은 유사도를 계산하고자하는 논문이 참조하거나 해당 논문을 참조하는 논문의 텍스트 정보를 같이 이용함으로써 논문의 텍스트 정보 손실 문제를 해결한다. 실제 논문데이터를 통해서 제안하는 링크 기반 유사도 계산 방안과 텍스트 기반 유사도 계산 방안의 성능을 측정한다. 실험 결과, 제안하는 두 종류의 방안 모두 기존 방안보다 성능이 우수한 것으로 나타났다. 세 번째로 링크 정보를 가지고 있는 모든 데이터에 적용할 수 있는 새로운 링크 기반 유사도 계산 방안에 대해서 논의한다. 일반적으로 기존 링크 기반 유사도 계산 방안은 pair-wise와 level-wise 계산 모델의 결합으로 설명할 수 있다. 본 학위 논문에서는 두 가지 계산 모델의 문제점을 도출하고 해당 문제가 발생하지 않는 새로운 링크 기반 유사도 계산 방안을 제안한다. 제안하는 방안은 하나의 객체를 하나의 벡터로, 주어진 데이터에 존재하는 모든 객체들을 벡터의 요소들로, 주어진 객체에서 각 객체들로의 도달 확률을 벡터의 요소값으로 나타낸다. 제안 방안에서는 “Random Walk with Restart”를 이용해서 해당 도달 확률을 계산한다. 최종적으로 cosine similarity를 이용해서 벡터들 간의 유사도를 계산한다. 본 학위 논문에서는 다양한 사례를 통해서 제안하는 방안이 pair-wise 와 level-wise 계산 모델로 인한 문제가 발생하지 않는다는 것을 보이고 웹과 논문 데이터를 이용해서 정성적 그리고 정략적으로 우수하다는 것을 검증한다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/137046http://hanyang.dcollection.net/common/orgView/200000418956
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > ELECTRONICS AND COMPUTER ENGINEERING(전자컴퓨터통신공학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE