204 0

블로그 공간에서 정보파급의 모델링 및 분석

Title
블로그 공간에서 정보파급의 모델링 및 분석
Other Titles
Modeling and Analysis of Information Diffusion in a Blogosphere
Author
임승환
Alternative Author(s)
Lim, Seung Hwan
Advisor(s)
김상욱
Issue Date
2010-08
Publisher
한양대학교
Degree
Doctor
Abstract
블로그 공간은 블로그 사용자들과 사용자들 간의 관계로 형성된 대표적인 온라인 사회연결망이다. 블로그 공간에서 정보는 블로그 사용자에 의해 문서의 형태로 생성되고, 블로그 사용자 간의 관계들을 통해서 다른 블로그 사용자에게 파급될 수 있다. 이를 블로그 공간에서 정보의 파급 현상이라고 부른다. 블로그 공간에서 발생하는 이러한 정보 파급 현상의 분석은 블로그 공간의 활성화와 마케팅 효과 극대화를 위해서 활발하게 수행되고 있는 연구 분야이다. 이에 본 논문에서는 블로그 공간에서 정보파급 분석을 위한 모델링 및 분석 기법들을 제안한다. 독립 전파 모델은 블로그 공간에서 발생하는 정보파급 현상을 분석하기 위해서 널리 이용되는 모델이다. 본 논문에서는 블로그 공간에서의 정보 파급 분석에 독립 전파 모델을 적용하기 위하여 블로그 연결망을 구성하는 방법을 제안한다. 블로그 연결망의 구성을 위하여 제안된 방법은 사용자 간의 액션 이력을 분석하여 두 사용자 간의 관계를 설정하고, 분석 결과를 이용하여 두 사용자 간의 파급 확률을 계산한다. 사용자간의 파급 확률을 계산하기 위해서 사용자가 정보의 파급을 의도하고 작성한 게시글들 중에서 실제로 특정 사용자에게 파급된 게시글들의 비율을 이용한다. 또한, 제안하는 기법의 성능 향상을 위해서 게시글의 작성 의도 식별 방안과 정규화 기법을 제안한다. 실제 블로그 공간의 데이터를 이용하여 정보의 파급 현상을 분석한 결과, 제안하는 기법이 기존의 기법에 비해서 정보의 파급 현상을 충실하게 반영하고 있는 것으로 나타났다. 블로그 공간에서의 정보의 파급에 대한 기존의 연구들은 블로그들 간에 명시적 관계를 설정하고, 정보가 파급되는 요인으로서 이 관계를 통해서 발생하는 입소문 효과만을 고려하였다. 그러나 블로그 공간에서 실제 발생하는 정보의 파급 현상들의 약 85%는 비명시적 관계를 통해서 발생한 것이다. 따라서 본 논문에서는 명시적 관계, 비명시적 관계를 통한 정보의 파급을 함께 고려하여 이들 관계를 통한 정보의 파급 현상을 효과적으로 분석할 수 있는 새로운 정보 파급 모델을 제안한다. 이를 위해서 기존의 정보 파급 모델에 슈퍼노드, 방송에지, 등록에지를 추가하고, 블로그 연결망의 관계들에 실질적인 파급 확률을 부여하는 방안을 제안한다. 또한, 실제 블로그 공간에서 제안하는 기법과 기존의 기법을 이용하여 정보의 파급 분석의 수행 성능을 비교함으로써 제안하는 기법의 우수성을 검증한다. 분석 결과, 확장 정보 파급 모델은 기존의 정보 파급 모델에 비하여 오차를 77% 가량 적게 발생하는 것으로 나타났다. 블로그 공간에서 파급되는 문서들은 다양한 주제의 정보들을 다루고 있다. 그러나 정보 파급에 대한 기존의 연구들은 정보의 주제를 고려하지 않고 분석을 수행하였기 때문에, 정보파급의 예측분석 시에 낮은 정확도를 보인다. 이에 본 논문에서는 정보의 주제를 고려하여, 이후에 발생하게 될 정보 파급 현상을 예측할 수 있는 새로운 모델을 제안한다. 이를 위해서 우선, 이후에 정보의 파급이 발생할 가능성이 있는 사용자간의 관계를 파악한다. 본 논문에서는 사용자 A가 주제 T를 만족하는 게시글을 소유하고 있고, 사용자 B가 사용자 A의 게시글을 주제에 관계 없이 파급한 기록이 존재하는 경우에, A→B를 통해서 A가 소유하고 있는 주제 T의 게시글이 이후에 B에게 파급될 가능성이 높은 것으로 판단한다. 또한, 사용자들 간의 관계를 통해서 각각의 주제가 파급되는 데에 영향을 미치는 네가지 요인들을 정의하고, 이를 계산하는 방안을 제안한다. 이들 값을 이용한 회귀 분석을 통해서 각각의 주제에 대한 사용자들 간의 관계의 파급 확률을 부여한다. 실제 블로그 공간 데이터를 이용한 실험 결과, 정보파급의 예측분석 시에 제안하는 기법은 기존의 기법에 비해서 60% 가량 높은 정확도를 보이는 것으로 나타났다. 블로그 공간 내에는 다른 사용자들이 블로그 서비스를 활발하게 이용하도록 유도하는 역할을 하고 있는 특별한 사용자들이 존재한다. 본 논문에서는 이러한 사용자들 중에서 다른 사용자들에게 미치는 컨텐츠 영향력이 큰 사용자를 컨텐츠 파워유저라고 정의한다. 블로그 공간에서 컨텐츠 파워유저를 정확하게 식별하는 것은 블로그 서비스 활성화를 위한 효과적인 정책 수립을 위해서 중요한 문제이다. 이에 본 논문에서는 컨텐츠 파워유저를 식별하기 위한 새로운 기법에 대하여 논의한다. 이를 위해서 각 사용자가 소유하고 있는 각 게시글들의 컨텐츠 영향력을 계량화하는 방법을 제안하고, 이 값들의 합을 이용하여 해당 사용자의 컨텐츠 영향력을 계산하는 방법을 제안한다. 이렇게 계산된 각 사용자의 컨텐츠 파워 값으로 높은 값을 갖는 사용자들을 컨텐츠 파워 유저로서 선정한다. 실제 블로그 공간 데이터와 도메인 전문가를 대상으로 설문을 통해서, 제안하는 기법과 기존의 파워유저 선정 기법들의 정확도와 성능을 비교하였다. 실험 결과, 제안하는 기법이 블로그 공간의 동적인 특성을 잘 반영하고 있으며, 제안하는 기법을 이용하여 선정된 컨텐츠 파워유저가 블로그 공간 활성화를 위한 가장 적절한 사용자인 것으로 나타났다. 또한, 컨텐츠 파워유저를 이용하여 사용자들의 블로그 서비스 이용을 활성화시키기 위한 비즈니스 적용 방안에 대하여 논의한다.
URI
https://repository.hanyang.ac.kr/handle/20.500.11754/141038http://hanyang.dcollection.net/common/orgView/200000415116
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > ELECTRONICS AND COMPUTER ENGINEERING(전자컴퓨터통신공학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE