268 0

A Diffusion-Based COVID-19 Related Fake News Detection Framework

Title
A Diffusion-Based COVID-19 Related Fake News Detection Framework
Author
Soeun Han
Alternative Author(s)
한소은
Advisor(s)
김상욱
Issue Date
2022. 8
Publisher
한양대학교
Degree
Master
Abstract
The social confusion caused by the recent pandemic of COVID-19 has been further facilitated by fake news diffused via social media on the Internet. For this reason, many studies have been proposed to detect fake news as early as possible. The content-based detection methods consider the difference between the contents of true and fake news articles. However, they suffer from the two serious limitations: (1) the publisher can manipulate the content of a news article easily, and (2) the content depends upon the language, with which the article is written. To overcome these limitations, the diffusion-based fake news detection methods have been proposed. The diffusion-based methods consider the difference among the diffusion patterns of true and fake news articles on social media. Despite its success, however, the lack of the diffusion information regarding to the COVID-19 related fake news prevents from studying the diffusion-based fake news detection methods. Therefore, for overcoming the limitation, we propose a diffusion-based fake news detection framework (D-FEND), which consists of four components: (C1) diffusion data collection, (C2) analysis of the data and feature extraction, (C3) model training, and (C4) inference. Our work contributes to the effort to mitigate the risk of infodemics during a pandemic by (1) building a new diffusion dataset, named CoAID+, (2) identifying and addressing the class imbalance problem of CoAID+, and (3) demonstrating that D-FEND successfully detects fake news articles with 88.89% model accuracy on average.|최근 유행하는 신종 코로나바이러스 감염증(코로나19) 관련 가짜 뉴스가 소셜 미디어를 통해 확산되며 사회적 혼란이 가중되고 있다. 이러한 이유로 가짜 뉴스를 빠르게 탐지하기 위한 연구가 활발히 진행되고 있다. 내용 정보 기반 탐지 방법은 진짜 뉴스와 가짜 뉴스의 내용에서 나타나는 언어적 특징을 활용한다. 그러나 내용 정보 기반 탐지 방법은 (1) 작성자에 의해 내용이 쉽게 조작될 수 있고, (2) 뉴스 기사가 작성된 언어에 따라 언어적 특징이 달라진다는 한계가 있다. 이러한 한계를 극복하기 위해 본 논문에서는 파급 정보 기반의 가짜 뉴스 탐지 방법을 제안한다. 파급 정보 기반 탐지 방법은 소셜 미디어에서 진짜 뉴스와 가짜 뉴스의 파급 양상을 비교한다. 따라서 우리는 (C1) 파급 정보 수집, (C2) 데이터 분석 및 특징 추출, (C3) 모델 학습, (C4) 추론으로 구성된 파급 정보 기반의 가짜 뉴스 탐지 프레임워크(D-FEND)를 제안한다. 우리는 (1) 새로운 파급 데이터셋을 구축하고, (2) CoAID+ 데이터의 클래스 불균형 문제를 식별 및 해결하고, (3) D-FEND는 평균 88.89%의 정확도로 가짜 뉴스를 정확하게 탐지함으로써 우수한 프레임워크임을 보인다.
URI
http://hanyang.dcollection.net/common/orgView/200000627562https://repository.hanyang.ac.kr/handle/20.500.11754/174228
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Master)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE