다양한 주제를 내포하는 문서 집합에서 특정 주제에 관련된 문서만 필요한 경우 문서마다 주제를 구분할 필요없이 특정 주제에 관련된 문서 집합과 그 외의 주제와 관련된 문서 집합으로 이진 분류를 하면 된다. 문서 분류에 사용할 특징 집합은 타겟 주제를 잘 설명해야 구분하고자 하는 특정 주제의 분류 성능이 높아진다. 그러나 클래스 불균형 문제가 있는 경우 타겟 주제를 잘 설명하는 특징 집합을 생성하기 어렵다. 본 연구에서는 워드 임베딩을 활용하여 특징 공간을 확장함으로써 타겟 주제의 분류 성능을 높이는 방법을 제안한다. 특징 집합에서 어떤 특징이 타겟 주제와 관련된 것인지 구분하기 위해 라운드로빈 기법으로 초기 특징 집합을 생성한다. 생성한 특징 집합에서 타겟 주제와 관련된 특징을 바탕으로 워드 임베딩을 활용해 특징 집합을 확장한다. 이를 위해 워드 임베딩으로 타겟 주제와 관련 있는 특징과 유사한 용어를 찾아 특징 집합에 추가하여, 각 특징이 가진 의미를 확장한다. 실험을 통해 이 방법은 전문 용어가 많거나 서로 비슷한 용어가 혼재된 문서집합에서 보다 성능이 우수함을 확인하였다.