메타게노믹스 연구를 진행함에 있어서 환경 내의 미생물 군집의 비중을 알아내는 것은 기본적이면서도 중요한 과정에 해당한다. 이를 위한 가장 간단한 접근 방법은 기존에 구축되어 있는 미생물 데이터베이스에 표본을 대조하고 이를 바탕으로 추측하는 것이다. 그러나 서로 다른 미생물이더라도 유전체의 구조가 비슷한 경우가 많아 단순한 대조작업만으로는 구분이 어려운 경우가 많다. 이에 대한 대안으로 확률론적 방법을 이용하여 표본이 데이터베이스 내 복수의 유전체에 사상되는 모호한 경우를 해결하려는 시도가 있었고, 납득할만한 성과를 거두었다. 이 논문에서는 기존의 시도에서 간과되었던 유전체의 지지 영역을 기댓값최대화 알고리즘의 인자로 사용함으로써 보다 정확한 예측을 시도하였고, 그 결과를 제시한다.