본 연구에서는 사용자가 제어 가능한 유한 상태 기계를 사용한 물리 기반 보행 동작 제어기 모델을 제시하고자한다. 기존에 존재하는 유한 상태 기계를 사용한 보행동작 제어기와 달리 본 연구에서는 심층 강화 학습을 이용해 제어기가 사용하는 매개변수의 값을 인공지능이보상을 최대로 받는 값으로 선택하도록 학습함으로써사용자가 수동으로 조율하지 않아도 보행동작 제어가가능하다는 것을 보이며, 사용자의 보행동작 제어에 따를수록 큰 보상을 받도록 강화 학습 에이전트를 설계하여 사용자가 제어기와 상호작용하며 보행동작을 제어가능함을 보인다