다양한 산업 분야에서는 기계 성능과 안전을 유지하기 위해 데이터 기반의 기계 시스템 상태진단이 중요하다. 머신러닝 기반 상태진단 기술을 개발하기 위해서는 다수의 특성인자로부터 유의미한 특성인자를 선별해야 한다. 데이터에 기반한 상태진단 기술은 고장 데이터가 부족한 데이터 불균형 상황이 자주 발생하기 때문에, 불균형 데이터의 특성을 고려한 특성인자를 선별하는 방법이 요구된다. 따라서 본 연구에서는 유클리드 거리(Euclidean distance)를 기반으로 각 클래스 간의 데이터 분포 차이를 정량적으로 평가하여, 일관된 최적의 특성인자를 자동으로 선별하는 방법을 제안한다. 제안하는 방법의 검증을 위해 보일러 급수펌프 데이터를 활용하였고, 제안된 알고리즘이 다른 특성인자 선별 알고리즘 방법에 비해 일관된 특성인자를 선별할 수 있음을 확인하였다. 또한, 선택된 특성인자들을 이용한 결과 진단의 정확도가 향상되었음을 확인하였다.