최근 악성코드는 다양한 난독화 및 변형 기술을 통해 지속적으로 진화하고 있으며, 기존의 서명 기반 탐지 기법만으로는 효과적인 대응이 어렵다. 이를 극복하기 위해 머신러닝 기반 탐지 기법이 활발히 연구되고 있으며, 특히 CNN을 활용한 이미지 기반 분석이 주목받고 있다. 그러나 CNN 모델은 국소적인 특징 학습에 집중하는 경향이 있어, 계층이 깊어질수록 초기 계층에서 학습된 저수준 특징이 희미해지거나 변형되는 문제가 발생한다. 이는 악성코드 이미지 분석에서 중요한 구조적 패턴이 손실될 가능성이 높이고, 정교한 난독화 기법이나 고도화된 변종 악성코드에 대한 일반화 성능 저하로 이어질 수 있다. 본 논문에서는 이러한 한계를 개선하기 위해 EfficientNet을 기반의 CLA(Cross-Layer Attention)를 적용한 악성코드 이미지 분류 기법을 제안한다. 제안하는 CLA 기법은 초기 계층에서 학습된 특징을 보존하고 후반부 계층과 결합함으로써 CNN의 정보 손실 문제를 보완하고, 채널 간 정보 활용과 전역적 문맥 이해를 강화한다. 실험 결과, EfficientNet-CLA 모델은 CNN 및 ViT 계열 모델 대비 Accuracy 98.57%로 가장 우수한 성능을 보였다. 이는 제안하는 기법이 기존 모델보다 더욱 견고한 특징 학습을 가능하게 하며, 일반화 성능 또한 향상되었음을 의미한다. 또한 Grad-CAM 분석을 통해 CLA가 CNN의 전역적 특징 학습을 보완하는 역할을 수행함을 시각적으로 검증하였다.