MixNet on Tensorflow Lite

4 min readJul 29, 2019

구글이 새로운 경량화 네트워크 MixNet을 공개했습니다. 논문 제목 MixNet: Mixed Depthwise Convolutional Kernels에서 알 수 있듯이 Depthwise Convolution이라는 연산을 잘 섞어서(=AutoML) 더 적은 연산으로 더 좋은 정확도를 보이는 네트워크를 제안했습니다.

다른 논문과의 계산량 (FLOPS), 정확도 (Top-1 Accuracy) 비교.

보시다시피 결과가 굉장히 인상적입니다. 한껏 기대감에 부풀었지만 가벼운 네트워크임을 주장하는 논문임에도 불구하고 모바일 벤치마크 결과가 없어서 아쉬웠습니다. 논문을 읽고난 후, 직접 모바일 벤치마크를 수행했습니다. 이번 포스트에서는 MixNet을 구글 픽셀 폰에서 Tensorflow Lite를 이용하여 벤치마크한 결과를 공유하려고 합니다.

MixNet-S/M/L

MixNet은 Depthwise Convolution을 쌓는 패턴에 따라서 3가지 네트워크로 나눌 수 있습니다. MixNet-Small, Medium, Large 버전이 있습니다. 다음은 MobileNet V2, MnasNet 등 기존에 제안된 경량화 네트워크와 계산량 (FLOPS) 및 정확도(Accuracy)를 비교했습니다. MobileNet V3와의 비교가 없는 점은 아쉬운 부분입니다.

ImageNet 2012의 이미지 분류 (Image Classification) 결과

비슷한 연산량이라면 MixNet-S/M/L 모두 다른 네트워크보다 월등한 정확도를 보입니다. 특히 MixNet-S의 성능 (Top-1 75.8%, FLOPS 256M)은 인상적입니다. ResNet-101이 Top-1 76.6%를 위해 FLOPS 8,000M 계산이 필요한 것을 생각하면 엄청 효율적인 네트워크임을 알 수 있습니다.