본문 바로가기
🤖

AI 얼굴 분석은 어떻게 작동할까?

Hogamdo 연구팀 팀 소개
AI 얼굴 분석·문화권별 미적 선호도 전문
게시:

스마트폰으로 셀카 한 장을 찍으면 AI가 내 얼굴을 분석하고 어느 나라 사람들에게 가장 인기 있을지 알려준다고? 불과 몇 년 전만 해도 공상과학처럼 들렸을 이야기가 이제는 현실이 되었습니다. 하지만 AI 얼굴 분석이 실제로 어떤 원리로 작동하는지 아는 사람은 많지 않습니다. 이 글에서는 최첨단 얼굴 분석 기술의 작동 원리를 알기 쉽게 설명합니다.

1단계: 478개의 점으로 얼굴 지도 만들기

AI 얼굴 분석의 첫 번째 단계는 얼굴에서 핵심 포인트들을 찾아내는 것입니다. 구글이 개발한 MediaPipe FaceLandmarker는 얼굴 사진 한 장에서 무려 478개의 랜드마크 포인트를 실시간으로 감지합니다. 이 포인트들은 눈꺼풀의 경계, 눈동자 중심, 눈썹의 곡선, 코끝과 콧구멍, 입술의 외곽선, 턱선의 윤곽, 광대뼈의 위치 등 얼굴의 모든 중요 부위에 배치됩니다.

이 478개 포인트의 x, y, z 좌표를 계산하면 얼굴의 3차원 구조를 정밀하게 파악할 수 있습니다. 단순히 2D 사진에서 위치를 찾는 것이 아니라, 깊이 정보까지 추정하여 얼굴이 정면을 바라보는지, 약간 기울어져 있는지도 파악합니다. 이 과정은 GPU를 활용하면 수십 밀리초 만에 완료될 만큼 놀라운 속도를 자랑합니다.

2단계: 얼굴 비율 수치화 — 5가지 핵심 메트릭

랜드마크 좌표를 확보한 후에는 이를 토대로 얼굴의 핵심 비율을 수치로 변환합니다. 주요 분석 항목은 다음과 같습니다.

얼굴 비율(Face Ratio)은 얼굴의 가로 대 세로 길이의 비율입니다. 동아시아권에서는 상대적으로 좁고 긴 얼굴(높은 face ratio)을 선호하는 반면, 지중해 문화권에서는 더 넓고 균형 잡힌 비율을 이상적으로 봅니다.

턱선 너비(Jaw Width)는 턱의 가장 넓은 부분을 얼굴 전체 너비로 나눈 값입니다. 숫자가 작을수록 갸름한 V라인 턱을 의미하며, 클수록 강하고 각진 턱선을 의미합니다. 한국에서는 낮은 수치를 선호하고, 서양에서는 상대적으로 높은 수치가 성숙하고 강인한 인상을 준다고 봅니다.

눈 비율(Eye Ratio)은 눈의 세로 길이(눈의 높이)를 얼굴 너비로 나눈 값으로, 눈의 상대적인 크기를 나타냅니다. 입술 두께(Lip Ratio)는 윗입술과 아랫입술의 두께를 합산한 값으로, 입술의 풍성함을 측정합니다. 광대 너비(Cheek Ratio)는 광대뼈 부위의 너비를 나타내며 얼굴형에 큰 영향을 미칩니다.

3단계: 국가별 미의 기준 데이터와 매칭

수치화된 얼굴 메트릭이 준비되면, 이제 전 세계 100개 이상 국가들의 미의 기준 데이터와 비교합니다. 각 국가에는 그 문화권이 선호하는 이상적인 얼굴 비율 범위가 정의되어 있습니다. 예를 들어 한국의 경우 face ratio는 비교적 높고(긴 얼굴), jaw width는 낮고(갸름한 턱), eye ratio는 크며(큰 눈), lip ratio는 적당히 도톰한 범위가 이상형에 해당합니다.

각 국가별 점수는 이상적인 범위와 실제 측정값 사이의 거리를 계산하는 방식으로 산출됩니다. 측정값이 이상 범위에 정확히 들어올수록 높은 점수를 받고, 범위에서 멀어질수록 점수가 낮아집니다. 여기에 각 메트릭의 문화적 중요도에 따른 가중치(턱선 280점, 눈 800점, 입술 450점 등)를 적용하여 최종 점수를 산출합니다.

4단계: 문화권 친화도 보정과 최종 순위 산출

단순한 수치 비교만으로는 문화적 맥락을 완전히 반영하기 어렵습니다. 예를 들어 동아시아 문화권의 국가들(한국, 일본, 중국, 대만 등)은 서로 비슷한 미의 기준을 공유하므로, 한 나라에서 높은 점수를 받은 얼굴은 인접 문화권 국가들에서도 비슷하게 평가받을 가능성이 높습니다.

이를 반영하기 위해 '문화권 친화도(Culture Affinity)' 보정 단계를 거칩니다. 동아시아, 동남아시아, 남아시아, 중동, 서유럽, 동유럽, 남유럽, 북유럽, 영미권, 라틴아메리카, 아프리카, 중앙아시아 등 13개 문화권으로 분류하고, 각 문화권 내에서의 평균 점수를 기준으로 국가 간 점수를 보정합니다.

최종적으로 모든 국가의 점수를 0~100 범위로 정규화하고 순위를 매겨 상위 국가들을 결과로 제공합니다. 얼굴 감지와 랜드마크 추출은 브라우저에서 로컬로 처리되며, 추출된 수치 데이터만 서버로 전송되어 국가별 매칭이 수행됩니다. 사진 자체는 서버에 전송되지 않으므로 개인정보가 안전하게 보호됩니다.

AI 얼굴 분석의 의미와 한계

AI 얼굴 분석은 문화적 다양성과 미의 기준을 객관적으로 탐색하는 흥미로운 도구입니다. 하지만 몇 가지 중요한 한계도 있습니다. 첫째, 조명 조건, 카메라 각도, 화질 등 사진의 품질이 결과에 영향을 줄 수 있습니다. 둘째, AI가 학습한 미의 기준은 특정 시점의 문화적 경향을 반영하므로, 실시간으로 변화하는 미의 트렌드를 완벽히 반영하지 못할 수 있습니다. 셋째, 아름다움은 정적인 얼굴 비율만으로 완전히 설명될 수 없으며, 표정, 분위기, 개성 등 수치화하기 어려운 요소들도 매우 중요합니다.

그럼에도 불구하고 AI 얼굴 분석은 자신의 얼굴 특징을 새로운 시각으로 바라보고, 세계 각지에서 어떻게 인식될지 재미있게 탐색할 수 있는 창의적인 경험을 제공합니다. 당신의 얼굴은 지구 어딘가에서 분명히 매력적으로 보일 것입니다.

Hogamdo 자체 분석 데이터로 본 AI 얼굴 분석 파이프라인

앞서 설명한 일반 원리가 실제로 어떻게 구현되는지 호감도(Hogamdo)의 데이터로 살펴봅니다. 호감도는 139개국의 얼굴 임베딩을 13개 문화권(EA·SEA·SA·ME·WE·EE·LAT·AFR 등)으로 분류하고, MediaPipe 478개 랜드마크에서 추출한 11개 얼굴 지표로 호감도 점수를 계산합니다.

분석 파이프라인은 5단계로 진행됩니다.

  1. 랜드마크 추출 — MediaPipe FaceLandmarker로 얼굴에서 478개 점 좌표를 검출합니다.
  2. 지표 계산 — 좌표에서 얼굴 비율, 턱 너비, 눈 비율, 입술 비율, 광대 너비 등 11개 정량 지표를 계산합니다.
  3. 국가별 매칭 — 139개국 임베딩 데이터와 코사인 유사도를 비교해 국가별 점수를 생성합니다.
  4. 가중치 적용 — 각 지표가 호감도에 기여하는 비중을 다르게 둡니다 (눈 800, 입술 450, 턱 280, 광대 280, 비율 30).
  5. 2-tier 정규화 — 같은 문화권 안에서는 75~95점, 다른 문화권에서는 65~100점 범위로 분포되도록 정규화합니다.

실측 분포를 보면 13개 문화권 중 라틴아메리카(LAT)가 약 16.4%, 중동(ME)이 13.1%, 아프리카(AFR)가 11.5%로 가장 폭넓게 매칭되고, 동아시아(EA)·동남아(SEA)·남아시아(SA)는 9% 안팎, 동·서유럽(EE·WE)은 7~8% 수준으로 결과에 등장합니다. 결과 상위 국가는 사용자의 얼굴 지표 조합과 가장 가까운 문화권을 반영합니다.

분석 한계: 사진 품질·각도·조명에 따라 결과가 변동될 수 있으며, 통계적 패턴이지 개인의 절대적 매력도를 판단하는 도구가 아닙니다. 결과는 엔터테인먼트·문화 비교 목적으로만 활용해 주세요.

Hogamdo
Hogamdo Research
2026년 3월 14일

📚 참고 자료

  • Google AI (2023). MediaPipe Face Landmarker - 478 landmark points detection. Google Developers.
  • Lugaresi, C. et al. (2019). MediaPipe: A Framework for Building Perception Pipelines. arXiv:1906.08172.
  • Kartynnik, Y. et al. (2019). Real-time Facial Surface Geometry from Monocular Video on Mobile GPUs. CVPR Workshop.