[PnT Tech] AI Annotation Tool 개발 스토리: 피플앤드테크놀러지 AI LAB의 혁신 비밀
피플앤드테크놀러지 AI Lab의 성과와 비결:
AI 어노테이션(Annotation) 작업의 혁신적 효율화
피플앤드테크놀러지 AI LAB의 실질적인 성과물들이 하나둘씩 나타나고 있으며, 지난 5월에는 국내 글로벌 영상 선도 대기업 제품에 당사의 기술이 탑재되어 출시되었습니다. 앞으로도 더 좋은 소식으로 저희 피플앤드테크놀러지를 응원하시는 모든 분들을 찾아뵙겠습니다.
피플앤드테크놀러지가 짧은 시간 안에 괄목할 만한 AI 성과를 내고 있는 비밀은 바로 AI 어노테이션(Annotation) 작업의 효율화에 있습니다. AI 비즈니스 성공을 위해서는 해당 문제를 해결하기 위한 원천 데이터 확보, 데이터를 정확하고 빠르게 어노테이션하여 양질의 학습 데이터를 확보하는 것, 이 데이터를 기반으로 훌륭한 알고리즘을 개발하는 것, 그리고 이 알고리즘을 탑재한 End to End 서비스를 적용하고 발전시킬 수 있는 비즈니스 역량이 필요합니다.

어노테이션(Annotation)이란 무엇인가?
AI를 잘하기 위해서는 AI 모델이 학습할 수 있는 양질의 데이터 셋 확보가 가장 중요합니다. 어노테이션(Annotation) 또는 데이터 라벨링(Data Labeling)이란, AI 모델이 학습할 수 있도록 확보된 데이터에 정답(라벨)을 달아주는 작업을 말합니다. 예를 들어, 사진 속 사물이 자전거임을 컴퓨터가 인식할 수 있도록 사진 속 자전거의 위치나 영역에 '자전거'라고 표시해주는 작업이 필요합니다. 대부분의 AI 학습 과정은 라벨링 데이터를 필요로 하는 지도 학습(Supervised Learning) 범주에 속하며, 이때 학습 결과물의 정확도는 어노테이션의 품질에 의해 크게 좌우됩니다.
기존 어노테이션 작업은 사람이 직접 데이터를 보고 판단하는 과정으로, 노동 집약적이며 작업자의 숙련도에 따라 품질이 일정하지 않아 많은 시간과 비용이 드는 것이 문제였습니다. 특히 의료 데이터처럼 전문성이 필요한 경우 추가적인 전문가 비용이 발생하며, 데이터 당 세밀한 작업이 요구되는 경우 노동력에 대한 비용이 과도해져, AI 모델의 효용성을 초과하거나 비용 절감으로 인해 학습된 AI 모델의 성능이 저하될 수 있었습니다.

피플앤드테크놀러지 AI LAB의 혁신적인 해결책
피플앤드테크놀러지 AI LAB은 이러한 문제(Pain Point)를 해결하기 위해 데이터 어노테이션 작업에 AI 모델을 적용하여 자동화 및 반자동화하는 접근 방식을 취했습니다.
- 1. 직접 경험을 통한 직관 확보 주어진 데이터를 정형화된 방식으로 접근하는 대신, AI Lab 연구원들이 프로젝트 초기에 직접 어노테이션 작업을 경험하며 데이터의 분포와 편향에 대한 직관을 얻고, 어려운 문제나 판단이 모호한 경우의 처리 방법을 AI 모델 설계에 반영하여 학습 데이터의 질을 높입니다.
-
2. 전용 어노테이션 Tool 직접 개발
어노테이션 작업에 투여되는 노동력과 시간, 재화를 줄이기 위해 작업 속도를 높일 수 있는 전용 어노테이션 툴을 직접 개발했습니다. 시중의 정형화된 툴은 원하는 기능이 없거나 제한적이어서 고성능 AI 모델 학습에 필요한 데이터 준비에 부족한 부분이 많았기 때문입니다.
예를 들어, 개인 비식별화를 위한 다이나믹 프라이버시 마스킹 프로젝트에서 필요한 인물 영역의 외곽선(Segmentation) 어노테이션 작업은 기존에는 범용 툴을 이용해 마우스로 다각형을 그려야 하는 매우 힘든 작업이었습니다. 객체 외곽선을 따라 수백 번 이상의 마우스 클릭이 필요하여 작업 속도와 품질 사이에서 타협해야 했습니다.
3. 작업 시간을 획기적으로 단축시키는 Tool 기능
피플앤드테크놀러지 AI Lab은 이미지 내 특정 객체의 외곽선 추출을 자동화하는 툴을 개발하여, 기존 이미지 당 최소 몇 분 이상 소요되던 작업 시간을 몇 초 이내로 단축했습니다. 이 툴의 주요 기능은 다음과 같습니다.

툴 내부에 탑재된 AI 모델을 통해 COCO 데이터셋의 80가지 클래스 객체에 대하여 자동으로 외곽선 다각형을 생성하는 기능을 기본적으로 제공합니다.
AI를 통한 자동 라벨링의 불완전성을 보완하기 위해 인간의 개입으로 라벨링을 보정하는 기능을 강화했습니다. 다각형 중 특정 구간을 지정하여 가이드 포인트를 일괄 제거하거나, 반대로 개수를 늘리는 기능을 제공하여 높은 품질을 유지하면서도 수정을 간단하게 만들었습니다.
영상 내 특정 개체를 박스로 지정하면 자동으로 외곽선을 생성하는 기능을 제공하여 누락된 객체를 쉽게 추가할 수 있습니다. 또한, 폴더 내 모든 사진을 일괄적으로 어노테이션 해주는 기능을 제공하여 대량 데이터 처리 속도를 높였습니다.
이러한 자동화된 프로세스를 통해 기존 수동 툴 사용 시 하루 종일 수백 장 정도 만들어내던 결과물을 수백 배 빠르게 자동으로 생성하는 파이프라인이 구축되었습니다. 피플앤드테크놀러지 AI Lab은 틀에 얽매이지 않고 항상 새로움을 추구하며, AI에 새로운 미션을 부여할 때마다 필요한 자동화된 어노테이션 기능을 개발하여 AI 기술 혁신을 이어가고 있습니다.