[디지털데일리 이건한 기자] 최근 국내외 인공지능(AI) 업계의 고민 중 하나는 ‘학습 데이터 부족’이다. AI 모델에 좋은 데이터를 많이 학습시킬수록 성능은 수직 상승하지만, 모든 상황에 적합한 데이터를 원하는 대로 구할 수 있는 건 아니기 때문이다. 저작권이나 사용료에 대한 이해관계 충돌로, 때론 원하는 데이터 자체가 희귀한 경우도 있다. 최근 일각에선 초고성능 AI 모델들이 이미 너무 많은 데이터를 학습한 만큼, 수년 뒤엔 데이터 수요보다 공급이 부족할 수 있다는 전망이 나오기도 한다.
이때 ‘합성데이터’는 문제를 해결할 대안 중 하나로 꼽힌다. 일반적으론 생성형 AI를 사용해 제작하는 인공적인 데이터를 말한다. 가령 고양이 사진 데이터가 부족하다고 치자. AI 모델이 기존에 학습한 고양이 데이터로 새로운 고양이 사진을 생성하도록 하고, 이를 정제하면 다시 학습에 사용 가능한 합성데이터가 된다. 이 방법은 당장 필요한 데이터를 빠르게 수급할 수 있는 점, 실제 데이터를 수집하고 가공하는 작업 대비 비용이 크게 절감되는 장점이 있다.
물론 단점도 있다. 대표적으로 정교함이 떨어지는 점과 부정확성이 꼽힌다. 실제 사물에 대한 이해가 부족한 AI의 한계, 또한 AI 환각(Hallucination)현상 발생으로 학습에 부적절한 데이터가 생성될 가능성도 배제할 수 없다.
비솔(Visol)은 모션캡처 시스템이 이 문제의 일부를 해결할 수 있음을 증명한 기업이다. 지난 2000 년 설립된 비솔은 ‘Visual+Solution’이 조합된 사명처럼 그간 이미지 분석과 처리, 영상 솔루션 분야에서 다양한 경력을 쌓아왔다.
이 가운데 합성데이터는 그간의 경험과 보유자산을 바탕으로 이제 합성데이터 시장에서 비솔만의 독자적인 경쟁력으로 부상하고, 업계엔 새로운 인사이트를 던진 키워드가 됐다. 이와 관련해 서울 가산동 비솔 사무실에서 백명균 사업개발팀 팀장을 만나 자세한 이야기를 들어봤다.
백 팀장은 모션캡처 기반 합성 데이터의 가장 큰 장점으로 ‘정밀도 높은 데이터’를 꼽았다. 모션캡처는 반사마커가 부착된 전용 수트(Suit) 를 착용한 사람의 움직임을 공간 내 모션캡처 카메라로 인식하고 3D 좌표값을 수집해, 정밀한 3D 모델링 및 합성 데이터 생성 작업에 사용될 수 있다.
비솔은 오래전부터 사업 일환으로 사내에 직접 모션캡처 스튜디오를 운영 중이다. 이곳에서 사람 등 동적인 움직임이 가미된 3D 모델링 데이터를 정교하게 생성할 수 있다. 이들은 합성데이터를 차량 등 고정된 사물의 이동 데이터인 ‘스태틱 데이터’와 사람처럼 관절 등을 지녀 복잡한 움직임이 포함된 ‘다이나믹 데이터’로 구분한다. 비솔이 주목한 건 기존 생성형 방식으로 대응하기 어려운 다이나믹 데이터 영역이다.
백 팀장은 실제 고객사례 중 스크린골프 전문회사인 A사 사례를 들었다. 당시 시장 내 후발주자인 A사는 선두 추격을 위해 AI 영역에서 차별화된 서비스가 필요했으나 스크린골프 학습 데이터가 다소 부족한 상황이었다. 그는 “당시 A사에 약 200만장의 골프 자세 관련 합성데이터를 제공했다. 여기에는 다양한 키, 체형 등이 적용된 60개의 3D 캐릭터와 실내외 3D 배경 3개, 다양한 카메라 위치가 적용됐다 “며 “고객사에서도 꽤 만족할 만한 성과를 거둔 것으로 안다”고 말했다.