현재 ビソル AI 사이트는 자바스크립트가 필요합니다.

브라우저 설정에서 자바스크립트를 활성화 해주세요.

ニュース

不正確なAI合成データに対し、ビソルはモーションキャプチャで対応した。

2024.08.01

【デジタルデイリー イ・ゴンハン記者】 最近、国内外の人工知能(AI)業界が抱える課題の一つは「学習データの不足」である。 AIモデルに良質なデータを多く学習させれば性能は垂直に向上するが、すべての状況に適したデータを思い通りに得られるわけではないからだ。 著作権や使用料に関する利害対立のため、時には欲しいデータ自体が希少になることもある。 最近、一部では超高性能AIモデルがすでに膨大なデータを学習しているため、数年後にはデータ需要に対して供給が不足する可能性があるという見通しが出ている。

このとき「合成データ」は、問題解決の選択肢の一つとして挙げられる。 一般的には、生成 AIを用いて作成する人工的なデータを指す。 例えば、猫の写真データが不足しているとしよう。 AIモデルは、既に学習した猫データを用いて新しい猫の写真を生成し、これを精製すれば再び学習に利用できる合成データとなる。 この方法は、すぐに必要なデータを迅速に取得できる点と、実際のデータ収集・加工にかかるコストを大幅に削減できるという利点がある。

もちろん欠点もある。 代表的なものとして、精緻さに欠ける点と不正確さが挙げられる。 実際の物体に対する理解が不足しているAIの限界、さらにAIの幻覚(Hallucination)現象が発生し、学習に不適切なデータが生成される可能性も排除できない。

ビソル(Visol)は、モーションキャプチャシステムがこの問題の一部を解決できることを実証した企業である。 2000年に設立されたビソルは、『Visual+Solution』という組み合わせの社名の通り、これまで画像解析・処理、映像ソリューション分野で多様な実績を積んできた。

その中で、合成データはこれまでの経験と保有資産を基に、今や合成データ市場でビソル独自の競争力として台頭し、業界に新たなインサイトを提供するキーワードとなった。 これに関連して、ソウル・ガサンドンのビソル事務所で白明均事業開発チーム長と会い、詳しい話を聞いた。

白チーム長は、モーションキャプチャベースの合成データの最大の利点として「高精度データ」を挙げた。 モーションキャプチャは、反射マーカーが付いた専用スーツ(Suit)を着用した人の動きを空間内のモーションキャプチャカメラで認識し、3D座標値を収集して、精密な3Dモデリングや合成データの生成に利用できる。

ビソルは昔から事業の一環として社内にモーションキャプチャスタジオを直接運営している。 ここでは、人など動的な動きを取り入れた3Dモデリングデータを精緻に生成できる。 彼らは、合成データを車両など固定された物体の移動データである「スタティックデータ」と、人間のように関節を持ち複雑な動きを含む「ダイナミックデータ」に区別している。 ビソルが注目したのは、従来の生成型方式では対応が難しいダイナミックデータ領域である。

白チーム長は、実際の顧客事例としてスクリーンゴルフ専門会社のA社のケースを挙げた。 当時、市場内の後発企業であるA社は、リーダー追撃のためにAI領域で差別化されたサービスが必要だったが、スクリーンゴルフの学習データがやや不足している状況だった。 彼は「当時、A社に約200万枚のゴルフ姿勢に関する合成データを提供した」と語った。 ここには、さまざまな身長や体型が適用された60体の3Dキャラクターと、屋内外の3D背景が3つ、さまざまなカメラ位置が設定されており、顧客企業もかなり満足できる成果を上げたと理解している」と語った。

 

 

A社が必要としていたデータは、屋内外のさまざまな環境でのゴルフスイング姿勢だった。 市場にこのようなデータはあまり見られない上に、データ化する際に人間のコーチを配置して一つひとつ監督する過程は、非常に長い時間とコスト、品質の不均衡を生む。 参加者やコーチのコンディション、指導方法によっても、さまざまなデータが生まれ得るからだ。 必要なシナリオは数十に上る状況だった。

そこでビソルは、A社が招聘したプロ級ゴルファーや一般の人々に社内モーションキャプチャスタジオで必要なシナリオ動作を体験させ、収集した実測値に基づく精緻な3Dモデリング合成データを大量に生成した。

白チーム長は「右利きなのに左打席で打つ人、そもそも姿勢が乱れている人、体型がそれぞれ違う人、カメラの角度によって変わる視点など、変数は本当に多様だ」と語り、「何よりもこのようなデータは『見えにくい肩の位置』といった要素も明確に判別できなければならない」と付け加えた。 従来の方式では、写真データに写っていない腕や手の位置を感覚で指定し、データにラベル(名前表示)を付けていた。 問題は、この場合当然ながら実際の動作過程で不正確なデータが生成される点であり、3Dモデリングデータを活用することで効果的に解決できた」と説明した。

その後、ビソルはさまざまな分野で合成データ事業の拡大可能性を研究している。 モーションキャプチャを活用した別の活用事例として「テコンドー型審査」ソリューションがある。 これもまた、テコンドーの動作精度測定やトレーニング効率向上のためのAIシステムに有用に活用できる。 実質的に「行動ベース」のデータであれば、拡張性は無限大である。 特にビソルが生成するデータはすべて著作権問題がなく、最近データ出所問題が注目されているAI市場においても、もう一つの事業競争力として機能している。

 

ビソルはさらに、特殊環境に関する合成データの研究も継続している。 同社が長期間にわたり確保した3Dモデリング環境の実装とダイナミック合成データの構築能力を基に、「災害」や「戦争」などの特殊状況を想定した合成データ生成研究が主な分野である。 特に軍事分野は、世界的な軍事高度化のトレンドに伴いAIシミュレーションやAI訓練の需要が増加している領域であるが、やはり十分なデータを確保するのは難しい分野でもある。 各種災害状況も同様に、ビソルはこれらの分野に対する先制的な研究と事例の確保を通じて、合成データ事業を継続的に拡大していく方針である。

 

ただし、合成データが万能ではないという点には同意した。 白チーム長は「どの学習データも現実のデータと同一であることはあり得ない」と述べた。 しかし、ビソルは数値情報に基づく3Dモデリングされたオブジェクトと高精度光学式モーションキャプチャシステムで収集された高品質モーションデータを使用しているため、正確性、精緻さ、多様性、特殊性といったさまざまなAI性能向上の要件を満たすことができる」と述べ、「内部の機械学習(ML)融合開発チームでも、我々が生成したデータを引き続き直接検証している。 合成データでたとえ数パーセントの性能向上でも引き出すことができれば、それ自体に十分な価値があるだろう」と語った。

白チーム長の言う通り、実際に多数の研究論文によれば、3Dモデリング合成データは▲ゲーム制作、▲ロボティクスベースの製品組み立て、▲動物の動きの観察·分析など、さまざまな領域で既に顕著な成果を上げていることが確認されている。

実際の事業や売上の観点から、合成データが与える影響はどれほどだろうか? ビソルは現在、自社のAIソリューション供給に含まれる合成データや、合成データの直接供給などで関連売上を算出している。 今年は約20〜30億ウォンの収益が見込まれ、来年は80億ウォンを目標に事業を拡大する計画だ。

白チーム長は「国内で合成データの活用事例は増えているものの、依然としてデータとして不足しているという認識が多数を占めているのが現実だ」と述べた。 幸いにも政府レベルで政策的に合成データの育成と奨励の動きが見られ、ほっとした」としつつ、「しかし、急速に発展しているAI産業で競争力を強化するためには、現在よりも積極的かつ多様な方法で合成データを活用する方策について検討する必要がある時期だ」と強調した。

Top