이제는 OO 놓치면 527억 원 벌금? 💸 SM 버추얼 아이돌을 만든 자이언트스텝,
AI 학습 데이터 편향성을
어떻게 극복했을까? ✨ |
|
|
유튜브 알고리즘에서 한 번쯤 봤었던 SM의 버추얼 아이돌 ‘나이비스’,
바로 버추얼 휴먼 전문 기업 '자이언트스텝'에서 탄생했는데요. 😊
자이언트스텝은 버추얼 휴먼 전문가 중 전문가지만...
‘FacialX’를 개발하는 과정에서 'AI 편향성'이라는 난관에 부딪혔어요.
자이언트스텝의 FacialX란?
👉 자연스럽게 표정, 모션을 구사하는 버추얼 액터를 제작할 수 있는 장치!
데이터클리닉은 자이언트스텝의 데블이(나쁜 데이터)를 페블이(좋은 데이터)로
완전히 변화시켰어요!
|
|
|
자이언트스텝의 데블이
데이터 품질 진단 보고서😵 |
|
|
특정 얼굴 유형에만 데이터 집중 ➡️ FacialX의 인식 정확도 감소
자이언트스텝: '그러면 직접 합성 데이터를 만들어보자!'
👉 오히려 중복 데이터만 증가, 학습 효율은 감소
⬇️데이터 다이어트 전, 벡터 임베딩 이미지를 볼까요?
일부 데이터가 과밀하여 그래프에 울퉁불퉁한 이미지가 만들어졌어요.
|
|
|
데이터 다이어트
🏥 데이터클리닉의 데이터 다이어트 원칙
- 근손실❌ 근육처럼 건강한 데이터는 제거하지 않고 꼭 남겨두기
- 내장지방처럼 불건강한 데이터만 없애기
내부 인력이 직접 제거하면, 어떤 문제가 생길까?
여러분의 무의식 속 '편향성'
➡️ 자칫하면 꼭 필요한 데이터도 없앨 수 있어요.
그 해답은?
➡️ 여러분 대신 객관적으로 바라보는 눈, 데이터 렌즈! 🔍
- 데이터 렌즈로 표정, 구도 등 이미지를 다각도로 분석
- 분석 결과: 실제 데이터의 60% 이상이 특정 조건에 집중
- 이 편향을 '수치화'하여 필요한 부분만 남겨둘 수 있었어요.
⬇️데이터 다이어트 후, 또다시 벡터 임베딩으로 확인해볼까요?
그 전에는 과밀한 부분이 다수 존재했는데,
데이터 다이어트 이후, 깔끔하고 일정한 밀도로 변환되었어요.
|
|
|
데이터 벌크업
근손실 없이, 건강하게 근육을 남겨두었다면?
➡️세밀한 표정 변화를 구현하기 위한 '데이터 벌크업' 필요 💪
그냥 합성데이터 말고, ‘정밀 타기팅 합성데이터’란?
- ‘보톡스'처럼 필요한 데이터만 콕 집어서 합성데이터를 생성하는 기술
- 얼굴 근육의 미세한 움직임, 광원 조건, 시선 방향 등...
- 모두 세세히 고려하여 편향 없이 골고루 분포된 합성 데이터셋 생성!
|
|
|
자이언트스텝의 페블이
데이터 품질 진단 보고서😘 |
|
|
✴️ 중복 데이터를 제거해 데이터 200만 건 → 약 40만 건으로 축소
✴️ 단 66명의 합성 데이터만으로 성능 향상
➡️ 어색한 버추얼 휴먼이 아닌 실제 인간처럼 자연스러운 표정 구현 성공! |
|
|
미이행시 벌금 527억원? 💸
반드시 이행해야 하는 AI 규제🛡️ |
|
|
😖 인공지능 데이터 편향성을 바로 잡지 못하면?
1️⃣ 기업에 대한 부정적인 이미지
2️⃣ 비효율적인 업무 절차: 인건비 손실, 야근
그런데 이 외에 중요한 내용이 하나 더 있어요.
3️⃣ AI 법적 규제로 인한 ‘벌금 폭탄’💣 (NEW!)
벌금 폭탄을 예방하기 위해, 법적 규제에 대한 꼼꼼한 숙지는 필수예요!
NYC 144
- 미국 뉴욕시의 'AI 채용 시스템' 규제
- 채용 시 AI 편향성 결과 보고서를 제출하지 않으면?
- 기업은 지연 일수당 최대 200만 원 벌금을 내야만 해요!
EU AI Act
- 전 세계 최초, 포괄적인 AI 규제 프레임워크
- 위반 시 전체 매출액의 7% 또는 3,500만 유로(약 527억 원)의 벌금을 납부해야 해요.
|
|
|
데이터클리닉 2.0 등장,
벌금 리스크까지 예방해드려요! 💸 |
|
|
데이터 다이어트, 벌크업으로 업무 효율을 높이는 건 물론,
여기에 까다로운 법적 규제까지 철저히 지키고 싶다면?
데이터 클리닉 2.0(AADS)이 대신 도와드려요! 😎
- 인공지능이 자체적으로 규제 학습! 스스로 편향성을 관리해요.
- 국제 표준 ISO/IEC 25012와 5259의 데이터 품질 평가 기준을 준수해요.
참고로 데이터 클리닉 2.0은 11월 중순 본격적으로 오픈해요.
지금 사전 등록하면 0️⃣원으로 1개월 간 이용이 가능합니다! 💯
|
|
|
AI 모델을 하루 빨리 제작해야 하는데,
AI 편향성으로 인해 매일 밤 10시, 늦게 퇴근하고 있다면?
데이터클리닉 2.0으로 기업의 데이터 건강을 지키고,
데이터 사이언티스트, 데이터 엔지니어, AI 연구자님들의 소중한 시간을 지키세요! |
|
|
🚀 AI 기반 데이터 혁신, 지금 페블러스와 함께 하세요! |
|
|
페블러스는 AI와 데이터 분석을 통해 다양한 산업의 문제를 해결하고,
더 나은 의사결정을 지원합니다.
📌 페블러스에 대해 더 알고 싶거나, 협업 및 파트너십을 논의하고 싶다면
언제든지 연락 주세요!
페블러스 드림 |
|
|
|