1️⃣ 계획 단계
'우리 기관은 어떤 품질 수준을 목표로 할까? 🤔'
기관 목표를 정의하고, 품질관리 대상과 로드맵을 설정해야 해요.
- 데이터베이스 품질관리 조직 및 인력 구성
- 품질관리 대상 등
- 데이터 표준화 방안
- 연계 데이터 품질 확보 방안
데이터클리닉은 이 단계에서 초기 컨설팅을 제공합니다!
어떤 데이터부터 개선할지, 현재 품질 상태가 어떤지를 진단하는 것이죠.
담당자님 혼자 짊어지지 마세요.
전문 데이터 사이언티스트의 도움을 받아서 현실적인 로드맵을 정해보세요!
2️⃣ 구축 단계
1) 데이터 표준화
시스템 속 데이터 코드, 용어가 일치하지 않으면
데이터를 이관하거나 활용할 때 어려움이 생겨요.
데이터클리닉은 데이터 표준화를 위해 이렇게 실행합니다.
☑️ 아직 표준화되지 않은 데이터를 찾아내요.
☑️ 기관 내부의 규칙과 패턴을 학습해요.
☑️ 데이터 구조를 일정하게 맞추며 정제해요.
2) 데이터 산출물 관리
데이터를 구축하면서 중복되는 데이터, 품질이 떨어지는 데이터를 최소화해야 해요.
데이터 처리량은 늘어나고, 시스템의 속도는 저하되거든요.
데이터클리닉은 '데이터 다이어트'로 해결해요.
☑️ 내장 지방같은 데이터는 제거해요.
☑️ 근육처럼 건강한 데이터만 남겨둡니다.
'데이터클리닉 2.0'은 운영단계에서 ‘실시간 품질 모니터링’을 지원해요.
☑️ 듀얼 거버넌스 엔진으로 데이터 품질 평가 기준, 법적 규제를 자체적으로 학습합니다.
☑️ 데이터가 이 기준에 위배된다면, 즉시 오류를 탐지하고 해결해요.