2024년 초거대AI 확산 생태계 조성사업(이하 '데이터 구축사업')의 수행내용을 기반으로 제작된 ‘AI 데이터 품질관리 가이드라인 v3.5’ 입니다.
가이드라인 구성은 총 3권 입니다.
1권. AI 데이터 품질관리 가이드 v3.5
2권. AI 데이터 구축 가이드 v3.5
3권. 생성형AI 데이터 품질관리 가이드 v2.0
1권은 데이터 구축사업 내 품질관리 거버넌스 및 프레임워크, 품질검증 지표에 대해 기술되어있으며,
2권은 데이터 구축사업 사례를 중심으로 AI 데이터 구축 방법 및 절차를 공유하는 데 목적이 있습니다.
3권은 1권의 품질관리 프레임워크를 기반으로 챗GPT 등으로 대두되는 생성형AI 분야 데이터(LLM, LMM, 합성)의 특징을 발췌하여 작성하였습니다.
연도별 인공지능 학습용 데이터 품질관리 가이드라인은 'AI허브(www.aihub.or.kr)' 홈페이지에서도 확인 가능합니다. (경로 : 커뮤니티 > 품질가이드)
감사합니다.
* 문의 : AI데이터사업팀 윤주미 주임(053-230-4220, jumi@nia.or.kr)
* 목차
(제1권) AI 데이터 품질관리 가이드 v3.5
- AI 데이터 품질관리 가이드라인 v3.5 요약
1. 개요
- 추진 배경 및 목적
- 품질관리 가이드라인 구성
- 인공지능 학습용 데이터 이해
- 인공지능 학습용 데이터 품질관리 이해
2. 품질관리 체계
- 품질관리 프레임워크
- 품질관리 프로세스 및 산출물
- 품질 자가점검 및 품질검증
3. 부록
- 품질관리 기준
- 품질지표 설정 가이드
- 데이터 라벨링 가이드
- 개인정보보호 가이드
4. 참고자료
(제2권) AI 데이터 구축 가이드 v3.5
1. 개요
- 작성 배경 및 목적
- 품질관리 가이드라인 구성
2. 데이터 구축 안내
- 데이터 구축 사례
- 품질관리 사례
3. 품질 오류 유형 분석
- 품질 오류 유형 분석
- 유형별 오류 예시
(제3권) 생성형AI 데이터 품질관리 가이드 v2.0
1. 개요
- 추진 배경 및 목적
- 품질관리 가이드라인 구성
- 생성형AI 데이터 이해
- 생성형AI 데이터 품질관리 이해
2. 생성형AI 데이터 품질관리 체계
- 품질관리 프레임워크
- 품질관리 프로세스 및 산출물
3. 생성형AI 주요기술
- 이미지 캡셔닝 기술
- 생성형AI 주요 모델 및 기술
4. 부록
- 품질관리 지표 기준
- 품질지표 설정 가이드