2025년 AI 데이터 품질관리 가이드라인 v3.5
2025.05.23 조회수 2407 윤주미 AI데이터사업팀

2024년 초거대AI 확산 생태계 조성사업(이하 '데이터 구축사업')의 수행내용을 기반으로 제작된 ‘AI 데이터 품질관리 가이드라인 v3.5’ 입니다.


가이드라인 구성은 총 3권 입니다.

1권. AI 데이터 품질관리 가이드 v3.5

2권. AI 데이터 구축 가이드 v3.5

3권. 생성형AI 데이터 품질관리 가이드 v2.0


1권은 데이터 구축사업 내 품질관리 거버넌스 및 프레임워크, 품질검증 지표에 대해 기술되어있으며,

2권은 데이터 구축사업 사례를 중심으로 AI 데이터 구축 방법 및 절차를 공유하는 데 목적이 있습니다.

3권은 1권의 품질관리 프레임워크를 기반으로 챗GPT 등으로 대두되는 생성형AI 분야 데이터(LLM, LMM, 합성)의 특징을 발췌하여 작성하였습니다.


연도별 인공지능 학습용 데이터 품질관리 가이드라인은 'AI허브(www.aihub.or.kr)' 홈페이지에서도 확인 가능합니다. (경로 : 커뮤니티 > 품질가이드)


감사합니다.


* 문의 : AI데이터사업팀 윤주미 주임(053-230-4220, jumi@nia.or.kr)


* 목차

(제1권) AI 데이터 품질관리 가이드 v3.5

 - AI 데이터 품질관리 가이드라인 v3.5 요약

 1. 개요

    - 추진 배경 및 목적

    - 품질관리 가이드라인 구성

    - 인공지능 학습용 데이터 이해

    - 인공지능 학습용 데이터 품질관리 이해

 2. 품질관리 체계

    - 품질관리 프레임워크

    - 품질관리 프로세스 및 산출물

    - 품질 자가점검 및 품질검증

 3. 부록

    - 품질관리 기준

    - 품질지표 설정 가이드

    - 데이터 라벨링 가이드

    - 개인정보보호 가이드

 4. 참고자료


(제2권) AI 데이터 구축 가이드 v3.5

 1. 개요

    - 작성 배경 및 목적

    - 품질관리 가이드라인 구성

 2. 데이터 구축 안내

    - 데이터 구축 사례

    - 품질관리 사례

 3. 품질 오류 유형 분석

    - 품질 오류 유형 분석

    - 유형별 오류 예시


(제3권) 생성형AI 데이터 품질관리 가이드 v2.0

 1. 개요

    - 추진 배경 및 목적

    - 품질관리 가이드라인 구성

    - 생성형AI 데이터 이해

    - 생성형AI 데이터 품질관리 이해

 2. 생성형AI 데이터 품질관리 체계

    - 품질관리 프레임워크

    - 품질관리 프로세스 및 산출물

 3. 생성형AI 주요기술

    - 이미지 캡셔닝 기술

    - 생성형AI 주요 모델 및 기술

 4. 부록

    - 품질관리 지표 기준

    - 품질지표 설정 가이드




트위터 페이스북 구글 플러스 인쇄