본문 바로가기 전체메뉴 바로가기

간행물

ICT 동향 분석

지능데이터 동향

NIA 한국정보화진흥원 로고
  • 국내외 지능데이터 구축, 개방, 유통 및 활성화 관련 최신 동향 자료를 제공합니다.
2025년 AI 데이터 품질관리 가이드라인 v3.5
2025.05.23 조회수 3091 윤주미 AI데이터사업팀

2024년 초거대AI 확산 생태계 조성사업(이하 '데이터 구축사업')의 수행내용을 기반으로 제작된 ‘AI 데이터 품질관리 가이드라인 v3.5’ 입니다.


가이드라인 구성은 총 3권 입니다.

1권. AI 데이터 품질관리 가이드 v3.5

2권. AI 데이터 구축 가이드 v3.5

3권. 생성형AI 데이터 품질관리 가이드 v2.0


1권은 데이터 구축사업 내 품질관리 거버넌스 및 프레임워크, 품질검증 지표에 대해 기술되어있으며,

2권은 데이터 구축사업 사례를 중심으로 AI 데이터 구축 방법 및 절차를 공유하는 데 목적이 있습니다.

3권은 1권의 품질관리 프레임워크를 기반으로 챗GPT 등으로 대두되는 생성형AI 분야 데이터(LLM, LMM, 합성)의 특징을 발췌하여 작성하였습니다.


연도별 인공지능 학습용 데이터 품질관리 가이드라인은 'AI허브(www.aihub.or.kr)' 홈페이지에서도 확인 가능합니다. (경로 : 커뮤니티 > 품질가이드)


감사합니다.


* 문의 : AI데이터사업팀 윤주미 주임(053-230-4220, jumi@nia.or.kr)


* 목차

(제1권) AI 데이터 품질관리 가이드 v3.5

 - AI 데이터 품질관리 가이드라인 v3.5 요약

 1. 개요

    - 추진 배경 및 목적

    - 품질관리 가이드라인 구성

    - 인공지능 학습용 데이터 이해

    - 인공지능 학습용 데이터 품질관리 이해

 2. 품질관리 체계

    - 품질관리 프레임워크

    - 품질관리 프로세스 및 산출물

    - 품질 자가점검 및 품질검증

 3. 부록

    - 품질관리 기준

    - 품질지표 설정 가이드

    - 데이터 라벨링 가이드

    - 개인정보보호 가이드

 4. 참고자료


(제2권) AI 데이터 구축 가이드 v3.5

 1. 개요

    - 작성 배경 및 목적

    - 품질관리 가이드라인 구성

 2. 데이터 구축 안내

    - 데이터 구축 사례

    - 품질관리 사례

 3. 품질 오류 유형 분석

    - 품질 오류 유형 분석

    - 유형별 오류 예시


(제3권) 생성형AI 데이터 품질관리 가이드 v2.0

 1. 개요

    - 추진 배경 및 목적

    - 품질관리 가이드라인 구성

    - 생성형AI 데이터 이해

    - 생성형AI 데이터 품질관리 이해

 2. 생성형AI 데이터 품질관리 체계

    - 품질관리 프레임워크

    - 품질관리 프로세스 및 산출물

 3. 생성형AI 주요기술

    - 이미지 캡셔닝 기술

    - 생성형AI 주요 모델 및 기술

 4. 부록

    - 품질관리 지표 기준

    - 품질지표 설정 가이드




TOP