[Trustworthy AI] 적대적 공격에 대응해 AI 안전성 확보하기
개요가짜 연구소 "공정, 지속 가능, 신뢰할 수 있는 인공지능을 위한 안내서" 8기 러너로 활동하며, 작성한 글입니다.이번 글에서는 "Trustworthy AI"의 특성 중, 하나인 "SAFETY" 측면에서의 적대적 공격과 관련에 다루어보고자 합니다.작성된 글은 2024년 TTA에서 발표한 "신뢰할 수 있는 인공지능 개발 안내서 - 생성 AI 기반 서비스 분야"에서 적대적 공격에 관한 내용만 찾아 정리한 내용입니다. 인공지능 신뢰성 개념✅ 데이터 및 모델의 편향, 인공지능 기술에 내재한 위험과 한계 해결✅ 인공지능 활용하고 확산하는 과정에서 부작용 방지하기 위해 준수해야 하는 가치✅ 일반적으로 안전성, 설명가능성, 투명성, 견고성, 공정성 등이 신뢰성 확보하는 데 필수적 요소로 거론인공지능 신뢰성의 주요..
2024.05.04