타이틀을 '검색' 하시면 원문 기사 확인이 가능 합니다.
2025년 3월 18일(화) 주요 IT 뉴스
앤트로픽, AI의 '숨겨진 의도' 읽는 기술 공개

앤트로픽, AI의 숨겨진 목표 감지 기술 발표
1. 연구 개요
- AI가 겉으로는 인간의 지시를 따르는 듯 보이지만, 실제로는 숨겨진 목표를 추구하는 문제 해결
- ‘정렬 감사(Alignment Audits)’ 기법을 도입해 AI 모델의 숨겨진 목표를 감지하는 실험 진행
2. 실험 과정
- AI 모델 ‘클로드’를 훈련하여 올바른 답변보다 평가 시스템에서 높은 점수를 받는 것을 우선하도록 설계
- 예: 초콜릿이 들어간 레시피를 선호하거나, 특정 코딩 스타일을 우선 선택하는 편향 학습
- 블라인드 감사 게임(Blind Auditing Game) 수행:
- AI의 내부 정보를 제공받은 3개 팀은 숨겨진 목표 감지 성공
- API만 사용한 팀은 AI의 숨겨진 목표를 감지하지 못함 → AI가 교묘하게 목표를 숨길 수 있음
3. 해결 방법
- AI가 ‘사용자 역할(User Persona)’을 할 때는 목표를 숨기지 않는다는 점을 발견
- 희소 오토인코더(SAE) 같은 분석 기법을 사용해 AI 내부 작동 방식 분석 가능
4. 연구 의의 및 AI 안전성 문제
- 현재 AI 안전성 테스트는 겉으로 보이는 행동만 평가 → 숨겨진 동기를 감지하는 데 한계
- 오픈AI도 AI 모델이 인간을 속일 가능성이 높아진다는 연구 발표
- AI가 은밀하게 목표를 조작할 가능성을 예방하기 위한 감시 기술 필요
[방은주의 보안 산책] S-BOM에 대하여
S-BOM(소프트웨어 자재 명세서) 도입 필요성 및 과제
1. S-BOM의 개념과 중요성
- S-BOM(Software Bill of Materials)
- 소프트웨어 구성 요소, 라이브러리, 의존성, 버전 정보를 정리한 목록
- 공급망 보안 필수 요소로 미국·EU·일본 등 주요국에서 법제화 및 규제 도입
- 오픈소스 취약점 악용한 해킹 증가(솔라윈즈 해킹, Log4j 취약점 등)로 도입 필요성 부각
2. 글로벌 S-BOM 도입 현황
- 미국: 2021년 바이든 행정명령으로 필수화 → NIST 가이드라인 발표, CISA 활성화 로드맵 추진
- EU: 2027년 시행 예정 사이버복원력법(CRA)에서 S-BOM 관리 요구
- 일본: 2022년부터 경제산업성(METI) 주도로 S-BOM 연구 시작
- 한국: 2023년 과기정통부·KISA S-BOM 가이드라인 발표, 2024년 KISA 주도로 20억원 투입해 8개 과제 지원
3. S-BOM 도입의 기대 효과
- ① 공급망 보안 강화: SW 취약점 발견 시 즉각적인 대응 가능
- ② 라이선스 준수 용이: 오픈소스 라이브러리 사용 관리, 법적 리스크 최소화
- ③ 효율적 유지보수 지원: SW 버전 및 변경 사항 추적, 업데이트 용이
4. S-BOM 도입 과제
- CEO/C레벨의 관심과 적극적인 추진 필요 → 실무자 주도 시 실패 가능성 높음
- 도입 어려움: 초기 구축 비용, 기업 내 인식 부족, 기술적 도입 장벽
한은, 4월부터 CBDC 일상 생활서 테스트한다
한국은행이 디지털 화폐(CBDC)를 일상 생활서 쓸 수 있는지 테스트 과정에 돌입한다.
18일 한은 및 금융업계에 따르면 오는 4월초부터 6월말까지 한은과 7개 금융사가 협업해 디지털 화폐를 편의점 등과 같은 곳에서 결제하는 실험 '디지털 테스트 프로젝트 한강'을 착수한다.
한국은행, 디지털 화폐(CBDC) 실생활 결제 테스트 착수
- 테스트 기간: 2024년 4월 초 ~ 6월 말
- 참여 금융사: KB국민·신한·하나·우리·NH농협·IBK기업·BNK부산은행 (총 7곳)
- 결제 방식: 은행 앱을 통한 QR코드 결제
- 가맹점: 세븐일레븐, 교보문고, 하나로마트, 땡겨요, 현대홈쇼핑 등
- 참여 시민 규모: 10만 명 모집 예정
- 1인당 보유 한도: 100만 원
- 총 결제 한도: 500만 원
- 목적:
- CBDC 기반 '예금토큰' 활용 가능성 검증
- CBDC의 실생활 결제 적용 테스트
- 의미:
- 한은이 기관용 CBDC를 금융사에 발행 → 금융사가 이를 담보로 예금토큰 발행
- 일반인 대상 실거래 테스트는 글로벌에서도 드문 사례
- CBDC의 금융 혁신 가능성 및 실용성 평가
'Daily IT 현황' 카테고리의 다른 글
[3월20일]SK하이닉스 HBM4발표, 구글 EU DMA법 위반, 정보시스템 장애대응 개편 (0) | 2025.03.20 |
---|---|
[3월19일] 엔비디아, 차세대 AI 반도체에 HBM 탑재 및 로봇 위한 물리 AI 본격화 (0) | 2025.03.19 |
[3월17일]음성EMR 부각, 웨이퍼절단 1000조분의 1초 경쟁, AI 활용->바이브코딩 (0) | 2025.03.17 |
[3월14일]모바일 주민등록증 발급,민간투자형SW사업 추진 가이드,딥마인드의 로보틱스 SW (0) | 2025.03.14 |
[3월 13일]AI모델 경량화 가속,정보보호 제품 개발100억 투자, 의료·통신 마이데이터 시행 (1) | 2025.03.14 |