오픈AI 새 AI 모델, o3와 o4 미니 환각 현상 심각 역주행 논란

추론 능력 향상했지만, 기존 모델보다 오류 심화 세무·법조계 등 중요 분야 신뢰성 의구심 증폭

소프트뱅크 CEO 마사요시 손과 오픈AI CEO 샘 알트만이 2025년 2월 3일 일본 도쿄에서 기업을 대상으로 AI를 홍보하는 행사에 참석하고 있다.[사진=REUTERS 연합뉴스]

[이코노믹데일리] 챗GPT 개발사 오픈AI가 새롭게 내놓은 추론형 인공지능(AI) 모델 'o3'와 'o4 미니'에서 환각 현상이 이전 버전보다 더 심화된 것으로 나타났다. 환각은 AI가 사실이 아닌 정보를 사실처럼 제시하는 현상을 말한다.

19일(현지시간) 테크크런치 보도에 따르면, 오픈AI 자체 평가 결과 o3는 질문의 33%, o4 미니는 무려 48%에서 환각을 보였다. 이는 기존 모델인 o1(16%)과 o3 미니(14.8%) 대비 두세 배 높은 수치다. 기존 비추론 모델인 GPT-4o보다도 환각 빈도가 높게 나타났다.

이 모델들은 '이미지로 사고할 수 있는 첫 모델'로 소개되며 이미지 분석 및 코딩 능력 등에서 향상된 성능을 보였다. 하지만 정작 AI의 기본적 신뢰성과 직결되는 환각 문제는 오히려 악화된 것이다.

오픈AI는 이러한 환각 악화 현상의 정확한 원인을 파악 중이며, "더 많은 연구가 필요하다"고 밝혔다. 다만, 현재까지는 이 모델들이 "전반적으로 더 많은 주장을 하기에 부정확하거나 환각적인 주장을 하는 경우도 늘었다"고 설명했다.

업계에서는 주요 AI 기업들이 추론형 모델 개발에 집중하는 상황에서 이번 결과가 향후 추론형 AI의 신뢰성에 대한 우려를 키울 수 있다고 지적한다. 답변의 정확성이 특히 중요한 세무, 회계, 법조계 등에서는 환각 이슈가 해결되지 않을 경우 추론형 AI 사용에 제약이 따를 수 있다.

이에 대해 오픈AI는 "모든 문제에서 환각 해결은 지속적인 연구 분야"라며 "정확성과 신뢰성 개선을 위해 노력하고 있다"고 해명했다.

오픈AI 새 AI 모델, 'o3'와 'o4 미니' 환각 현상 심각 '역주행' 논란

전체메뉴