2026.05.02 (토)

  • 구름많음동두천 11.1℃
  • 구름많음강릉 18.2℃
  • 연무서울 13.1℃
  • 구름많음대전 12.4℃
  • 구름많음대구 12.0℃
  • 맑음울산 14.8℃
  • 흐림광주 11.2℃
  • 맑음부산 14.9℃
  • 흐림고창 8.1℃
  • 구름많음제주 14.6℃
  • 구름많음강화 9.6℃
  • 구름많음보은 7.3℃
  • 맑음금산 7.8℃
  • 흐림강진군 9.6℃
  • 구름많음경주시 11.9℃
  • 구름많음거제 12.1℃
기상청 제공

오픈AI, GPT-5.2 공개…다시 제미나이에 앞서는 성능 선보여

즉답·사고 모드에 프로 모드 추가…연령예측 모델 적용해 미성년자 보호 기능도

 

(조세금융신문=최주현 기자) 구글의 추격을 받는 챗GPT 개발사 오픈AI가 이전 버전을 내놓은 지 불과 한 달 만에 새 버전 'GPT-5.2'를 내놨다.

 

11일(현지시간) 연합뉴스에 따르면 오픈AI는 전문적인 지식 업무 수행에 가장 뛰어난 모델 GPT-5.2 시리즈를 이날 출시한다고 밝혔다.

 

GPT-5.2는 이전의 즉답(Instant), 사고(Thinking) 모드에 프로 모드를 더해 모두 세 가지 모드로 구성됐다.

즉답 모드는 일상적인 업무와 학습을 위한 빠른 답변에 최적화했고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다.

 

또 프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구라고 오픈AI는 소개했다.

오픈AI는 새 버전이 추론과 코딩 능력을 강화하고 환각을 줄였으며, AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 강조했다.

 

전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖춘 것으로 평가됐다. 이전 버전인 GPT-5(38.8%)와 견줘 큰 폭의 성장을 보였다.

 

소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록해, 제미나이 3프로의 76.2%를 능가했다. 코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없는 수준이다.

 

'인간의 마지막 시험'으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.

 

별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 GPT-5.2 프로는 36.6%로 제미나이3 프로의 37.5%보다 소폭 낮은 평가를 보였지만, 검색 등 도구를 사용해서 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.

 

환각(Hallucination) 현상도 크게 줄였다. 내부 테스트 결과 GPT-5.2 사고 모드의 오류율은 6.2%로 전작인 GPT-5.1 사고 모드(8.8%)와 견줘 약 30% 감소하는 등 신뢰도가 높아졌다고 오픈AI는 설명했다.

 

긴 글의 맥락을 파악하는 능력이나 그래프를 비롯한 그림과 사진을 인식하는 능력, 다단계 업무의 해결 능력 등도 향상됐다.

 

특히 오픈AI는 GPT-5.2에 정신건강을 비롯한 민감한 대화에서 응답 방식을 개선했고, 연령 예측 모델을 적용해 18세 미만 미성년자에 대한 콘텐츠 보호 기능을 적용하고 부모 통제 기능을 강화했다고 설명했다.

 

GPT-5.2는 유료 요금제 구독자에 이날부터 순차적으로 제공되며, 개발자들도 API를 통해 이용할 수 있다.

 

새 버전 출시에 따라 이전 버전인 GPT-5.1은 앞으로 3개월간 제공된 이후 서비스를 종료한다.

 

오픈AI가 불과 한 달 간격을 두고 챗GPT 새 버전을 내놓은 것은 지난 2022년 챗GPT 서비스를 시작한 이래 처음 있는 일이다.

 

오픈AI는 당초 GPT-5.2를 월말에 내놓으려 했지만, 제미나이3 프로가 강력한 벤치마크 성적표를 앞세워 이용자 몰이를 하는 것을 보고 출시를 앞당긴 것으로 전해졌다.

 

샘 올트먼 오픈AI 최고경영자(CEO)는 제미나이3 프로 출시 이후 사내에 중대경보(코드레드)를 발령하고 다른 일을 제쳐두고 챗GPT 성능과 사용성 개선에 집중하라고 주문한 바 있다.

 

오픈AI는 내년 1월에 또다시 새로운 모델을 선보인 이후 경보를 해제할 예정이라고 앞서 월스트리트저널(WSJ)이 보도한 바 있다.

 

 

[조세금융신문(tfmedia.co.kr), 무단전재 및 재배포 금지]













전문가 코너

더보기



[이명구 관세청장의 행정노트] 가상자산과 쥐(rat)
(조세금융신문=이명구 관세청장) 최근 가상자산 ‘오지급’ 사고가 발생했다. 단순한 입력 실수, 이른바 팻핑거(fat finger)에서 비롯된 사건이었다. 숫자 하나를 잘못 눌렀을 뿐인데, 그 결과는 62조 원이라는 상상하기 어려운 규모로 번졌다. 아이러니하게도 해당 거래소는 바로 이런 사고를 막기 위한 내부통제 시스템을 이달 말 도입할 예정이었다. 기술은 준비되고 있었지만, 실수는 그보다 빨랐다. ​이런 일은 결코 낯설지 않다. 몇 해 전 한 중견 수출업체가 수출 실적을 달러가 아닌 원화로 신고하는 바람에, 국가 전체의 수출액이 10억 달러나 과다 계상되는 일이 있었다. 첨단 시스템과 자동화가 일상화된 시대지만, 휴먼에러는 여전히 우리의 곁에 있다. 기술이 발전할수록 오히려 ‘사람의 실수’를 전제로 한 제도의 중요성은 더 커진다. ​가상자산은 분명 편리하다. 국경을 넘는 송금은 빠르고, 비용은 적다. 그러나 그 이면에는 그림자도 존재한다. 비대면·익명성이 강하고 사용자 확인이 어려운 특성 탓에, 돈세탁이나 사기, 불법 외환거래에 악용되는 사례가 끊이지 않는다. 새로운 기술은 언제나 새로운 기회를 주지만, 동시에 새로운 범죄의 통로가 되기도 한다. 특히 가상자
[인터뷰] 뮤지컬 '4번출구' 제작 김소정 대표...청소년 ‘삶의 선택지’ 제시
(조세금융신문=김영기 기자) “무대 위에서 가장 조용한 숨으로 깊은 소리를 만드는 오보에처럼, 이제는 소외된 아이들의 숨소리를 담아내는 무대를 만들고 싶습니다” 오보이스트에서 공연 제작자로 변신한 주식회사 스토리움의 김소정 대표가 뮤지컬 〈4번 출구〉를 통해 청소년 생명존중 메시지를 전한다. 2026년 청소년 생명존중 문화 확산 사업 작품으로 선정된 이번 뮤지컬은 김 대표가 연주자의 길을 잠시 멈추고 제작자로서 내딛는 첫 번째 공공 프로젝트다. 공연 제작자 김소정 스토리움 대표 인터뷰 내용을 통해 '4번출구'에 대해 들어봤다. ■ 완벽을 추구하던 연주자, ‘사람의 삶’에 질문을 던지다 김소정 대표는 오랫동안 클래식 무대에서 활동해온 오보이스트다. 예민한 악기인 오보에를 다루며 늘 완벽한 소리를 향해 자신을 조율해왔던 그는 어느 날 스스로에게 근본적인 질문을 던졌다. 김 대표는 “어느 순간 ‘나는 무엇을 위해 이 숨을 쏟고 있는가’라는 질문이 남았다”면서 “완벽한 소리를 위해 버텨온 시간이 누군가의 삶과 어떻게 닿아 있는지 생각하게 되면서 개인의 완성을 넘어 더 많은 사람과 만나는 무대를 꿈꾸게 됐다”고 제작사 ‘스토리움’의 설립 배경을 밝혔다. ■ 〈4(死)


인기뉴스