2026.05.02 (토)

  • 구름많음동두천 17.0℃
  • 구름많음강릉 21.9℃
  • 연무서울 16.9℃
  • 흐림대전 18.3℃
  • 흐림대구 17.5℃
  • 흐림울산 20.6℃
  • 구름많음광주 15.9℃
  • 흐림부산 19.8℃
  • 구름많음고창 15.5℃
  • 흐림제주 19.1℃
  • 구름많음강화 15.3℃
  • 구름많음보은 14.2℃
  • 흐림금산 13.8℃
  • 흐림강진군 15.8℃
  • 구름많음경주시 20.7℃
  • 흐림거제 18.7℃
기상청 제공

WP "가장 정확한 답을 내놓는 AI 도구는…구글 AI 모드"

 

(조세금융신문=최주현 기자) 주요 인공지능(AI) 모델 중 검색 도구로서 가장 정확한 답을 내놓는 AI는 구글 'AI 모드'라는 테스트 결과가 나왔다.

 

워싱턴포스트(WP)는 자체적으로 미국 공공·대학 도서관 사서들과 함께 진행한 AI 검색 도구 테스트에서 구글 'AI 모드'가 가장 정확한 답변을 내놓았다고 지난 27일(현지시간) 보도했다고 연합뉴스는 전했다.

 

이번 테스트는 구글 AI 모드와 AI 오버뷰, 챗GPT(오픈AI), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트) 등 9개의 AI 도구를 대상으로 진행됐다. 챗GPT는 GPT-5와 GPT-4 터보 두 모델을 포함했다.

 

AI 모드와 AI 오버뷰는 구글의 검색 도구로 AI 모드는 웹을 깊이 검색해 여러 출처를 종합한 뒤 답변을 제공하고, AI 오버뷰는 검색 결과를 AI가 요약해준다.

 

테스트는 30개의 까다로운 질문을 던진 뒤 AI 도구가 내놓는 답변 900건을 점수화했다.

 

모든 도구는 무료 기본 버전(7∼8월 기준)으로만 테스트했고, 질문은 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지에 집중됐다.

 

테스트 결과 구글 AI 모드가 100점 만점 가운데 60.2점을 얻어 가장 높은 점수를 받았다. GPT-5 기반의 챗GPT가 55.1점으로 2위를, 퍼플렉시티가 51.3점으로 3위를 차지했다.

 

일론 머스크의 그록3는 40.1점에 그쳐 8위, 메타 AI는 33.7점으로 가장 낮은 점수를 얻었다. 그록 최신 모델인 그록4는 무료 버전이 없어 테스트 대상에 포함되지 않았다.

 

구글 AI 모드는 검색왕답게 퀴즈와 최신 사건 부문에서 가장 정확한 답을 제시했다. 전문 출처 검색에서는 빙 코파일럿, 이미지 인식에서는 퍼플렉시티가 가장 높은 점수를 받았다. GPT-4 터보는 가장 치우치지 않는 답을 제공했다.

 

GPT-5는 전반적으로 성능 개선을 보여 2위를 차지했지만 일부 영역에서는 GPT-4보다 오히려 낮은 점수를 받았다.

 

이번 테스트는 AI의 약점을 의도적으로 공략했지만 일상 질문 중 상당수에 대해 여전히 AI가 제대로 답하지 못한다는 사실이 드러났다고 WP는 분석했다.

 

AI는 정보가 최신인지 여부, 출처가 어느 정도 신뢰가 있는지를 판별하는 데 어려움을 겪고 있으며, 잘못된 답을 자신 있게 내놓기도 했다.

 

WP는 "결국 AI 답변을 그대로 믿기보다는 사서처럼 출처 확인, 최신성 검증, 비판적 사고를 거쳐야 한다는 교훈이 강조됐다"고 전했다.

 

 

[조세금융신문(tfmedia.co.kr), 무단전재 및 재배포 금지]













전문가 코너

더보기



[이명구 관세청장의 행정노트] 가상자산과 쥐(rat)
(조세금융신문=이명구 관세청장) 최근 가상자산 ‘오지급’ 사고가 발생했다. 단순한 입력 실수, 이른바 팻핑거(fat finger)에서 비롯된 사건이었다. 숫자 하나를 잘못 눌렀을 뿐인데, 그 결과는 62조 원이라는 상상하기 어려운 규모로 번졌다. 아이러니하게도 해당 거래소는 바로 이런 사고를 막기 위한 내부통제 시스템을 이달 말 도입할 예정이었다. 기술은 준비되고 있었지만, 실수는 그보다 빨랐다. ​이런 일은 결코 낯설지 않다. 몇 해 전 한 중견 수출업체가 수출 실적을 달러가 아닌 원화로 신고하는 바람에, 국가 전체의 수출액이 10억 달러나 과다 계상되는 일이 있었다. 첨단 시스템과 자동화가 일상화된 시대지만, 휴먼에러는 여전히 우리의 곁에 있다. 기술이 발전할수록 오히려 ‘사람의 실수’를 전제로 한 제도의 중요성은 더 커진다. ​가상자산은 분명 편리하다. 국경을 넘는 송금은 빠르고, 비용은 적다. 그러나 그 이면에는 그림자도 존재한다. 비대면·익명성이 강하고 사용자 확인이 어려운 특성 탓에, 돈세탁이나 사기, 불법 외환거래에 악용되는 사례가 끊이지 않는다. 새로운 기술은 언제나 새로운 기회를 주지만, 동시에 새로운 범죄의 통로가 되기도 한다. 특히 가상자
[인터뷰] 뮤지컬 '4번출구' 제작 김소정 대표...청소년 ‘삶의 선택지’ 제시
(조세금융신문=김영기 기자) “무대 위에서 가장 조용한 숨으로 깊은 소리를 만드는 오보에처럼, 이제는 소외된 아이들의 숨소리를 담아내는 무대를 만들고 싶습니다” 오보이스트에서 공연 제작자로 변신한 주식회사 스토리움의 김소정 대표가 뮤지컬 〈4번 출구〉를 통해 청소년 생명존중 메시지를 전한다. 2026년 청소년 생명존중 문화 확산 사업 작품으로 선정된 이번 뮤지컬은 김 대표가 연주자의 길을 잠시 멈추고 제작자로서 내딛는 첫 번째 공공 프로젝트다. 공연 제작자 김소정 스토리움 대표 인터뷰 내용을 통해 '4번출구'에 대해 들어봤다. ■ 완벽을 추구하던 연주자, ‘사람의 삶’에 질문을 던지다 김소정 대표는 오랫동안 클래식 무대에서 활동해온 오보이스트다. 예민한 악기인 오보에를 다루며 늘 완벽한 소리를 향해 자신을 조율해왔던 그는 어느 날 스스로에게 근본적인 질문을 던졌다. 김 대표는 “어느 순간 ‘나는 무엇을 위해 이 숨을 쏟고 있는가’라는 질문이 남았다”면서 “완벽한 소리를 위해 버텨온 시간이 누군가의 삶과 어떻게 닿아 있는지 생각하게 되면서 개인의 완성을 넘어 더 많은 사람과 만나는 무대를 꿈꾸게 됐다”고 제작사 ‘스토리움’의 설립 배경을 밝혔다. ■ 〈4(死)


인기뉴스