News

AI 챗GPT o1-프리뷰, 수능 국어 1등급 성적 기록

이재협/실장/시스템개발실/PHYSIA

2024년 11월 19일 — 3 min read

오픈AI의 최신 모델인 챗GPT o1-프리뷰가 2025학년도 대학수학능력시험에서 국어 영역 1등급을 받을 수 있는 성능을 보여주었다. 19일 공개된 '수능 국어 LLM 리더보드'에 따르면 o1-프리뷰는 원점수 97점을 기록하며, 단 한 문제만 틀린 것으로 나타났다. 이 모델은 선택 과목으로 '화법과 작문'을 채택했으며, 해당 과목의 추정 등급 컷은 93~95점으로 알려졌다.

이전 AI 모델들은 수능 국어 시험에서 3~9등급 사이의 저조한 성적을 보였으나, o1-프리뷰는 비약적으로 발전한 추론 능력 덕분에 고득점을 기록하게 되었다. 과거 모델인 GPT-4o는 2023~2024학년도 수능에서 4등급을 기록하는 데 그쳤다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행되었으며, 10년간의 수능 국어 시험 데이터를 기반으로 LLM의 성능을 평가하는 것이 목표였다.

마커AI의 개발자는 블로그를 통해 o1-프리뷰가 97점을 기록한 것은 인간을 초월할 수 있는 언어 능력이 머지않았음을 시사한다고 언급했다. 테스트에서는 두 모델인 o1-프리뷰와 GPT-4o의 성능을 비교하기 위해 일부 수능 국어 문제를 제시했다. 비문학 지문에 대한 분석이 필요한 문제에서 o1-프리뷰는 적절한 키워드를 추출하여 정답을 도출했고, GPT-4o는 이 과정에서 어려움을 겪었다.

또한, 문학 문제에서도 o1-프리뷰만이 정답을 선정할 수 있었다. 이는 주어진 지문들을 비교·분석해야하는 방식으로, 두 모델이 비슷한 유형의 문제에서 결과 차이를 보인 사례였다. 국어 교사 출신인 교육 평가는 문제의 난이도를 설명하며, 복잡한 정보를 이해하는 데 어려움이 있을 수 있다고 말했다.

모의고사 출제 경험이 풍부한 연구원 역시 문제의 정보량이 많아 시간이 많이 소요될 수 있음을 지적했다. o1-프리뷰는 문제 해결에 시간이 더 걸렸으며, 6개의 문제를 풀기 위해 평균 1분 10초가 소요되었다. 오픈AI는 모델의 훈련 과정에서 문제 해결 전에 충분한 사고 시간을 주도록 조정했다고 설명했다.

한 AI 개발자는 o1-프리뷰 모델의 성능 향상이 인상적이라며, 성능이 개선된 것을 수치로 확인하게 되어 흥미롭다고 전했다. 그러나 그는 o1 모델의 느린 추론 속도와 높은 비용으로 인해 대규모 작업에는 적합하지 않을 것이라고 덧붙였다.

│

← 이전 글: 스페이스X, 6번째 스타십 시험 발사 준비 완료… 재활용 목표와 함께 방열판 실험도 진행

삼성전자, 중저가 스마트폰 시장서 경쟁력 강화하며 신모델 출시 예정

삼성전자가 중저가형 스마트폰 시장에서의 경쟁력을 강화하고 있다. 갤럭시 A 시리즈는 글로벌 판매량 상위권에 이름을 올리고 있어, 새로운 중저가 모델들이 삼성의 스마트폰 판매 성과 개선에 기여할 것으로 기대된다. 최근 삼성전자는 갤럭시 S24 펜에디션(SE)을 출시한 데 이어 갤럭시 A56, A36, 갤럭시 Z 플립 FE 모델도 예정하고 있다. 특히 갤럭시 A56은

드래곤빌리지 어드벤처, 출시 10일 만에 양대 마켓 1위 등극!

하이브로(대표 원세연)가 출시한 모바일 게임 '드래곤빌리지 어드벤처'가 출시 열흘 만에 구글 플레이스토어와 애플 앱스토어에서 인기 순위 1위를 기록했다. 이 게임은 간단한 조작과 가벼운 플레이 방식으로 설계되어 다양한 연령층이 쉽게 즐길 수 있도록 되어 있다. 드래곤빌리지 어드벤처의 인기 상승은 다양한 유저들로부터 큰 사랑을 받았음을 나타내며, 결과적으로

신작 MOBA 배틀로얄 '슈퍼바이브', 21일 오픈베타 시작!

신작 PC 게임 '슈퍼바이브'가 21일 국내에서 오픈베타테스트(OBT)를 시작한다. 이 게임은 MOBA 배틀로얄 장르로, 빠른 속도의 전투와 높은 자유도를 통해 다양한 플레이 경험을 제공한다. 글로벌 게임 개발자들이 모인 띠어리그래프트가 개발한 이 게임은 16종의 '헌터' 캐릭터를 기반으로 예측 불가능한 전투를 즐길 수 있다. 오픈 베타

홍범식 사장, LG유플러스의 '유플러스 3.0' 전략 이끈다

LG유플러스가 홍범식 사장을 신임 대표이사로 선임했다. 홍 사장은 LG유플러스의 향후 비통신 신사업 매출 비중을 40%로 확대하고, 기업 가치를 12조원으로 증대시키기 위한 '유플러스 3.0' 전략을 이끌 예정이다. 이번 인사는 21일 이사회를 통해 결정되었으며, 홍 사장은 SK텔레콤에서 신사업 개발을 주도했던 경험이 있다. 홍 사장은 2018년 구광모 회장이 단행한

Read more

삼성전자, 중저가 스마트폰 시장서 경쟁력 강화하며 신모델 출시 예정

드래곤빌리지 어드벤처, 출시 10일 만에 양대 마켓 1위 등극!

신작 MOBA 배틀로얄 '슈퍼바이브', 21일 오픈베타 시작!

홍범식 사장, LG유플러스의 '유플러스 3.0' 전략 이끈다