[OpenAI] 2026년 OpenAI 모델 비교 - GPT-5.4, o3 정리 (4월 업데이트)

leevigong 2026. 4. 11. 22:00

ChatGPT를 쓰다 보면 모델 선택 메뉴에서 GPT-5.4 Thinking, GPT-5.3 Instant 같은 이름들이 보인다. Claude와 달리 OpenAI는 모델 패밀리 구조가 꽤 복잡하고, 최근 몇 달 사이에 대규모 정리가 이루어졌다.

2026년 4월 기준 현재 사용 가능한 OpenAI 모델들을 정리하였다.

OpenAI 모델 패밀리 구조

OpenAI 모델은 크게 두 가지 계열로 나뉜다.

GPT 계열 (GPT-5.4, GPT-5, GPT-4.1 등): 범용 모델. 대화, 글쓰기, 코딩, 멀티모달(이미지·문서 처리) 등 다양한 작업에 두루 쓸 수 있다.
o 계열 (o3, o4-mini 등): 추론 특화 모델. 답변 전에 "생각하는 시간"을 갖고, 수학·논리·코딩 같은 복잡한 문제에서 훨씬 정확한 결과를 낸다.

비유하자면 GPT 계열은 만능 셰프, o 계열은 수학 올림피아드 출신 전략 컨설턴트 같은 느낌이다.

Claude의 Haiku-Sonnet-Opus가 성능 순서로 깔끔하게 나뉘는 것과 달리, OpenAI는 용도별로 나뉜다는 점이 가장 큰 차이다.

OpenAI 최근 동향 (2026년 4월)

모델 이야기를 넘어서, OpenAI 전체의 최근 흐름도 간단히 짚어본다.

Pro 플랜 $100 인하 (4월 8일): Pro 플랜이 $200/월에서 $100/월로 절반 가격이 되었다. Codex 사용량도 Plus 대비 최대 10배로 강화.
$122B 펀딩 라운드 (4월 5일): Amazon($50B), Nvidia($30B), SoftBank($30B) 등이 참여하여 기업가치 $852B으로 평가되었다. AI 역사상 최대 규모 투자.
엔터프라이즈 성장: 엔터프라이즈가 전체 매출의 40% 이상을 차지하며, 2026년 말까지 소비자 매출과 동등해질 전망. Codex는 주간 300만 사용자 돌파.
ChatGPT 광고: Free/Go 사용자 대상으로 2월부터 광고가 도입되었고, 6주 만에 연환산 $100M 수준 달성. 4월부터 셀프서브 광고 플랫폼이 열리면서 $200K 최소 커밋 요건이 사라진다.
Sora 종료 (3월 24일): AI 비디오 생성 앱 Sora가 서비스 종료되었다. 일일 추론 비용 $15M 대비 총 수익 $2.1M이라는 구조적 문제.
Codex 종량제 (4월 2일): Business/Enterprise에서 Codex 전용 좌석을 종량제로 추가 가능. 신규 Codex 멤버당 $100 크레딧 제공(팀당 최대 $500).
IPO 준비: 월 $2B 매출을 기록하며 IPO를 준비 중이다. 다만 Elon Musk의 $135B 소송(4월 27일 재판 예정) 등 불확실성도 존재.

현재(2026년 4월) 주요 모델 정리

[ GPT-5.3 Instant ]

모든 사용자의 기본 모델이다. 별도 선택 없이 ChatGPT를 열면 이 모델이 응답한다.

포지션: 빠르고 범용적인 일상 작업용
컨텍스트 윈도우: 128K 토큰
사용 조건: 모든 플랜 (Free 포함)
주요 특징
- 정보 검색, 번역, 기술 문서 작성 등에서 이전 세대 대비 개선
- GPT-5.2 대비 더 자연스럽고 대화적인 톤
- 불필요한 거절이나 설교조 응답 감소
- 자동으로 복잡한 질문은 GPT-5.4 Thinking으로 전환 가능 (Auto 모드)

일상적인 질문, 검색, 글쓰기, 간단한 분석 등 대부분의 작업에 충분하다.

4월 8일에는 GPT-5.3 Instant Mini도 출시되었다. Rate Limit에 도달했을 때 사용되는 폴백 모델로, 모델 선택기에는 표시되지 않지만 기존 GPT-5 Instant Mini 대비 대화 품질과 맥락 이해가 향상되었다.

[ GPT-5.4 Thinking ]

출시일: 2026년 3월 5일
컨텍스트 윈도우: ChatGPT에서 196K / API 표준 272K / API 및 Codex에서 최대 약 1,050K (1M) 지원
최대 출력: 128K 토큰
사용 조건: Plus($20/월) 이상 구독 필요 (Free, Go에서는 GPT-5.4 Mini로 폴백)
주요 특징
- GPT-5.3-Codex의 코딩 능력 + GPT-5.2의 추론 능력을 하나로 통합
- 네이티브 Computer Use 지원: 화면을 보고 클릭하고 소프트웨어를 자율적으로 조작
- 스프레드시트·프레젠테이션·문서 작업 성능 대폭 향상 (투자은행 모델링 벤치마크 87.3%)
- 개별 주장의 허위 오류 33% 감소, 전체 응답 오류 18% 감소
- "Upfront Planning": 사고 과정을 미리 보여주어 중간에 방향 수정 가능
- Tool Search 도입: 많은 도구 중 필요한 것을 자동으로 찾아 사용 (토큰 소모 약 47% 감소)

GPT-5.4는 단순한 "더 똑똑한 챗봇"이 아니라, 엑셀 모델링부터 데스크톱 자동화까지 실무 전체를 커버하는 에이전트형 모델로 포지셔닝되었다.

Thinking 모드 비교

모드	설명	사용 가능 플랜
Light	가장 빠름	Pro 전용
Standard	속도와 지능의 균형 (기본)	Plus, Business
Extended	더 깊은 추론	Plus, Business
Heavy	가장 깊은 추론	Pro 전용

복잡한 전문 업무, 대규모 코드베이스 분석, 멀티스텝 에이전트 워크플로우, 문서·스프레드시트 자동화 등 실무 중심 작업에 사용하면 좋다!

[ GPT-5.4 Pro ]

사용 조건: Pro($200/월) 또는 Enterprise 전용
특징: GPT-5.4와 동일 기본 모델이지만, 더 오래 생각하여 가장 신뢰성 높은 응답 제공
추천 용도: 정확도가 속도보다 중요한 고난도 작업 - 복잡한 비즈니스 분석, 고급 연구, 경쟁 프로그래밍

전문가 평가에서 o3보다 모든 테스트 카테고리에서 더 높은 선호도를 기록했다고 한다.

참고로 Pro 플랜은 4월 8일부로 $200/월에서 $100/월로 인하되었다. Codex 사용량도 Plus 대비 최대 10배까지 제공된다.

[ GPT-5.4 Mini & Nano ]

출시일: 2026년 3월 17일
Mini: GPT-5.4의 강점을 계승하면서 2배 이상 빠른 속도. 코딩 워크플로우와 서브에이전트에 최적화.
Nano: 가장 저렴하고 빠른 모델. 분류, 데이터 추출, 간단한 코딩 서브태스크에 적합. API 전용.

GPT-5.4 Mini는 ChatGPT에서 Free/Go 사용자도 "Thinking" 메뉴를 통해 접근 가능하다. 다만 모델 선택기에 별도로 표시되지는 않으며, Plus 이상 사용자에게는 GPT-5.4 Thinking의 Rate Limit 도달 시 자동 폴백 모델로 사용된다.

API 전용 모델들

ChatGPT에서는 은퇴했지만 API에서 여전히 사용 가능한 모델들이다. 개발자라면 알아두면 좋다.

[ o3 ]

출시일: 2025년 4월 16일
컨텍스트 윈도우: 200K 토큰
API 가격: 입력 $2 / 출력 $8 (per 1M tokens)
주요 특징:
- "생각한 뒤 답하는" Chain-of-Thought 추론 모델
- o1 대비 실제 작업에서 주요 오류 20% 감소
- GPQA Diamond(전문가 수준 과학 문제) 87.7% 달성
- SWE-bench Verified(실제 GitHub 이슈 해결) 71.7% (o1은 48.9%)
- ChatGPT에서는 2026년 2월 13일부로 은퇴, API에서만 사용 가능

수학 문제, 논리 퍼즐, 과학 분석, 복잡한 코드 리뷰, 멀티스텝 추론이 핵심인 작업에 사용하면 좋다!

[ o3-pro ]

출시일: 2025년 6월 10일
사용 조건: 입력 $20 / 출력 $80 (per 1M tokens)
특징: o3와 동일 모델이지만 더 오래 사고. 가장 높은 정확도와 신뢰성
제한사항: API 전용. 이미지 생성, Canvas 미지원. 응답 시간이 상당히 길 수 있음

"몇 분 기다려도 정확한 답이 필요할 때" 쓰는 모델이다. 과학, 교육, 프로그래밍, 비즈니스 모든 분야에서 o3보다 높은 선호도를 보였다.

[ GPT-4.1 ]

출시일: 2025년 출시
API 가격: 1M 토큰
주요 특징:
- 롱컨텍스트 특화 모델.
- 대규모 코드베이스나 긴 법률 문서 처리에 여전히 유용
- ChatGPT에서는 은퇴했으나 API에서 여전히 인기

알아둘 점!

GPT 계열과 o 계열은 용도가 다르다. "o3가 GPT-5.4보다 좋다/나쁘다"가 아니라, 추론이 핵심이면 o3, 범용 업무면 GPT-5.4를 쓰는 것이다. 다만 ChatGPT에서는 o 계열이 모두 은퇴했기 때문에, GPT-5.4 Thinking 모드 자체가 추론 능력을 내장하고 있어서, 대부분의 일상 작업은 GPT-5.4 하나로 충분하다.

"더 많은 모델"에 있는 이전 세대 & 특수 모델들

GPT-5.2 (2025년 12월 출시): GPT-5.4 이전의 플래그십. 2026년 6월 5일 은퇴(Legacy) 예정. 아직 유료 사용자에게 접근 가능하지만, GPT-5.4가 전반적으로 상위 호환.
GPT-5 (2025년 8월 출시): "빌트인 Thinking" 패러다임을 처음 도입한 모델. GPT-4와 o 계열을 하나로 통합하려는 첫 시도.
GPT-4.1 (2025년 출시): 1M 토큰 컨텍스트 윈도우를 가진 롱컨텍스트 특화 모델. 대규모 코드베이스나 긴 법률 문서 처리에 여전히 유용. API 가격 $2/$8로 경쟁력 있음.
GPT-4o (2024년 출시): 한때의 플래그십이었지만 이제는 레거시. 새 프로젝트에서는 GPT-5 Mini나 GPT-4.1을 권장.

GPT-5.4 세대에서 달라진 것들

[ 1M 컨텍스트 윈도우 ]

GPT-5.2까지는 최대 400K이었다. GPT-5.4는 API·Codex에서 최대 약 1,050K(1M+) 토큰을 지원한다. 다만 표준 컨텍스트 윈도우는 272K이고, 1M은 API와 Codex에서만 사용 가능하다. ChatGPT에서의 컨텍스트 윈도우는 GPT-5.2 Thinking과 동일하게 유지된다.

그리고 가격 주의가 필요하다. 272K 토큰을 초과하는 입력에는 입력 가격 2배, 출력 가격 1.5배의 프리미엄이 전체 세션에 적용된다. 예를 들어 GPT-5.4에 500K 토큰을 보내면 입력 가격이 $2.50이 아닌 $5.00이 된다.

[ GPT 계열과 o 계열의 사실상 통합 ]

2025년 초까지만 해도 "범용은 GPT-4o, 추론은 o1"으로 완전히 나뉘어 있었다. GPT-5 시리즈부터는 GPT 모델 자체에 Thinking(추론) 모드가 내장되기 시작했고, GPT-5.4에서 이 통합이 본격화되었다.

ChatGPT에서 o 계열 모델이 모두 은퇴한 것이 이를 상징적으로 보여준다. 이제 대부분의 사용자에게 "추론이 필요하면 o3"라는 선택지는 사라졌고, GPT-5.4 Thinking이 그 역할을 대신한다.

GPT-5.4 Thinking 모드에서는 질문의 복잡도에 따라 추론 깊이를 자동 조절(reasoning effort: none~xhigh)한다. Claude 4.6의 적응형 사고(Adaptive Thinking)와 비슷한 개념이다.

[ 네이티브 Computer Use ]

GPT-5.4는 OpenAI 최초로 화면을 보고, 클릭하고, 소프트웨어를 조작할 수 있는 네이티브 Computer Use를 지원한다. OSWorld-Verified, WebArena Verified 등 데스크톱 자동화 벤치마크에서 신기록을 세웠다.

[ Tool Search ]

기존에는 시스템 프롬프트에 모든 도구 정의를 나열해야 했다. GPT-5.4는 필요한 도구를 자동으로 검색해서 사용하는 Tool Search를 도입해, 토큰 소모를 줄이면서도 많은 도구를 활용할 수 있게 되었다.

추가) OpenAI API 정리

API로 OpenAI 모델을 호출하는 개발자를 위한 정보도 간략하게 정리해보았다.

현재 주요 모델별 API 가격 (per 1M tokens)

모델	입력	출력
GPT-5.4	$2.50	$15
GPT-5.4 Pro	$30	$180
GPT-5.4 Mini	$0.75	$4.50
GPT-5.4 Nano	$0.20	$1.25
o3	$2	$8
o3-pro	$20	$80
o4-mini	$1.10	$4.40
GPT-5	$1.25	$10
GPT-4.1	$2	$8
GPT-4.1 Nano	$0.10	$0.40

알아두면 좋은 것들

롱컨텍스트 가격 주의: 272K 토큰 이하는 기본 가격이지만, 초과 시 입력 2배·출력 1.5배 프리미엄이 전체 세션에 적용된다.
Batch API: 24시간 내 비동기 처리로 50% 할인. 대량 분류, 요약, 임베딩 등 실시간이 아닌 작업에 적합.
Prompt Caching: 반복되는 시스템 프롬프트를 캐싱하면 캐시 읽기 비용이 기본 입력의 약 10% 수준으로 떨어진다. (GPT-5.4 캐시 입력: $0.25/1M tokens)
Priority Processing: 표준 가격의 2배를 내면 더 낮고 일관된 지연시간을 보장받을 수 있다.
GPT-5.2 은퇴: GPT-5.2 Thinking은 2026년 6월 5일에 완전 은퇴 예정. 아직 사용 중이라면 GPT-5.4로 마이그레이션 필요.
Data Residency: 한국 포함 여러 국가에서 데이터 레지던시를 지원하지만, GPT-5.4 모델은 10% 추가 요금이 발생한다.
오픈소스 모델: gpt-oss-120b, gpt-oss-20b가 Apache 2.0 라이선스로 공개되었다. 텍스트 전용(128K 컨텍스트)이지만 자체 인프라 운영이 가능하다.

Claude와 비교하면?

같은 시기의 경쟁 모델과 간단히 비교해보면,

항목	OpenAI GPT-5.4	Anthropic Claude Opus 4.6
출시일	2026년 3월 5일	2026년 2월 5일
컨텍스트	196K (ChatGPT) / 1M (API)	1M
최대 출력	128K	128K
API 가격 (입력/출력)	$2.50 / $15	$5 / $25
추론 모드	Thinking (내장)	적응형 사고 (내장)
Computer Use	✅ 네이티브	✅
무료 플랜 사용	❌	❌ (Sonnet은 가능)
강점	에이전트 워크플로우, 도구 통합, 가격 경쟁력	코딩 품질, 지시 따르기, 장문 컨텍스트

GPT-5.4가 API 가격에서 약 40% 저렴하지만, Claude Opus 4.6이 코딩과 섬세한 지시 이행에서 강점을 보인다는 평가가 많다. 결국 어느 쪽이 나은지는 자신의 작업으로 직접 비교해보는 것이 가장 좋다.

마무리

2026년 초 대규모 모델 정리를 거치면서 OpenAI의 모델 선택은 오히려 이전보다 단순해졌다. ChatGPT에서는 GPT-5.3 Instant와 GPT-5.4 Thinking이라는 두 축으로 정리되었고, o 계열은 API 전용으로 물러났다.

핵심만 정리하면

일상 업무 대부분 → GPT-5.3 Instant (모든 플랜)
복잡한 추론·코딩·전문 작업 → GPT-5.4 Thinking (Plus 이상)
최고 정확도가 필요할 때 → GPT-5.4 Pro (Pro $100/월 이상)
API에서 순수 추론 작업 → o3 또는 o3-pro
대량 처리·가성비 → GPT-4.1 Nano 또는 GPT-5.4 Nano (API)
무료로 AI 체험 → Free 플랜 (GPT-5.3 + Thinking시 GPT-5.4 Mini)

새 모델이 나올 때마다 이전 가정을 재검증하는 것이 좋다. 특히 OpenAI는 모델 업데이트 주기가 상당히 빨라서(GPT-5.2 → 5.4가 3개월), 놓치면 레거시 모델에 머물 수 있다.

참고 자료

'AI' 카테고리의 다른 글

[Claude] Claude Code(클로드 코드) 플러그인 만드는 법 - Skill 네임스페이스 분리하기 (0)	2026.04.16
[AI] 2026년 AI 필수 용어 15가지 - LLM, RAG, 하네스 엔지니어링 (2)	2026.04.04
[Claude] 2026년 Claude(클로드) 모델 비교 - Opus, Sonnet, Haiku 특징 정리 (2)	2026.03.19
[Claude] Claude Code Remote Control - 폰에서 클로드 코드(Claude Code) 실행하기 (0)	2026.02.26
[Claude] Claude Code(클로드 코드) 고급 사용법 - Skills, MCP, Hooks, Subagents (0)	2026.02.17

현재글[OpenAI] 2026년 OpenAI 모델 비교 - GPT-5.4, o3 정리 (4월 업데이트)

Leevigong World