ChatGPT를 쓰다 보면 모델 선택 메뉴에서 GPT-5.4 Thinking, GPT-5.3 Instant 같은 이름들이 보인다. Claude와 달리 OpenAI는 모델 패밀리 구조가 꽤 복잡하고, 최근 몇 달 사이에 대규모 정리가 이루어졌다.
2026년 4월 기준 현재 사용 가능한 OpenAI 모델들을 정리하였다.

OpenAI 모델 패밀리 구조
OpenAI 모델은 크게 두 가지 계열로 나뉜다.
- GPT 계열 (GPT-5.4, GPT-5, GPT-4.1 등): 범용 모델. 대화, 글쓰기, 코딩, 멀티모달(이미지·문서 처리) 등 다양한 작업에 두루 쓸 수 있다.
- o 계열 (o3, o4-mini 등): 추론 특화 모델. 답변 전에 "생각하는 시간"을 갖고, 수학·논리·코딩 같은 복잡한 문제에서 훨씬 정확한 결과를 낸다.
비유하자면 GPT 계열은 만능 셰프, o 계열은 수학 올림피아드 출신 전략 컨설턴트 같은 느낌이다.
Claude의 Haiku-Sonnet-Opus가 성능 순서로 깔끔하게 나뉘는 것과 달리, OpenAI는 용도별로 나뉜다는 점이 가장 큰 차이다.
OpenAI 최근 동향 (2026년 4월)
모델 이야기를 넘어서, OpenAI 전체의 최근 흐름도 간단히 짚어본다.
- Pro 플랜 $100 인하 (4월 8일): Pro 플랜이 $200/월에서 $100/월로 절반 가격이 되었다. Codex 사용량도 Plus 대비 최대 10배로 강화.
- $122B 펀딩 라운드 (4월 5일): Amazon($50B), Nvidia($30B), SoftBank($30B) 등이 참여하여 기업가치 $852B으로 평가되었다. AI 역사상 최대 규모 투자.
- 엔터프라이즈 성장: 엔터프라이즈가 전체 매출의 40% 이상을 차지하며, 2026년 말까지 소비자 매출과 동등해질 전망. Codex는 주간 300만 사용자 돌파.
- ChatGPT 광고: Free/Go 사용자 대상으로 2월부터 광고가 도입되었고, 6주 만에 연환산 $100M 수준 달성. 4월부터 셀프서브 광고 플랫폼이 열리면서 $200K 최소 커밋 요건이 사라진다.
- Sora 종료 (3월 24일): AI 비디오 생성 앱 Sora가 서비스 종료되었다. 일일 추론 비용 $15M 대비 총 수익 $2.1M이라는 구조적 문제.
- Codex 종량제 (4월 2일): Business/Enterprise에서 Codex 전용 좌석을 종량제로 추가 가능. 신규 Codex 멤버당 $100 크레딧 제공(팀당 최대 $500).
- IPO 준비: 월 $2B 매출을 기록하며 IPO를 준비 중이다. 다만 Elon Musk의 $135B 소송(4월 27일 재판 예정) 등 불확실성도 존재.
현재(2026년 4월) 주요 모델 정리
[ GPT-5.3 Instant ]
모든 사용자의 기본 모델이다. 별도 선택 없이 ChatGPT를 열면 이 모델이 응답한다.
- 포지션: 빠르고 범용적인 일상 작업용
- 컨텍스트 윈도우: 128K 토큰
- 사용 조건: 모든 플랜 (Free 포함)
- 주요 특징
- 정보 검색, 번역, 기술 문서 작성 등에서 이전 세대 대비 개선
- GPT-5.2 대비 더 자연스럽고 대화적인 톤
- 불필요한 거절이나 설교조 응답 감소
- 자동으로 복잡한 질문은 GPT-5.4 Thinking으로 전환 가능 (Auto 모드)
일상적인 질문, 검색, 글쓰기, 간단한 분석 등 대부분의 작업에 충분하다.
4월 8일에는 GPT-5.3 Instant Mini도 출시되었다. Rate Limit에 도달했을 때 사용되는 폴백 모델로, 모델 선택기에는 표시되지 않지만 기존 GPT-5 Instant Mini 대비 대화 품질과 맥락 이해가 향상되었다.
[ GPT-5.4 Thinking ]
- 출시일: 2026년 3월 5일
- 컨텍스트 윈도우: ChatGPT에서 196K / API 표준 272K / API 및 Codex에서 최대 약 1,050K (1M) 지원
- 최대 출력: 128K 토큰
- 사용 조건: Plus($20/월) 이상 구독 필요 (Free, Go에서는 GPT-5.4 Mini로 폴백)
- 주요 특징
- GPT-5.3-Codex의 코딩 능력 + GPT-5.2의 추론 능력을 하나로 통합
- 네이티브 Computer Use 지원: 화면을 보고 클릭하고 소프트웨어를 자율적으로 조작
- 스프레드시트·프레젠테이션·문서 작업 성능 대폭 향상 (투자은행 모델링 벤치마크 87.3%)
- 개별 주장의 허위 오류 33% 감소, 전체 응답 오류 18% 감소
- "Upfront Planning": 사고 과정을 미리 보여주어 중간에 방향 수정 가능
- Tool Search 도입: 많은 도구 중 필요한 것을 자동으로 찾아 사용 (토큰 소모 약 47% 감소)
GPT-5.4는 단순한 "더 똑똑한 챗봇"이 아니라, 엑셀 모델링부터 데스크톱 자동화까지 실무 전체를 커버하는 에이전트형 모델로 포지셔닝되었다.
Thinking 모드 비교
| 모드 | 설명 | 사용 가능 플랜 |
| Light | 가장 빠름 | Pro 전용 |
| Standard | 속도와 지능의 균형 (기본) | Plus, Business |
| Extended | 더 깊은 추론 | Plus, Business |
| Heavy | 가장 깊은 추론 | Pro 전용 |
복잡한 전문 업무, 대규모 코드베이스 분석, 멀티스텝 에이전트 워크플로우, 문서·스프레드시트 자동화 등 실무 중심 작업에 사용하면 좋다!
[ GPT-5.4 Pro ]
- 사용 조건: Pro($200/월) 또는 Enterprise 전용
- 특징: GPT-5.4와 동일 기본 모델이지만, 더 오래 생각하여 가장 신뢰성 높은 응답 제공
- 추천 용도: 정확도가 속도보다 중요한 고난도 작업 - 복잡한 비즈니스 분석, 고급 연구, 경쟁 프로그래밍
전문가 평가에서 o3보다 모든 테스트 카테고리에서 더 높은 선호도를 기록했다고 한다.
참고로 Pro 플랜은 4월 8일부로 $200/월에서 $100/월로 인하되었다. Codex 사용량도 Plus 대비 최대 10배까지 제공된다.
[ GPT-5.4 Mini & Nano ]
- 출시일: 2026년 3월 17일
- Mini: GPT-5.4의 강점을 계승하면서 2배 이상 빠른 속도. 코딩 워크플로우와 서브에이전트에 최적화.
- Nano: 가장 저렴하고 빠른 모델. 분류, 데이터 추출, 간단한 코딩 서브태스크에 적합. API 전용.
GPT-5.4 Mini는 ChatGPT에서 Free/Go 사용자도 "Thinking" 메뉴를 통해 접근 가능하다. 다만 모델 선택기에 별도로 표시되지는 않으며, Plus 이상 사용자에게는 GPT-5.4 Thinking의 Rate Limit 도달 시 자동 폴백 모델로 사용된다.
API 전용 모델들
ChatGPT에서는 은퇴했지만 API에서 여전히 사용 가능한 모델들이다. 개발자라면 알아두면 좋다.
[ o3 ]
- 출시일: 2025년 4월 16일
- 컨텍스트 윈도우: 200K 토큰
- API 가격: 입력 $2 / 출력 $8 (per 1M tokens)
- 주요 특징:
- "생각한 뒤 답하는" Chain-of-Thought 추론 모델
- o1 대비 실제 작업에서 주요 오류 20% 감소
- GPQA Diamond(전문가 수준 과학 문제) 87.7% 달성
- SWE-bench Verified(실제 GitHub 이슈 해결) 71.7% (o1은 48.9%)
- ChatGPT에서는 2026년 2월 13일부로 은퇴, API에서만 사용 가능
수학 문제, 논리 퍼즐, 과학 분석, 복잡한 코드 리뷰, 멀티스텝 추론이 핵심인 작업에 사용하면 좋다!
[ o3-pro ]
- 출시일: 2025년 6월 10일
- 사용 조건: 입력 $20 / 출력 $80 (per 1M tokens)
- 특징: o3와 동일 모델이지만 더 오래 사고. 가장 높은 정확도와 신뢰성
- 제한사항: API 전용. 이미지 생성, Canvas 미지원. 응답 시간이 상당히 길 수 있음
"몇 분 기다려도 정확한 답이 필요할 때" 쓰는 모델이다. 과학, 교육, 프로그래밍, 비즈니스 모든 분야에서 o3보다 높은 선호도를 보였다.
[ GPT-4.1 ]
- 출시일: 2025년 출시
- API 가격: 1M 토큰
- 주요 특징:
- 롱컨텍스트 특화 모델.
- 대규모 코드베이스나 긴 법률 문서 처리에 여전히 유용
- ChatGPT에서는 은퇴했으나 API에서 여전히 인기
알아둘 점!
GPT 계열과 o 계열은 용도가 다르다. "o3가 GPT-5.4보다 좋다/나쁘다"가 아니라, 추론이 핵심이면 o3, 범용 업무면 GPT-5.4를 쓰는 것이다. 다만 ChatGPT에서는 o 계열이 모두 은퇴했기 때문에, GPT-5.4 Thinking 모드 자체가 추론 능력을 내장하고 있어서, 대부분의 일상 작업은 GPT-5.4 하나로 충분하다.
"더 많은 모델"에 있는 이전 세대 & 특수 모델들
- GPT-5.2 (2025년 12월 출시): GPT-5.4 이전의 플래그십. 2026년 6월 5일 은퇴(Legacy) 예정. 아직 유료 사용자에게 접근 가능하지만, GPT-5.4가 전반적으로 상위 호환.
- GPT-5 (2025년 8월 출시): "빌트인 Thinking" 패러다임을 처음 도입한 모델. GPT-4와 o 계열을 하나로 통합하려는 첫 시도.
- GPT-4.1 (2025년 출시): 1M 토큰 컨텍스트 윈도우를 가진 롱컨텍스트 특화 모델. 대규모 코드베이스나 긴 법률 문서 처리에 여전히 유용. API 가격 $2/$8로 경쟁력 있음.
- GPT-4o (2024년 출시): 한때의 플래그십이었지만 이제는 레거시. 새 프로젝트에서는 GPT-5 Mini나 GPT-4.1을 권장.
GPT-5.4 세대에서 달라진 것들
[ 1M 컨텍스트 윈도우 ]
GPT-5.2까지는 최대 400K이었다. GPT-5.4는 API·Codex에서 최대 약 1,050K(1M+) 토큰을 지원한다. 다만 표준 컨텍스트 윈도우는 272K이고, 1M은 API와 Codex에서만 사용 가능하다. ChatGPT에서의 컨텍스트 윈도우는 GPT-5.2 Thinking과 동일하게 유지된다.
그리고 가격 주의가 필요하다. 272K 토큰을 초과하는 입력에는 입력 가격 2배, 출력 가격 1.5배의 프리미엄이 전체 세션에 적용된다. 예를 들어 GPT-5.4에 500K 토큰을 보내면 입력 가격이 $2.50이 아닌 $5.00이 된다.
[ GPT 계열과 o 계열의 사실상 통합 ]
2025년 초까지만 해도 "범용은 GPT-4o, 추론은 o1"으로 완전히 나뉘어 있었다. GPT-5 시리즈부터는 GPT 모델 자체에 Thinking(추론) 모드가 내장되기 시작했고, GPT-5.4에서 이 통합이 본격화되었다.
ChatGPT에서 o 계열 모델이 모두 은퇴한 것이 이를 상징적으로 보여준다. 이제 대부분의 사용자에게 "추론이 필요하면 o3"라는 선택지는 사라졌고, GPT-5.4 Thinking이 그 역할을 대신한다.
GPT-5.4 Thinking 모드에서는 질문의 복잡도에 따라 추론 깊이를 자동 조절(reasoning effort: none~xhigh)한다. Claude 4.6의 적응형 사고(Adaptive Thinking)와 비슷한 개념이다.
[ 네이티브 Computer Use ]
GPT-5.4는 OpenAI 최초로 화면을 보고, 클릭하고, 소프트웨어를 조작할 수 있는 네이티브 Computer Use를 지원한다. OSWorld-Verified, WebArena Verified 등 데스크톱 자동화 벤치마크에서 신기록을 세웠다.
[ Tool Search ]
기존에는 시스템 프롬프트에 모든 도구 정의를 나열해야 했다. GPT-5.4는 필요한 도구를 자동으로 검색해서 사용하는 Tool Search를 도입해, 토큰 소모를 줄이면서도 많은 도구를 활용할 수 있게 되었다.
추가) OpenAI API 정리
API로 OpenAI 모델을 호출하는 개발자를 위한 정보도 간략하게 정리해보았다.
현재 주요 모델별 API 가격 (per 1M tokens)
| 모델 | 입력 | 출력 |
| GPT-5.4 | $2.50 | $15 |
| GPT-5.4 Pro | $30 | $180 |
| GPT-5.4 Mini | $0.75 | $4.50 |
| GPT-5.4 Nano | $0.20 | $1.25 |
| o3 | $2 | $8 |
| o3-pro | $20 | $80 |
| o4-mini | $1.10 | $4.40 |
| GPT-5 | $1.25 | $10 |
| GPT-4.1 | $2 | $8 |
| GPT-4.1 Nano | $0.10 | $0.40 |
알아두면 좋은 것들
- 롱컨텍스트 가격 주의: 272K 토큰 이하는 기본 가격이지만, 초과 시 입력 2배·출력 1.5배 프리미엄이 전체 세션에 적용된다.
- Batch API: 24시간 내 비동기 처리로 50% 할인. 대량 분류, 요약, 임베딩 등 실시간이 아닌 작업에 적합.
- Prompt Caching: 반복되는 시스템 프롬프트를 캐싱하면 캐시 읽기 비용이 기본 입력의 약 10% 수준으로 떨어진다. (GPT-5.4 캐시 입력: $0.25/1M tokens)
- Priority Processing: 표준 가격의 2배를 내면 더 낮고 일관된 지연시간을 보장받을 수 있다.
- GPT-5.2 은퇴: GPT-5.2 Thinking은 2026년 6월 5일에 완전 은퇴 예정. 아직 사용 중이라면 GPT-5.4로 마이그레이션 필요.
- Data Residency: 한국 포함 여러 국가에서 데이터 레지던시를 지원하지만, GPT-5.4 모델은 10% 추가 요금이 발생한다.
- 오픈소스 모델: gpt-oss-120b, gpt-oss-20b가 Apache 2.0 라이선스로 공개되었다. 텍스트 전용(128K 컨텍스트)이지만 자체 인프라 운영이 가능하다.
Claude와 비교하면?
같은 시기의 경쟁 모델과 간단히 비교해보면,
| 항목 | OpenAI GPT-5.4 | Anthropic Claude Opus 4.6 |
| 출시일 | 2026년 3월 5일 | 2026년 2월 5일 |
| 컨텍스트 | 196K (ChatGPT) / 1M (API) | 1M |
| 최대 출력 | 128K | 128K |
| API 가격 (입력/출력) | $2.50 / $15 | $5 / $25 |
| 추론 모드 | Thinking (내장) | 적응형 사고 (내장) |
| Computer Use | ✅ 네이티브 | ✅ |
| 무료 플랜 사용 | ❌ | ❌ (Sonnet은 가능) |
| 강점 | 에이전트 워크플로우, 도구 통합, 가격 경쟁력 | 코딩 품질, 지시 따르기, 장문 컨텍스트 |
GPT-5.4가 API 가격에서 약 40% 저렴하지만, Claude Opus 4.6이 코딩과 섬세한 지시 이행에서 강점을 보인다는 평가가 많다. 결국 어느 쪽이 나은지는 자신의 작업으로 직접 비교해보는 것이 가장 좋다.
마무리
2026년 초 대규모 모델 정리를 거치면서 OpenAI의 모델 선택은 오히려 이전보다 단순해졌다. ChatGPT에서는 GPT-5.3 Instant와 GPT-5.4 Thinking이라는 두 축으로 정리되었고, o 계열은 API 전용으로 물러났다.
핵심만 정리하면
- 일상 업무 대부분 → GPT-5.3 Instant (모든 플랜)
- 복잡한 추론·코딩·전문 작업 → GPT-5.4 Thinking (Plus 이상)
- 최고 정확도가 필요할 때 → GPT-5.4 Pro (Pro $100/월 이상)
- API에서 순수 추론 작업 → o3 또는 o3-pro
- 대량 처리·가성비 → GPT-4.1 Nano 또는 GPT-5.4 Nano (API)
- 무료로 AI 체험 → Free 플랜 (GPT-5.3 + Thinking시 GPT-5.4 Mini)
새 모델이 나올 때마다 이전 가정을 재검증하는 것이 좋다. 특히 OpenAI는 모델 업데이트 주기가 상당히 빨라서(GPT-5.2 → 5.4가 3개월), 놓치면 레거시 모델에 머물 수 있다.
참고 자료
'AI' 카테고리의 다른 글
| [Claude] Claude Code(클로드 코드) 플러그인 만드는 법 - Skill 네임스페이스 분리하기 (0) | 2026.04.16 |
|---|---|
| [AI] 2026년 AI 필수 용어 15가지 - LLM, RAG, 하네스 엔지니어링 (2) | 2026.04.04 |
| [Claude] 2026년 Claude(클로드) 모델 비교 - Opus, Sonnet, Haiku 특징 정리 (2) | 2026.03.19 |
| [Claude] Claude Code Remote Control - 폰에서 클로드 코드(Claude Code) 실행하기 (0) | 2026.02.26 |
| [Claude] Claude Code(클로드 코드) 고급 사용법 - Skills, MCP, Hooks, Subagents (0) | 2026.02.17 |