
2025년 11월 18일, 구글이 AI 시장에 새로운 폭탄을 투하했다. 제미나이 2.5 출시 7개월 만에 공개된 제미나이 3는 구글의 가장 강력한 대형 언어 모델(LLM)로, 시장에서 가장 유능한 AI 도구 중 하나로 즉각 자리매김했습니다. 오픈AI의 GPT-5.1 출시 일주일 후, 그리고 앤스로픽의 Sonnet 4.5 출시 두 달 만에 나온 이번 발표는 AI 경쟁의 치열함을 다시 한번 증명합니다.
제미나이, 어디까지 왔나
제미나이를 처음 접하는 분들을 위해 간단히 정리하자면, 제미나이는 구글이 개발한 멀티모달 AI 모델입니다. 텍스트는 물론 이미지, 동영상, 음성, 코드까지 다양한 형태의 데이터를 이해하고 처리할 수 있는 것이 특징입니다. 2023년 제미나이 1.0으로 시작해 긴 맥락(long context) 처리 능력을 선보였고, 1년 후 제미나이 2.0에서는 고급 추론과 초기 에이전트 기능을, 제미나이 2.5에서는 심층 추론과 코딩 능력을 대폭 강화했습니다.
그리고 이제, 제미나이 3가 등장했습니다.
숫자가 말해주는 압도적 성능
제미나이 3 프로는 LMArena 리더보드에서 1,501 Elo라는 획기적인 점수로 1위를 차지했습니다. 이전 제미나이 2.5 프로가 1,451점이었던 것을 고려하면 상당한 도약입니다. 하지만 진짜 놀라운 것은 세부 벤치마크 성능입니다.
Humanity’s Last Exam에서 37.5%(도구 미사용), GPQA Diamond에서 91.9%를 기록하며 박사급 추론 능력을 입증했습니다. 수학 분야에서는 MathArena Apex에서 23.4%라는 최첨단 기록을 세웠고, 멀티모달 추론에서는 MMMU-Pro에서 81%, Video-MMMU에서 87.6%의 획기적인 점수를 달성했습니다.
특히 주목할 점은 Humanity’s Last Exam에서 37.4%를 기록하며 역대 최고 점수를 경신했다는 것입니다. 이전 최고 기록은 GPT-5 Pro의 31.64%였습니다. 이는 단순히 벤치마크 수치를 넘어, 제미나이 3가 이전 세대 AI들이 풀지 못했던 복잡한 문제들을 해결할 수 있다는 의미입니다.

게임 체인저 1: 생성형 인터페이스 (Generative UI)
제미나이 3의 가장 혁신적인 기능은 바로 생성형 인터페이스입니다. 이게 무엇이길래 중요할까요?
이전 모델인 제미나이 2.5는 멀티모달 입력을 지원했습니다. 사용자는 이미지, 손글씨, 음성을 입력할 수 있었죠. 하지만 원하는 출력 형식에 대해 명시적인 지시를 해야 했고, 기본적으로는 일반 텍스트로 답변이 돌아왔습니다.
제미나이 3는 “생성형 인터페이스”를 도입했는데, 이는 모델이 어떤 종류의 출력이 프롬프트에 가장 적합한지 스스로 선택할 수 있게 합니다. 텍스트 블록을 반환하는 대신 시각적 레이아웃과 동적 뷰를 자체적으로 조립합니다.
실제 사용 예를 들어볼까요? 여행 추천을 요청하면 앱 내부에 웹사이트와 같은 인터페이스를 생성할 수 있습니다. 모듈, 이미지, “며칠 동안 여행하시나요?”와 같은 후속 프롬프트가 포함된 완전한 형태로 말입니다.
비주얼 레이아웃(Visual Layout) 실험에서는 사진과 모듈이 포함된 잡지 스타일의 몰입형 뷰를 만들어냅니다. 제미나이는 슬라이더, 체크박스, 기타 UI 요소를 표시하여 결과를 추가로 커스터마이징할 수 있게 합니다. 예를 들어 여행 계획을 세울 때 여행 속도를 설정하는 슬라이더와 활동 유형을 선택하는 필터가 나타날 수 있습니다.
이는 단순히 예쁜 UI를 만드는 것이 아닙니다. “바이브 코딩(vibe coding)”이라 불리는 이 방식은 사용자가 최종 목표를 일반 언어로 설명하면 모델이 필요한 인터페이스나 코드를 조립하는 것입니다.
게임 체인저 2: 제미나이 에이전트
제미나이 3와 함께 구글은 제미나이 에이전트(Gemini Agent)라는 실험적 기능을 도입했습니다. 이는 앱 내부에서 직접 다단계 작업을 처리하도록 설계되었으며, 구글 캘린더, 지메일, 리마인더와 같은 서비스에 연결할 수 있습니다.
액세스 권한이 부여되면 받은편지함 정리나 일정 관리와 같은 작업을 실행할 수 있습니다. 다른 에이전트들과 유사하게 작업을 개별 단계로 나누고, 진행 상황을 실시간으로 표시하며, 계속하기 전에 사용자의 승인을 기다립니다.
구체적인 예시를 보겠습니다. “다음 주 여행을 위해 일일 80달러 미만으로 중형 SUV를 조사하고 예약하는 데 도움을 주세요. 이메일의 세부 정보를 사용하세요”라고 요청하면, 제미나이는 항공편 정보를 찾고, 예산 내에서 렌터카를 비교하고, 예약을 준비합니다.
“받은편지함 정리”라는 프롬프트를 입력하고 도구 메뉴에서 “에이전트”를 선택하면, 제미나이 에이전트는 관련 이메일을 그룹화하고 체크마크를 탭하여 이메일을 빠르게 보관하고 읽음으로 표시할 수 있는 테이블을 만듭니다. 새로운 구글 작업 리마인더도 생성할 수 있습니다.
중요한 것은 사용자가 통제권을 유지한다는 점입니다. 제미나이는 구매나 메시지 전송과 같은 중요한 작업 전에 확인을 요청하도록 설계되었으며, 언제든지 사용자가 개입할 수 있습니다.

게임 체인저 3: 제미나이 3 딥 씽크 모드
일반 사용자를 위한 제미나이 3 프로도 강력하지만, 구글은 한 단계 더 나아갔습니다. 제미나이 3 딥 씽크(Deep Think)라는 연구 집약적 버전이 추가 안전성 테스트를 통과한 후 몇 주 내에 구글 AI 울트라 구독자에게 제공될 예정입니다.
딥 씽크 모드의 성능은 놀랍습니다. 테스트에서 제미나이 3 딥 씽크는 제미나이 3 프로의 이미 인상적인 성능을 뛰어넘어 Humanity’s Last Exam에서 41.0%(도구 미사용), GPQA Diamond에서 93.8%를 기록했습니다. 또한 ARC-AGI-2에서 45.1%(코드 실행 포함, ARC Prize Verified)라는 전례 없는 점수를 달성하며 새로운 도전 과제를 해결하는 능력을 입증했습니다.
이는 오픈AI의 o1과 같은 “추론 모델”에 대한 구글의 답변입니다. 이 모델은 박사급 복잡성을 위해 설계되었습니다. 응답하기 전에 “생각”하는 데 시간을 들여 더 깊이 있는 분석과 추론을 제공합니다.

개발자를 위한 선물: 구글 안티그래비티
베이스 모델과 함께 구글은 구글 안티그래비티(Google Antigravity)라는 제미나이 기반 코딩 인터페이스도 출시했습니다. 이는 Warp나 Cursor 2.0과 같은 에이전트 IDE와 유사한 멀티 패널 에이전트 코딩을 가능하게 합니다.
구체적으로 안티그래비티는 ChatGPT 스타일의 프롬프트 창과 명령줄 인터페이스, 그리고 코딩 에이전트가 만든 변경 사항의 영향을 보여줄 수 있는 브라우저 창을 결합합니다.
제미나이 3는 지금까지 개발된 모델 중 최고의 “바이브 코딩” 및 “에이전트 코딩” 성능을 자랑합니다. WebDev Arena 리더보드에서 1,487 Elo를 기록했고, 터미널을 통해 컴퓨터를 조작하는 도구 사용 능력을 테스트하는 Terminal-Bench 2.0에서는 54.2%를 기록했습니다. 코딩 에이전트 성능 벤치마크인 SWE-bench Verified에서는 76.2%로 제미나이 2.5 프로를 크게 앞섰습니다.
구글 검색에도 첫날부터 적용
이번이 처음입니다. 새 모델이 제미나이 앱과 함께 구글 검색과 AI 모드에도 첫날부터 적용됩니다. 이번 주부터 AI 프로 및 AI 울트라 구독자는 왼쪽 상단 모서리의 드롭다운 메뉴로 가서 “Thinking: 3 Pro reasoning and generative layouts”를 선택할 수 있습니다.
제미나이 3를 사용하면 구글의 쿼리 팬아웃(query fan-out) 기술이 이전보다 더 많은 검색을 수행하여 더 미묘한 질문을 하고 최종 응답을 개선할 수 있습니다. AI 모드는 또한 생성형 UI를 만들어 대화형 도구와 시뮬레이션을 생성합니다. 예를 들어 구글은 이자율과 계약금을 변경할 수 있는 모기지 계산기를 만들 수 있습니다. 주제를 학습할 때 물리학 시뮬레이션을 받는 것도 가능합니다.

실생활 활용 시나리오
제미나이 3의 1백만 토큰 컨텍스트 윈도우와 멀티모달 이해 능력은 실제로 어떻게 활용될까요?
손글씨 레시피 번역 및 디지털 요리책 제작: Gemini 3는 다양한 언어로 작성된 손글씨 레시피를 해독하고 디지털 요리책으로 번역할 수 있습니다.
스포츠 코칭: 피클볼 경기 영상을 업로드하면 자세를 분석하고 스윙을 교정하기 위한 훈련 계획을 생성해줍니다.
긴 강의나 논문 분석: 100만 토큰 컨텍스트 윈도우 덕분에 긴 학술 논문이나 여러 시간 분량의 강의를 요약하고, 인터랙티브 플래시카드나 시각화 코드를 생성할 수 있습니다.
더 솔직해진 AI
흥미로운 변화가 하나 더 있습니다. 구글에 따르면 Gemini 3로 구동되는 AI 응답은 “진정한 통찰력을 위해 진부함과 아첨을 버리고 – 당신이 듣고 싶은 것이 아니라 당신이 들어야 할 것을 말한다”고 합니다.
업계 비평가들은 오늘날의 AI 챗봇이 지나치게 아첨한다고 지적해왔습니다. Gemini 3는 이러한 비판에 대응하여 더 직접적이고 솔직한 답변을 제공하도록 설계되었습니다.
안전성과 보안
구글은 Gemini 3가 “지금까지 구글 AI 모델 중 가장 포괄적인 안전성 평가”를 받았다고 밝혔으며, 이 모델이 “아첨 감소, 프롬프트 주입에 대한 저항력 향상, 사이버 공격을 통한 악용으로부터의 보호 개선”을 보여준다고 덧붙였습니다.
지난 한 해 동안 AI 보안 전문가들은 공격자가 악성 지시사항을 입력에 삽입하여 모델을 조작하는 프롬프트 주입에 대한 Gemini의 취약성 사례들을 많이 공유했습니다. 구글은 이러한 문제들을 개선하기 위해 노력했습니다.
시장 영향과 의미
구글 AI 개요(AI Overviews)는 현재 월간 20억 명의 사용자를 보유하고 있으며, Gemini 앱은 6억 5천만 명 이상의 월간 활성 사용자를 보유하고 있습니다. 1,300만 명 이상의 개발자가 Gemini로 구축하고 있습니다. 오픈AI는 8월에 ChatGPT가 7억 명의 주간 사용자를 달성했다고 발표했습니다.
Gemini 3의 출시는 AI 경쟁이 얼마나 치열해졌는지를 보여줍니다. 오픈AI가 8월에 대규모로 홍보된 GPT-5 모델을 출시했지만, 많은 관찰자들은 그 릴리스가 기대에 미치지 못하고 실망스러웠다고 말했습니다. 지난주 회사는 “더 똑똑하고” “더 대화적”이며 선택할 수 있는 8가지 다른 “성격”을 가진 5.1 업데이트를 출시했지만, 그것은 여전히 구글이 Gemini로 파도를 일으킬 수 있는 문을 활짝 열어두었습니다.

접근성과 가격
Gemini 3 프로는 오늘부터 모든 사용자에게 제공되며, 모델 선택기에서 “Thinking”을 선택하면 됩니다. 구글 AI 플러스, 프로, 울트라 구독자는 더 높은 한도를 받게 됩니다.
Gemini 에이전트는 오늘부터 미국의 구글 AI 울트라 구독자(월 249.99달러)에게 제공됩니다. 딥 씽크 모드는 몇 주 내에 울트라 구독자에게 제공될 예정입니다.
개발자의 경우 Gemini 3는 구글 AI 스튜디오, Vertex AI, Gemini CLI에서 사용 가능하며, Cursor, GitHub, JetBrains, Manus, Replit과 같은 서드파티 플랫폼에서도 활용할 수 있습니다.
결론: AI의 새로운 시대
Gemini 3는 단순한 모델 업그레이드가 아닙니다. 이는 AI가 정보를 제공하는 도구에서 능동적으로 작업을 수행하고, 사용자의 의도를 이해하며, 상황에 맞는 인터페이스를 생성하는 진정한 파트너로 진화하고 있음을 보여줍니다.
구글 및 알파벳 CEO 순다르 피차이는 “2년 만에 AI가 단순히 텍스트와 이미지를 읽는 것에서 상황을 파악하는 수준으로 진화했다는 것이 놀랍습니다”라고 말했습니다.
하지만 피차이 자신도 주의를 당부합니다. BBC와의 새로운 인터뷰에서 그는 사람들이 AI 도구가 말하는 모든 것을 “맹목적으로 신뢰”해서는 안 되며, AI는 “오류가 발생하기 쉽다”고 말하며 사람들이 다른 도구와 함께 사용할 것을 촉구했습니다. 피차이는 또한 AI 버블이 터진다면 어떤 회사도 면역이 되지 않을 것이라고 경고했습니다. 아마도 구글조차도 말입니다.
Gemini 3는 인상적이지만, 그것은 여전히 도구입니다. 강력하고, 똑똑하고, 점점 더 자율적이 되어가지만, 여전히 인간의 판단과 검증이 필요한 도구입니다. AI가 우리의 일상과 업무에 깊숙이 통합되는 지금, 이러한 균형 잡힌 시각을 유지하는 것이 그 어느 때보다 중요합니다.
참고 자료
공식 구글 발표
- See new Gemini app updates with the Gemini 3 AI model – Google Blog
- Gemini 3: Introducing the latest Gemini AI model from Google
- 제미나이 3: 새로운 AI 시대의 개막 – Google Korea Blog
주요 언론 보도
- Google launches Gemini 3 with new coding app and record benchmark scores – TechCrunch
- Google’s new Gemini 3 vibe-codes its responses and comes with its own agent – MIT Technology Review
- Google releases its heavily hyped Gemini 3 AI in a sweeping rollout – Fortune
- Google announces Gemini 3 as battle with OpenAI intensifies – CNBC
기술 분석 및 리뷰
- Google launches Gemini 3 with SOTA reasoning, generative UI responses – 9to5Google
- Gemini app rolling out Gemini 3 Pro as ‘Gemini Agent’ comes to AI Ultra – 9to5Google
- Gemini 3 just gave Google’s AI a brain boost – TechRadar
- Google Gemini 3 Released: Features & Benchmarks 2025 – Max Productive AI
- Google announces Gemini 3 surpassing OpenAI’s GPT-5.1 – Neowin
- Google officially launches Gemini 3: Vibe Coding, Deep Think – Chrome Unboxed
벤치마크 및 성능 분석
한국어 기술 자료
Google, AI 벤치마크에서 고급 추론과 글로벌 리더십을 갖춘 Gemini 3 모델 출시 – Mixvale
