Gemini 3 Flash Lite 출시 임박 & 2.0 모델 6월 종료 확정

Cloudturing Team 발행: 2026. 02. 24 10:27 수정: 2026. 03. 19 13:58

방금 전 구글 클라우드(Google Cloud)로부터 Vertex AI 서비스 관련하여 매우 흥미로운 이메일을 한 통 받았습니다.

이메일의 표면적인 목적은 Gemini 2.0 모델의 서비스 종료(Retirement) 일정 변경 안내였습니다. 아시다시피 원래 2.0 모델의 종료일은 3월 3일이었고, 이후 수차례 연기되며 개발자들에게 혼선을 주었었죠. 이번 공지를 통해 그 일정이 6월 1일로 사실상 최종 확정된 것으로 보입니다.

하지만 이메일 본문을 자세히 뜯어보니 더 엄청난 소식이 숨어 있었습니다. 그동안 "나온다, 안 나온다" 루머만 무성했던 'Gemini 3 Flash Lite'의 공식 출시가 이메일을 통해 기정사실화되었다는 점입니다.

오늘 구글이 보내온 공식 이메일 내용을 바탕으로, 곧 다가올 Gemini 3 시대에 대한 단서와 기존 2.0 사용자들이 대비해야 할 타임라인을 상세히 분석해 보겠습니다.


🚀 핵심 소식: Gemini 3 Flash Lite, "곧 나옵니다 (Releasing soon)"

그동안 Gemini 3 시리즈가 언급될 때마다 가볍고 빠른 'Lite' 모델이 이번 세대에도 포함될지에 대해 의견이 분분했습니다. 그런데 이번 구글의 마이그레이션 권장 안내 표에서 이 논란이 깔끔하게 종결되었습니다.

구글이 공식적으로 제시한 모델 마이그레이션 경로는 다음과 같습니다.

기존 종료 모델 (Retired Model) 권장 후속 모델 (Successor Model) 비고
gemini-2.0-flash-001 Gemini 3 Flash 또는 Flash Lite (releasing soon) -
gemini-2.0-flash-lite-001 Gemini 3 Flash Lite (releasing soon) Lite의 명맥 유지 확인
gemini-2.0-flash-live-001 gemini-live-2.5-flash-native-audio 2.5 기반 네이티브 오디오 모델로 전환

구글이 고객 안내 메일에 "releasing soon(곧 출시)" 이라는 표현을 직접 명시했습니다. 심지어 메일 하단에는 "Gemini 3 Flash Lite의 EAP(얼리 액세스 프로그램)를 신청하라" 며 폼 링크까지 포함되어 있었습니다.

이는 구글 내부적으로 이미 개발과 초기 테스트가 끝났으며, 곧 퍼블릭 프리뷰 혹은 정식(GA) 출시가 이루어질 것임을 의미합니다. 가성비와 빠른 응답 속도가 생명인 서비스(모바일, 엣지 디바이스, 대량 텍스트 처리 등)를 운영하는 기업들에게는 가뭄에 단비 같은 소식입니다.


📅 수차례 연기된 Gemini 2.0 종료, 6월 1일 '최종 확정'

새로운 모델이 온다는 건, 기존 모델을 보내주어야 한다는 뜻이기도 하죠. 당초 3월 3일로 예정되어 여러 번 미뤄졌던 Gemini 2.0 (Flash / Flash Lite) 모델의 일몰(Sunset) 일정이 2026년 6월 1일 로 못 박혔습니다.

Vertex AI 기반으로 서비스를 운영 중이시라면 아래의 타임라인을 반드시 캘린더에 기록해 두셔야 합니다.

날짜 주요 변경 사항 (Customer Impacting Change) 필요한 조치 (Action)
2026년 3월 6일 - 최근 30일간 사용량 없는 프로젝트 접근 차단
- 2.0 모델 파인튜닝(Fine-tuning) 지원 종료
지원되는 Gemini 3 모델로 마이그레이션 준비
2026년 5월 18일 - 모델 액세스 연장 요청(Exception Request) 마감 필수 비즈니스 사유가 있을 경우 폼을 통해 신청
2026년 6월 1일 - Gemini 2.0 모델 공식 서비스 종료 (Retire)
- 승인 고객 대상 단기 ELA 요금제 적용 시작
이 날짜 전까지 마이그레이션 완료 권장
2026년 8월 1일 - 종량제(PAYG) 방식의 단기 ELA 요금 종료
- 장기 ELA 요금제 적용 시작
장기 사용 시 구글 계정 팀과 별도 계약 필요

💸 종료된 모델 계속 쓰면 요금 '3배' 폭탄 (ELA 요금제)

구글은 고객들이 최신 모델(Gemini 3)로 빠르게 넘어가기를 강력하게 유도하고 있습니다. 만약 어쩔 수 없는 사정으로 6월 1일 이후에도 2.0 모델을 써야 한다면, ELA(Extended Lifecycle Access, 연장 수명 주기 액세스) 프로그램에 따라 기존보다 정확히 3배 비싼 요금을 지불해야 합니다.

[Gemini 2.0 ELA 적용 전후 요금 비교] (단위: 100만 토큰 당 USD)

모델명 구분 기존 요금 (Current) 종료 후 요금 (ELA PAYG) 인상률
Gemini 2.0 Flash 입력 (Input) $0.15 $0.45 300%
출력 (Output) $0.60 $1.80 300%
Gemini 2.0 Flash Lite 입력 (Input) $0.075 $0.225 300%
출력 (Output) $0.30 $0.90 300%

※ 참고: Provisioned Throughput(PT, 보장된 처리량)을 사용하는 경우 한 달 약정에 $8,100가 청구됩니다.

결국 ELA는 "마이그레이션 시간을 잠시 벌어주는 페널티 요금"에 가깝습니다. 비즈니스 비용 최적화를 위해서는 무조건 6월 1일 이전에 Gemini 3로 넘어가는 것이 이득입니다.


💡 개발자 및 기업을 위한 Action Plan

이번 공지를 통해 우리가 당장 취해야 할 액션은 명확해졌습니다.

  1. 영향받는 프로젝트 점검: 메일 하단에 안내된 프로젝트의 코드베이스를 열어 Gemini 2.0 API 호출 부분을 확인하세요.
  2. Gemini 3 Flash Lite 얼리 액세스(EAP) 신청: 구글이 메일에서 제공한 폼을 통해 EAP를 신청하고, 새로운 Lite 모델의 성능과 프롬프트 반응성을 미리 테스트해 보세요.
  3. 평가 도구 활용 (Vertex GenAI Evaluation Service): 구글이 업데이트한 평가 도구를 활용하여 2.0에서 3 계열로 전환할 때 출력 품질에 저하가 없는지 자동화된 평가를 세팅해 두는 것을 권장합니다.
  4. 마이그레이션 완료 목표: 늦어도 2026년 5월 말까지는 모든 프로덕션 환경의 엔드포인트를 Gemini 3로 교체해야 합니다.

✍️ 마치며

이번 구글 클라우드의 이메일은 수차례 미뤄지며 피로감을 주었던 2.0 종료 이슈에 마침표를 찍음과 동시에, 오매불망 기다리던 Gemini 3 Flash Lite의 등장을 공식화한 예고편 이었습니다.

곧 공개될 Gemini 3 Flash Lite가 치열한 소형 모델 경쟁에서 어떤 압도적인 퍼포먼스를 보여줄지 벌써부터 기대가 됩니다. 새로운 모델이 정식으로 공개되면, 발 빠르게 벤치마크 테스트를 진행하고 리뷰로 돌아오겠습니다!




코딩 없이, 문서(PDF, TXT)만 올리면 AI 챗봇 완성!

이제 챗봇은 개발이 아닌 '생성'의 시대입니다.

클라우드튜링의 생성형 AI로 당신의 비즈니스에 날개를 달아드립니다.

클라우드튜링 챗봇 사례가 궁금하면 여기를!

👇클라우드튜링의 생성형AI 기반 챗봇 솔루션으로 챗봇을 만들어보고 싶다면? 아래를👇
클라우드튜링 사이트 안내면