Gemini 3 Flash Lite 출시 임박 & 2.0 모델 6월 종료 확정

Cloudturing Team 발행: 2026. 02. 24 10:27 수정: 2026. 02. 25 11:00

방금 전 구글 클라우드(Google Cloud)로부터 Vertex AI 서비스 관련하여 매우 흥미로운 이메일을 한 통 받았습니다.

이메일의 표면적인 목적은 Gemini 2.0 모델의 서비스 종료(Retirement) 일정 변경 안내였습니다. 아시다시피 원래 2.0 모델의 종료일은 3월 3일이었고, 이후 수차례 연기되며 개발자들에게 혼선을 주었었죠. 이번 공지를 통해 그 일정이 6월 1일로 사실상 최종 확정된 것으로 보입니다.

하지만 이메일 본문을 자세히 뜯어보니 더 엄청난 소식이 숨어 있었습니다. 그동안 "나온다, 안 나온다" 루머만 무성했던 'Gemini 3 Flash Lite'의 공식 출시가 이메일을 통해 기정사실화되었다는 점입니다.

오늘 구글이 보내온 공식 이메일 내용을 바탕으로, 곧 다가올 Gemini 3 시대에 대한 단서와 기존 2.0 사용자들이 대비해야 할 타임라인을 상세히 분석해 보겠습니다.


🚀 핵심 소식: Gemini 3 Flash Lite, "곧 나옵니다 (Releasing soon)"

그동안 Gemini 3 시리즈가 언급될 때마다 가볍고 빠른 'Lite' 모델이 이번 세대에도 포함될지에 대해 의견이 분분했습니다. 그런데 이번 구글의 마이그레이션 권장 안내 표에서 이 논란이 깔끔하게 종결되었습니다.

구글이 공식적으로 제시한 모델 마이그레이션 경로는 다음과 같습니다.

기존 종료 모델 (Retired Model) 권장 후속 모델 (Successor Model) 비고
gemini-2.0-flash-001 Gemini 3 Flash 또는 Flash Lite (releasing soon) -
gemini-2.0-flash-lite-001 Gemini 3 Flash Lite (releasing soon) Lite의 명맥 유지 확인
gemini-2.0-flash-live-001 gemini-live-2.5-flash-native-audio 2.5 기반 네이티브 오디오 모델로 전환

구글이 고객 안내 메일에 "releasing soon(곧 출시)" 이라는 표현을 직접 명시했습니다. 심지어 메일 하단에는 "Gemini 3 Flash Lite의 EAP(얼리 액세스 프로그램)를 신청하라" 며 폼 링크까지 포함되어 있었습니다.

이는 구글 내부적으로 이미 개발과 초기 테스트가 끝났으며, 곧 퍼블릭 프리뷰 혹은 정식(GA) 출시가 이루어질 것임을 의미합니다. 가성비와 빠른 응답 속도가 생명인 서비스(모바일, 엣지 디바이스, 대량 텍스트 처리 등)를 운영하는 기업들에게는 가뭄에 단비 같은 소식입니다.


📅 수차례 연기된 Gemini 2.0 종료, 6월 1일 '최종 확정'

새로운 모델이 온다는 건, 기존 모델을 보내주어야 한다는 뜻이기도 하죠. 당초 3월 3일로 예정되어 여러 번 미뤄졌던 Gemini 2.0 (Flash / Flash Lite) 모델의 일몰(Sunset) 일정이 2026년 6월 1일 로 못 박혔습니다.

Vertex AI 기반으로 서비스를 운영 중이시라면 아래의 타임라인을 반드시 캘린더에 기록해 두셔야 합니다.

날짜 주요 변경 사항 (Customer Impacting Change) 필요한 조치 (Action)
2026년 3월 6일 - 최근 30일간 사용량 없는 프로젝트 접근 차단
- 2.0 모델 파인튜닝(Fine-tuning) 지원 종료
지원되는 Gemini 3 모델로 마이그레이션 준비
2026년 5월 18일 - 모델 액세스 연장 요청(Exception Request) 마감 필수 비즈니스 사유가 있을 경우 폼을 통해 신청
2026년 6월 1일 - Gemini 2.0 모델 공식 서비스 종료 (Retire)
- 승인 고객 대상 단기 ELA 요금제 적용 시작
이 날짜 전까지 마이그레이션 완료 권장
2026년 8월 1일 - 종량제(PAYG) 방식의 단기 ELA 요금 종료
- 장기 ELA 요금제 적용 시작
장기 사용 시 구글 계정 팀과 별도 계약 필요

💸 종료된 모델 계속 쓰면 요금 '3배' 폭탄 (ELA 요금제)

구글은 고객들이 최신 모델(Gemini 3)로 빠르게 넘어가기를 강력하게 유도하고 있습니다. 만약 어쩔 수 없는 사정으로 6월 1일 이후에도 2.0 모델을 써야 한다면, ELA(Extended Lifecycle Access, 연장 수명 주기 액세스) 프로그램에 따라 기존보다 정확히 3배 비싼 요금을 지불해야 합니다.

[Gemini 2.0 ELA 적용 전후 요금 비교] (단위: 100만 토큰 당 USD)

모델명 구분 기존 요금 (Current) 종료 후 요금 (ELA PAYG) 인상률
Gemini 2.0 Flash 입력 (Input) $0.15 $0.45 300%
출력 (Output) $0.60 $1.80 300%
Gemini 2.0 Flash Lite 입력 (Input) $0.075 $0.225 300%
출력 (Output) $0.30 $0.90 300%

※ 참고: Provisioned Throughput(PT, 보장된 처리량)을 사용하는 경우 한 달 약정에 $8,100가 청구됩니다.

결국 ELA는 "마이그레이션 시간을 잠시 벌어주는 페널티 요금"에 가깝습니다. 비즈니스 비용 최적화를 위해서는 무조건 6월 1일 이전에 Gemini 3로 넘어가는 것이 이득입니다.


💡 개발자 및 기업을 위한 Action Plan

이번 공지를 통해 우리가 당장 취해야 할 액션은 명확해졌습니다.

  1. 영향받는 프로젝트 점검: 메일 하단에 안내된 프로젝트의 코드베이스를 열어 Gemini 2.0 API 호출 부분을 확인하세요.
  2. Gemini 3 Flash Lite 얼리 액세스(EAP) 신청: 구글이 메일에서 제공한 폼을 통해 EAP를 신청하고, 새로운 Lite 모델의 성능과 프롬프트 반응성을 미리 테스트해 보세요.
  3. 평가 도구 활용 (Vertex GenAI Evaluation Service): 구글이 업데이트한 평가 도구를 활용하여 2.0에서 3 계열로 전환할 때 출력 품질에 저하가 없는지 자동화된 평가를 세팅해 두는 것을 권장합니다.
  4. 마이그레이션 완료 목표: 늦어도 2026년 5월 말까지는 모든 프로덕션 환경의 엔드포인트를 Gemini 3로 교체해야 합니다.

✍️ 마치며

이번 구글 클라우드의 이메일은 수차례 미뤄지며 피로감을 주었던 2.0 종료 이슈에 마침표를 찍음과 동시에, 오매불망 기다리던 Gemini 3 Flash Lite의 등장을 공식화한 예고편 이었습니다.

곧 공개될 Gemini 3 Flash Lite가 치열한 소형 모델 경쟁에서 어떤 압도적인 퍼포먼스를 보여줄지 벌써부터 기대가 됩니다. 새로운 모델이 정식으로 공개되면, 발 빠르게 벤치마크 테스트를 진행하고 리뷰로 돌아오겠습니다!