‘나노 바나나’ 구글 제미나이 2.5 플래시 이미지로 발표
지난 몇 주간 AI 커뮤니티를 떠들썩하게 만든 미스터리 모델의 정체가 마침내 밝혀졌습니다. LMArena에서 ‘나노 바나나(nano-banana)’라는 익명의 이름으로 이미지 편집 리더보드 상위권을 휩쓸며 화제를 모았던 이 모델이, 바로 구글의 최신 AI 기술이었다는 사실이 공식 발표되었습니다.
미국시간 2025년 8월 26일, 구글은 이 신비한 모델이 자사의 제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)임을 공식 발표하며, 제미나이를 통해 전 세계 사용자들에게 서비스를 시작했습니다. 그동안 사용자들이 극찬했던 뛰어난 이미지 편집 성능의 비밀이 마침내 베일을 벗은 셈입니다.
이번 공개는 단순한 신제품 출시를 넘어서 AI 이미지 편집 분야의 패러다임 전환을 의미합니다. 기존 도구들이 해결하지 못했던 일관성 문제를 획기적으로 개선한 이 모델이 어떤 혁신을 가져올지, 그리고 치열한 AI 시장 경쟁에서 구글이 어떤 우위를 점할 수 있을지 자세히 살펴보겠습니다.
목차

구글 제미나이 2.5 플래시 이미지 (출처: Google)
1. 신비한 ‘나노 바나나’의 정체
제미나이 2.5 플래시 이미지의 등장은 상당히 드라마틱했습니다. 지난 몇 주간 LMArena라는 크라우드소싱 AI 평가 플랫폼에서 ‘나노 바나나(nano-banana)’라는 익명의 모델이 이미지 편집 리더보드 상위권을 차지하며 화제가 되었습니다.
사용자들은 이 모델의 뛰어난 편집 능력을 극찬했지만, 정작 어떤 회사에서 만든 것인지는 알 수 없었습니다. 구글 딥마인드의 CEO 데미스 하사비스(Demis Hassabis)는 SNS에 “현미경 아래서 이상한 물체가 발견됐다”라는 암시적인 게시물과 함께 바나나 관련 힌트를 남기며 궁금증을 증폭시켰습니다.
결국 2025년 8월 25일(미국시간), 구글은 공식적으로 이 신비한 모델이 자사의 제미나이 2.5 플래시 이미지임을 밝혔습니다. 현재 제미나이 앱의 모든 사용자가 이용할 수 있으며, 개발자들은 제미나이 API, 구글 AI 스튜디오, 버텍스 AI를 통해 접근할 수 있습니다.
2. 제미나이 2.5 플래시 이미지 사용하기
접근 방법
제미나이 2.5 플래시 이미지는 여러 플랫폼에서 이용할 수 있습니다:
- 제미나이 앱: gemini.google.com에서 직접 사용
- 개발자용: Gemini API, Google AI Studio, Vertex AI
- Adobe 통합: Adobe Firefly, Adobe Express에서도 사용 가능
일반 사용자라면 제미나이 웹사이트(gemini.google.com)에 접속하는 것이 가장 간편합니다. 별도의 설치나 복잡한 설정 없이 바로 사용할 수 있습니다.
모델 선택하기
제미나이 웹사이트에 접속한 후, 채팅창 상단에서 ‘Gemini 2.5 Flash’를 선택하면 이미지 생성 및 편집 기능을 사용할 수 있습니다. 이 모델이 바로 최신 이미지 처리 기능을 포함하고 있습니다.
3. 일관성 문제 해결의 핵심
구글 딥마인드의 시각 생성 모델 제품 리드인 니콜 브리히토바(Nicole Brichtova)는 이번 업그레이드의 핵심을 다음과 같이 설명했습니다: “자신이나 잘 아는 사람들의 사진을 편집할 때 미묘한 결함이 중요합니다. ‘비슷하지만 완전히 같지 않은’ 묘사는 올바르지 않다고 느껴집니다”.
기존 AI 이미지 편집 도구들의 가장 큰 문제점은 부분 편집 시 전체적인 일관성이 깨진다는 것이었습니다.
- 셔츠 색상만 바꾸려 했는데 얼굴 형태가 변형됨
- 배경을 교체하면 인물의 조명이나 그림자가 부자연스러워짐
- 여러 번의 연속 편집 후 원본과 완전히 다른 이미지가 됨
제미나이 2.5 플래시 이미지는 이런 문제들을 해결하기 위해 얼굴, 동물, 기타 세부 사항의 일관성을 편집 과정 전반에 걸쳐 보존하는 기술을 도입했습니다. 사용자가 다양한 의상이나 헤어스타일, 배경으로 인물을 변화시켜도 인식 가능한 모습을 유지할 수 있게 되었습니다.
4. 강력한 편집 기능들
다중 이미지 합성
새로운 모델의 가장 인상적인 기능 중 하나는 여러 사진을 하나로 합성하는 능력입니다. 예를 들어, 별도로 촬영된 사람과 반려동물 사진을 농구 코트 배경과 합쳐 하나의 자연스러운 이미지를 만들 수 있습니다.
이는 단순한 합성을 넘어서 각 요소들 간의 조명, 그림자, 원근감까지 자연스럽게 조정하여 마치 실제로 함께 촬영한 것 같은 결과물을 생성합니다.
연속 편집 기능
기존 도구들과 달리 제미나이 2.5 플래시 이미지는 다중 턴 편집(Multi-turn editing)을 지원합니다. 이는 같은 이미지에 대해 연속적인 수정을 가할 수 있다는 의미입니다:
- 1단계: 벽면 색상 변경
- 2단계: 가구 추가
- 3단계: 조명 효과 조정
각 단계마다 처음부터 다시 시작할 필요가 없어 편집 효율성이 크게 향상되었습니다.
디자인 믹싱
특히 창의적인 분야에서 주목받는 기능은 디자인 믹싱입니다. 한 이미지의 시각적 요소를 다른 이미지의 객체에 적용할 수 있습니다.
구글이 제시한 예시로는:
- 나비 날개 패턴을 드레스 디자인에 적용
- 꽃잎 스타일을 신발 디자인에 반영
이런 기능은 패션 디자이너나 제품 디자이너들에게 새로운 영감과 작업 도구를 제공할 것으로 기대됩니다.
5. 치열한 AI 이미지 시장 경쟁
AI 이미지 생성 시장은 현재 빅테크 기업들 간의 치열한 경쟁 구도를 보이고 있습니다. 각 기업의 현재 상황을 살펴보면:
- OpenAI: GPT-4o 이미지 생성기로 ChatGPT 사용량 급증, 주간 사용자 7억 명 이상
- Meta: 최근 미드저니(Midjourney)와 라이선싱 계약 체결
- Google: 제미나이 월간 사용자 4억 5천만 명 (7월 기준)
특히 OpenAI의 경우, 올해 3월 GPT-4o 이미지 생성 기능 출시 후 ChatGPT 사용량이 “하늘을 뚫을 정도로” 증가했다고 보고되고 있습니다. 이는 사용자들이 AI 이미지 생성 기능에 큰 관심을 보이고 있다는 증거입니다.
구글의 제미나이 2.5 플래시 이미지는 이런 경쟁 상황에서 차별화된 기술력으로 시장 점유율 확대를 노리고 있습니다. 특히 일관성 유지라는 기존 도구들의 약점을 파고든 전략이 효과적일 것으로 보입니다.
6. 실제 활용 사례와 가능성
비즈니스 활용
제미나이 2.5 플래시 이미지는 다양한 비즈니스 분야에서 활용 가능성을 보여주고 있습니다:
- 마케팅: 제품 사진을 다양한 배경과 상황에 자연스럽게 배치
- 전자상거래: 동일한 제품의 다양한 스타일링 이미지 생성
- 부동산: 빈 공간에 가구를 배치한 가상 스테이징
크리에이티브 분야
Adobe와의 파트너십을 통해 Adobe Firefly와 Adobe Express에서도 제미나이 2.5 플래시 이미지를 사용할 수 있게 되었습니다.
- 소셜 크리에이터들은 일관된 룩앤필의 그래픽 시리즈 제작 가능
- 시각 디자이너들은 제품 콘셉트나 캐릭터 디자인의 빠른 프로토타이핑 가능
- 마케터들은 기존 캠페인 자산을 다양한 포맷으로 쉽게 변환 가능
교육 분야
구글 AI 스튜디오에서 제공하는 템플릿 앱 중 하나는 인터랙티브 교육 튜터입니다.
- 손으로 그린 다이어그램을 읽고 이해
- 실제 문제에 대한 도움 제공
- 복잡한 편집 지시사항을 한 번에 처리
이러한 기능들은 개인 맞춤형 학습 경험을 제공하는 데 큰 도움이 될 것으로 예상됩니다.
자주 묻는 질문
Q1: 제미나이 2.5 플래시 이미지는 무료로 사용할 수 있나요?
A1: 제미나이 앱을 통해서는 일반 사용자들이 무료로 이용할 수 있습니다. 개발자용 API의 경우 이미지당 0.039달러($30.00/100만 출력 토큰)의 요금이 부과됩니다.
Q2: 기존 ChatGPT나 다른 AI 도구와 비교했을 때 어떤 점이 다른가요?
A2: 가장 큰 차이점은 편집 과정에서의 일관성 유지입니다. 다른 도구들이 부분 편집 시 얼굴이 변형되거나 배경이 왜곡되는 반면, 제미나이는 원본의 핵심 특징들을 보존합니다.
Q3: 어떤 이미지 포맷을 지원하나요?
A3: PNG, JPEG, WebP 포맷을 지원하며, 최대 이미지 크기는 7MB, 프롬프트당 최대 3,000개의 이미지를 처리할 수 있습니다.
Q4: 생성된 이미지에 워터마크가 포함되나요?
A4: 네, 모든 생성 및 편집된 이미지에는 보이는 워터마크와 구글의 SynthID 식별 시스템이 포함됩니다.
결론
구글의 제미나이 2.5 플래시 이미지는 AI 이미지 편집 분야에서 일관성이라는 핵심 과제를 해결함으로써 시장에 새로운 기준을 제시했습니다. 특히 다중 이미지 합성, 연속 편집, 디자인 믹싱 등의 고급 기능들은 기존 도구들과 명확한 차별점을 만들어냈습니다.
치열한 AI 이미지 시장 경쟁 속에서 구글이 기술적 우위를 확보할 수 있을지, 그리고 이것이 사용자 수 증가로 이어질지는 앞으로 지켜볼 일입니다. 하지만 분명한 것은 AI 이미지 편집 기술이 더욱 정교하고 실용적인 방향으로 발전하고 있다는 점입니다.
비즈니스부터 교육, 크리에이티브 작업까지 다양한 분야에서 활용 가능성을 보여주는 만큼, 관련 업계 종사자들에게는 새로운 기회가, 일반 사용자들에게는 더욱 편리한 이미지 편집 경험이 제공될 것으로 기대됩니다.
위 글은 AI로 작성하였습니다.