본문 바로가기
로봇·AI

Google(구글)의 첨단 AI: Gemini(제미나이), Imagen(이마젠), Whisk(위스크), Veo(비오)

by 공유. 2025. 4. 23.
반응형

시작은  오픈AI에서 했지만, 그리고 여전히 챗GPT가 1인자 자리를 유지하고 있지만 구글의 추격이 만만치 않습니다. 구글의 첨단 AI 모델 Gemini(제미나이, 멀티모달 언어모델), Imagen(이마젠. 이미지), Whisk(위스크. 이미지), Veo(비오. 영상 AI)에 대해 알아봅니다.

 

 

 

구글AI 썸네일

 

Gemini(제미나이): 멀티모달 대규모 언어 모델


Gemini(제미나이)는 Google의 대규모 언어 모델(LLM)로, 다양한 유형의 데이터를 처리할 수 있는 멀티모달 AI 모델입니다. 오디오, 이미지, 소프트웨어 코드, 텍스트, 비디오 등 여러 유형의 데이터를 처리하도록 설계되었습니다.

Gemini는 Google의 생성형 AI 챗봇(이전의 Bard)을 구동하는 모델이기도 하며, Google은 자사의 다양한 제품들에 점진적으로 Gemini를 통합하고 있습니다. 

가장 최신 Google Pixel폰(구글 픽셀폰)에서는 Google 어시스턴트를 대체하는 기본 AI 어시스턴트로 사용되고 있으며, Google Workspace에서는 콘텐츠 작성 및 편집, 이메일 초안 작성, 응답 제안 등을 지원합니다.

주요 특징

  • 처음부터 멀티모달로 설계되어 다양한 입력 유형을 원활하게 이해하고 추론
  • 복잡한 서면 및 시각적 정보를 이해하는 정교한 추론 능력
  • 수학과 물리학과 같은 복잡한 주제에서 추론을 설명하는 데 특히 뛰어남
  • 방대한 양의 데이터에서 통찰력을 추출하는 능력

 

Imagen(이마젠): 최고 품질의 텍스트-이미지 생성 모델


Imagen(이마젠)은 Google DeepMind(구글 딥마인드)에서 개발한 텍스트-이미지 생성 AI 모델입니다. 사용자의 텍스트 설명을 바탕으로 고품질 이미지를 생성합니다. 

최신 버전인 Imagen 3은 이전 모델보다 더 우수한 품질을 제공하며 다른 선도적인 이미지 생성 모델보다도 더 좋은 평가를 받고 있습니다. 시각적 품질과 프롬프트 응답 정확도에서 높은 점수를 받았습니다.

주요 특징

  • 더 뛰어난 세부 묘사, 풍부한 조명 및 시각적 결함 감소
  • 향상된 밝기와 생동감으로 전반적인 색상 균형 개선
  • 사실주의부터 인상주의, 추상화, 애니메이션까지 다양한 예술 스타일 렌더링 가능
  • 풍부한 텍스처와 향상된 세부 묘사로 시각적으로 더욱 매력적인 이미지 생성

 

위스크(Whisk): 구글의 이미지-생성 이미지 모델


구글의 이미지 생성 AI 위스크(Whisk)는 기존 AI 이미지 생성 도구들과 달리 텍스트 프롬프트 대신 이미지를 입력해 새로운 이미지를 생성하는 방식으로 작동하는 이미지 생성 AI입니다.

사용자가 피사체, 장면, 스타일에 해당하는 이미지를 업로드하면 구글의 Gemini 모델이 이미지를 분석해 자동으로 상세한 캡션을 작성하고, 이를 Imagen 3 이미지 생성 모델에 전달하여 새로운 이미지를 만들어내는 방식입니다.

위스크는 현재 인지도 측면에서는 DALL-E와 같은 기존 이미지 생성 AI에 비해 아직 널리 알려지지 않은 편이지만, 2024년 12월 16일 미국에서 처음 출시된 후, 현재 100개 이상의 국가로 서비스가 확장되었습니다. 우리나라에서도 2025년 2월 12일부터 사용 가능해졌습니다.

 

 

주요 특징

  1. 텍스트 프롬프트 없이 이미지만으로 새 이미지 생성 가능
  2. 피사체, 장면, 스타일을 각각 다른 이미지로 지정 가능
  3. 디지털 인형, 에나멜 핀, 스티커 등 다양한 결과물 생성
  4. 구글 원(Google One) AI 프리미엄 구독자는 'Whisk Animate' 기능으로 생성된 이미지를 Veo 2를 통해 짧은 비디오로 변환 가능

위스크는 "프롬프트 작성법을 배우지 않아도" 쉽게 이미지를 생성할 수 있도록 설계되었으며, 구글은 이를 "빠른 시각적 아이디어 구상"을 위한 도구로 포지셔닝하고 있습니다.

아직은 새로운 서비스이지만, 직관적인 사용법과 구글의 글로벌 확장으로 인해 앞으로 인지도가 높아질 것으로 보입니다.

위스크는 labs.google/whisk 웹사이트에서 구글 계정으로 로그인하여 사용할 수 있습니다.

 

 

Veo(비오): 최첨단 비디오 생성 모델


Veo(비오)는 Google DeepMind가 개발한 최고 수준의 비디오 생성 AI 모델입니다. 텍스트나 이미지 프롬프트를 기반으로 고품질, 고해상도 비디오를 생성합니다. 최근 2025년 8월 라스베가스 스피어돔에서 재탄생하게 될 영화 <오즈의 마법사>가 화제입니다.

 

 

 

Veo는 사람, 동물, 물체가 영상 전체에 걸쳐 현실적으로 움직이는 일관되고 조화로운 영상을 만들어냅니다. 이 기술은 비디오 제작 시간을 단축하고 비용을 절감하며, 비디오 콘텐츠를 빠르게 프로토타이핑하고 반복할 수 있게 합니다.

주요 특징

  • 최대 4K 해상도의 현실적인 움직임과 고품질 비디오 출력 제공
  • 단순하거나 복잡한 지시사항을 충실히 따르고 실제 물리 현상을 설득력 있게 시뮬레이션
  • 광범위한 촬영 스타일, 각도, 움직임 등 다양한 카메라 제어 옵션 제공
  • 세부 묘사, 현실감, 결함 감소 측면에서 다른 AI 비디오 모델보다 크게 개선

 

함께 보면 좋은 글

 

구글AI vs 오픈AI : 글, 이미지, 영상 최고의 AI도구는?

 

구글AI vs 오픈AI : 글, 이미지, 영상 최고의 AI도구는?

생성AI 도구를 활용해 글도 쓰고, 이미지도 생성하고, 영상도 제작하고자 할 때, 기왕이면 한 곳에서 통합적으로 작업할 수 있으면 좋습니다. 어떤 도구가 있을까요? 구글 AI 프리미엄 요금제와

gongyu.tistory.com

라스베가스 스피어에서 구글 AI로 부활하는 영화 '오즈의 마법사'

 

라스베가스 스피어에서 구글 AI로 부활하는 영화 '오즈의 마법사'

나날이 빅뉴스를 터뜨리는 AI, 오늘은 라스베가스 스피어(Las Vegas Sphere)에서 구글 AI와의 협업으로 1939년 원작 '오즈의 마법사(The Wizard of Oz)' 영화를 16K 고화질 대형 몰입형 영상으로 복원되는 프

gongyu.tistory.com

ChatGPT(챗지피티), Claude(클로드), Gemini(제미나이), Perplexity(퍼플렉시티) 생성 AI 유료 요금제 비교

 

ChatGPT(챗지피티), Claude(클로드), Gemini(제미나이), Perplexity(퍼플렉시티) 생성 AI 유료 요금제 비교

하루가 다르게 변하는 AI의 세계, 막상 유료 요금제를 선택하려니 망설여집니다. ChatGPT(챗지피티), Claude(클로드), Gemini(제미나이), Perplexity(퍼플렉시티) 등 인기 생성형 AI의 요금제와 핵심 기능을

plusai.tistory.com

퍼플렉시티 프로(Perplexity Pro)를 잘 활용하는 법 | 블로그 글, 리포트 쓰기

 

퍼플렉시티 프로(Perplexity Pro)를 잘 활용하는 법 | 블로그 글, 리포트 쓰기

이번 글은 퍼플렉시티 프로(Perplexity Pro)를 사용해 블로그 글이나 리포트를 쓸 때, 구체적으로 어떤 모델을 사용해 글을 쓰는 것이 효과적인지 제시합니다. 사용자는 충분한 자료수집을 거친 후,

gongyu.tistory.com

퍼플렉시티 Pro 사용법 모델비교 모델 선택법 | SKT 유저 필독

 

퍼플렉시티 Pro 사용법 모델비교 모델 선택법 | SKT 유저 필독

퍼플렉시티 Pro에서는 다양한 AI 모델을 제시하고 있습니다. 사용자가 필요에 맞게 모델을 선택해 질문할 수 있도록 한 것인데, 문제는 모델의 특징을 알아야 선택할 수 있다는 것. 하여 본 글에

gongyu.tistory.com

챗지피티(ChatGPT)로 프로필 사진 지브리 스타일로 무료 변환하는 법

 

챗지피티(ChatGPT)로 프로필 사진 지브리 스타일로 무료 변환하는 법

최근 챗GPT가 제공하는 이미지 생성 기능을 활용한 '지브리 스타일(Ghibli Style)'이 전 세계적으로 인기를 끌고 있습니다. 이 기능은 사용자가 입력한 프로필 사진이나 요청을 기반으로, 일본 애니

gongyu.tistory.com

퍼플렉시티(Perplexity) 고성능 AI 모델 '소나'(Sonar)

 

퍼플렉시티(Perplexity) 고성능 AI 모델 '소나'(Sonar)

최근 퍼플렉시티가 자체 개발한 AI 모델 '소나'(Sonar)의 새로운 버전을 출시했다는 소식입니다. 소나(Sonar)는 메타의 Llama(라마) 3.3 70B를 기반으로 개발된 고성능 AI 모델로, 텍스트 기반 작업에서

gongyu.tistory.com

구글의 이미지 생성 AI 위스크(Whisk) 사용법

 

구글의 이미지 생성 AI 위스크(Whisk) 사용법

구글의 이미지 생성 AI 도구 위스크(Whisk)가 우리나라에서도 사용이 가능해졌습니다. 그동안 미국에서만 가능했던 위스크가 2025년 2월 12일 한국을 포함한 100여 개 국가에서 사용할 수 있게 되었

gongyu.tistory.com

챗GPT 외, 지브리 스타일(Ghibli Style) 프사 무료 변환 플랫폼 종합 | Fotor, insMind, Grok, getimg.ai

 

챗GPT 외, 지브리 스타일(Ghibli Style) 프사 무료 변환 플랫폼 종합 | Fotor, insMind, Grok, getimg.ai

지브리 스타일(Ghibli Style) 프로필 사진 변환 열풍을 타고 ChatGPT(챗지피티) 외에도 무료로 지브리 프사를 만들 수 있는 플랫폼이 많이 등장하고 있습니다. Fotor(포토), insMind(인스마인드), Grok (xAI)(

dimalife.tistory.com

두 개의 딥 리서치(Deep Research): 퍼플렉시티(Perplexity)와 오픈AI(OpenAI)

 

두 개의 딥 리서치(Deep Research): 퍼플렉시티(Perplexity)와 오픈AI(OpenAI)

최근 AI 기반 리서치 도구 시장에서 퍼플렉시티(Perplexity)와 오픈AI(OpenAI)가 각각 '딥 리서치(Deep Research)' 기능을 출시하여 경쟁 구도를 형성하고 있습니다. 두 플랫폼의 딥 리서치가 각각 어떻게

dimalife.tistory.com

한국인을 위한 생성AI 뤼튼 활용법 _ 글쓰기 이미지생성 캐릭터생성 슈퍼챗

 

한국인을 위한 생성AI 뤼튼 활용법 _ 글쓰기 이미지생성 캐릭터생성 슈퍼챗

지난 편, '생성형 AI 뤼튼, 초보자를 위한 종합 가이드'에 이어 뤼튼 AI 두 번째 시간입니다. 이번 글에서는 '한국판 생성 AI 뤼튼 활용법'이라는 제하에 뤼튼을 활용한 글쓰기, 이미지와 캐릭터생

dimalife.tistory.com

AI영상의 선두주자, 구글 비오 2(Veo2)와 오픈AI 소라(Sora)의 기술 대결

 

AI영상의 선두주자, 구글 비오 2(Veo2)와 오픈AI 소라(Sora)의 기술 대결

텍스트만으로 고품질 영상을 만들어내는 AI영상 기술의 선두에 구글 비오 2(Veo2)와 오픈 AI의 소라(Sora)가 있습니다. 오늘은 이 두 모델의 특징과 성능, 장단점을 비교해 보고자 합니다.    ✅ 목

dimalife.tistory.com

챗 지피티(Chat GPT) 무료 유료 요금제와 모델별 특징 비교

 

챗 지피티(Chat GPT) 무료 유료 요금제와 모델별 특징 비교

지난번 '[초보자를 위한] 챗 지피티(chatGPT)가 대체 뭐지?' 글에서 살펴보았듯 챗 지피티(Chat GPT)의 진화과정은 다채롭습니다. 이번엔 그 후속 편으로 챗GPT의 모델별 특징과 무료 및 유료 요금제에

dimalife.tistory.com

AI 챗봇 퍼플렉시티(Perplexity), SKT 사용자라면 Pro가 1년 무료!

 

AI 챗봇 퍼플렉시티(Perplexity), SKT 사용자라면 Pro가 1년 무료!

구글의 검색시장과 오픈 AI의 챗GPT를 위협하고 있는 AI 검색 엔진 퍼플렉시티(perplexity)! SKT 사용자라면 지금 놓치지 말아야할 소식이 있습니다. 바로 퍼플렉시티 Pro버전 1년 무료 이벤트입니다.

dimalife.tistory.com

반응형

댓글