전문 링크


구글, AI 에이전트 시대 개막: Gemini 2.0 공개



구글은 정보 접근성과 유용성을 높이기 위한 노력의 일환으로, Gemini 2.0 모델을 공개하며 AI 에이전트 시대를 선도한다. Gemini 2.0은 이전 모델보다 향상된 멀티모달 기능 (이미지, 오디오 출력 포함), 도구 사용 능력을 갖춰 사용자를 위한 만능 비서에 한 걸음 더 다가갔다.



Gemini 2.0의 핵심 특징:


Gemini 2.0 Flash: 빠른 응답 속도와 향상된 성능으로 개발자들에게 제공되며, 멀티모달 입출력 및 도구 사용을 지원한다.


AI 에이전트: Gemini 2.0 기반의 에이전트들은 사용자의 지시에 따라 복잡한 작업을 수행하고, 여러 단계를 미리 계획하며, 사용자를 보조하는 기능을 제공한다.


Project Astra: 실시간 대화, 도구 사용, 기억력 향상, 지연 시간 감소 기능을 갖춘 범용 AI 비서 연구 프로젝트. 안경 등 다양한 폼팩터에 적용 가능성을 모색 중이다.


Project Mariner: 웹 브라우저에서 정보를 이해하고 작업을 수행하는 연구 프로젝트. 웹 페이지의 픽셀과 요소를 인식하여 사용자를 대신해 복잡한 작업을 처리한다.


Jules: 개발자를 위한 AI 기반 코드 에이전트. 코드 개발을 보조하고 프로젝트 계획 및 실행을 지원한다.


게임 에이전트: 게임 환경을 이해하고 실시간으로 전략을 제안하는 AI 에이전트.


로봇 에이전트: 공간 추론 능력을 활용하여 물리적 환경에서 사용자를 보조하는 AI 에이전트.


AI Overviews 업데이트: Gemini 2.0의 향상된 추론 능력을 활용하여 더욱 복잡한 질문 및 멀티모달 쿼리를 처리한다.




구글은 책임감 있는 AI 개발을 강조하며:


내부 안전 검토 위원회와 협력하여 잠재적 위험을 식별 및 완화한다.


AI 보조 레드 팀 접근법을 통해 안전성을 강화한다.


사용자 정보 보호를 위한 개인 정보 제어 기능을 제공한다.


악의적인 명령으로부터 사용자를 보호하기 위한 연구를 진행한다.




Gemini 2.0은 구글의 AI 기술 진보와 더불어 책임감 있는 AI 개발을 향한 노력을 보여준다. 앞으로 Gemini 2.0은 다양한 분야에서 새로운 가능성을 열고, AI 에이전트 시대의 주역이 될 것으로 기대된다.



2ab8dd2febdb07a46bb1d5bd1bd03636670d60aa5ba5758d240d53e4b1c0dafeded8ab282e21f20d18e63a26b9979bda



공식 벤치:


Gemini 2.0 Flash Experimental은 대부분의 영역에서 이전 버전 모델보다 향상된 성능을 제공하며, 특히 코드 생성 및 수학 문제 해결 능력에서 큰 발전을 보입니다. 다만 MRCR (1M) 벤치마크와 오디오 번역에서 Gemini 1.5 Pro 002가 더 나은 성능을 보이고 있습니다.



1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63a7b2c436ffa8b7ea6abae8781866e6f3fbf7a0252b9039ffd



AI Studio에 뜬 내용들




가장 적합한 분야 다중 모드 이해, 다중 모드 생성, 네이티브 도구 사용


사용 사례 10,000줄의 코드 처리, 검색과 같은 도구를 네이티브로 호출, 텍스트와 이미지를 혼합하여 생성 및 인지


지식 컷오프 2024년 8월


타이머 속도 제한


속도 제한 분당 15회 요청 (15 RPM)


무료 사용 제한 분당 15회 요청, 하루 1500회 요청 (15 RPM, 1500 req/day)




요약:


이 표는 특정 AI 모델의 기능과 사용 제한에 대한 정보를 제공합니다. 이 모델은 텍스트, 이미지 등 다양한 형태의 정보를 이해하고 생성하는 데 뛰어나며, 외부 도구를 자체적으로 사용할 수 있습니다. 인지 능력이 뛰어나며, 2024년 8월까지의 데이터를 학습했습니다. 무료 사용자는 분당 15회, 하루 1500회로 요청 횟수가 제한됩니다.






1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63c732c4564f719ac8e23691f35c789c66904e935c47f292210



왼쪽 메뉴에 Stream Realtime이란 거 생겼는데 들어가면 2.0 Flash만 선택할 수 있고, 마이크 연결해서 실시간 보이스 대화 가능하고


또 놀랍게도 실시간 카메라 혹은 PC화면 연동하면서 대화 가능



지렸음…… 해보길!!!



이제 하스스톤도 실시간 훈수 받으면서 쌉가능 ㄷㄷ



1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63d772c47338142197b6f64f667a6c65642040080411410db4730



물론 현생에서도 훈수 받음 ㄷㄷ



1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63d752c42d6c3afcb0192a52f7859488503016384288ab60f033c



그리고 Starter Apps 들어가면 영상 파일 넣어서 분석하는 것도 있고, 지도 펼쳐서 같이 대화하면서 여러가지 해볼 수도 있음



1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63c712c439bd563918c5c60dfc9ecb1acdb2e3fa62f96f9d7e6


1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63c712c42aba8f88c94385a351a1c69514d6d4c023f7ba5ae9718



파인튜닝...



1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63c762c42ced0031d604ea05d73243cd7a5a6817bc48bef5f2e



크롬 익스텐션으로 Project Mariner라는 거 있는데 바로 에이전트임 ㄷㄷ



1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63d702c42f3d4a5b952aa430056565bf563438fecdc68bef84338



자세한 내용은 아래의 영상들



1ebec223e0dc2bae61ab96e74683707027f14aff821be72e495a8dc63d722c42d63ab2decd9f11fa24965f4ad9585e2fde94aec783d7


https://www.youtube.com/watch?v=Fs0t6SdODd8&list=PLqYmG7hTraZD8qyQmEfXrJMpGsQKk-LCY

Introducing Gemini 2.0 | Our most capable AI model yet

We're announcing Gemini 2.0, our most capable AI model yet that’s built for the agentic era. Gemini 2.0 brings enhanced performance, more multimodality, and ...

www.youtube.com




총평:

똥트만이 변비마냥 찔끔찔끔 쌀 때, 순대로 피채워는 장염으로 인한 설사를 아주 그냥 프쓔아아아아아! 하고 하루만에 냅다 싸질렀다.