구글은 휴대폰 카메라를 통해 이미지, 비디오, 사운드, 음성 언어의 정보를 해석할 수 있는 AI 시스템을 선보였습니다.
한 데모에서는 전화기에서 실행되는 프로토타입 AI 지원 비서가 "내가 안경을 어디에 두었나요?"라는 오래된 질문에 답할 수 있었습니다.
이는 경쟁사 OpenAI가 최신 AI 시스템인 GPT-4o를 출시한 지 하루 만에 나온 것입니다. GPT-4o에는 휴대폰 카메라를 통해 사람의 표정을 읽고 유창하게 채팅하고 유혹하는 눈길을 끄는 프레젠테이션이 포함되어 있습니다.
구글은 자사의 도구가 경쟁사만큼 소위 "다중 모드"를 이해할 수 있다는 점을 강조하고 싶어하는 것 같습니다.
"당신이 할 수 있는 모든 일을 내가 더 잘할 수 있다"는 스타일의 경쟁의 표시로 Google은 OpenAI 발표 직전에 휴대폰에서 실행되는 시스템의 기능을 예고했습니다.
사기 탐지기
이 회사는 Pixel 휴대폰에서 "기기 내"로 실행되는 AI 비서인 Gemini Nano와 Gemini App의 다중 모드 기능을 선보였습니다.
또한 전화 통화에 대한 정보 없이 전화 통화를 듣고 그것이 사기임을 경고할 수 있는 Gemini Nano용으로 테스트 중인 프로토타입 사기 경고 기능을 시연했습니다.
새로운 AI 기반 데모는 소프트웨어 개발자를 위한 회사의 연례 프레젠테이션인 Google I/O에서 공개되었습니다.
AI 기반 진행 과정의 빠른 필사본에 따르면 "다중 모드"라는 단어가 최소 22번 등장한 것으로 나타났습니다.
Google Deepmind의 대표인 Sir Demis Hassabis와 같은 연사는 다중 모드 AI에 대한 회사의 오랜 관심을 반복적으로 강조했으며 해당 모델이 이미지, 비디오 및 사운드를 "기본적으로" 처리하고 이들 사이의 연결을 이끌어 낼 수 있다고 강조했습니다.
그는 AI 비서의 미래를 탐구하는 프로젝트 Astra를 선보였습니다. 기능에 대한 데모 비디오에서는 휴대폰 카메라를 통해 본 내용에 대한 음성 질문에 답할 수 있었습니다. 데모가 끝날 무렵 Google 직원이 가상 비서에게 사양을 어디에 두었는지 물었고, 가상 비서는 방금 근처 책상에서 봤다고 대답했습니다.
Google 검색 시 동영상을 사용하는 '실시간' 데모도 있었습니다. Google 검색에서는 고장난 레코드 플레이어가 오작동하는 것으로 확인되어 이를 수리하는 방법을 제안할 수 있었습니다.
또한 발표에서 :
- AI가 생성한 개요(나열된 결과 전에 검색 질문에 답하는 텍스트)는 미국 전역에 출시될 예정이며 곧 더 많은 국가에 제공될 예정입니다. 이것들은 현재 영국에서 테스트되고 있습니다 .
- Google 포토의 AI 기반 검색을 통해 스냅 컬렉션을 더 쉽게 검색할 수 있습니다.
- AI 시스템을 생성하는 새로운 이미지, 비디오 및 음악 - 선택된 음악가, 예술가 및 영화 제작자에게 미리보기로 공개됩니다.
특정 주제에 대한 모든 이메일을 요약하는 것과 같은 새로운 AI 기능이 Gmail과 같은 Google의 충실한 서비스에 제공될 것입니다.
그리고 훨씬 더 먼 미래를 내다보면서 동시에 여러 온라인 회의에 참석하는 것과 같은 특정 작업을 수행하라는 지시를 받을 수 있는 가상 "팀 동료"를 생성하는 프로토타입 시스템의 데모도 있었습니다.
'자유게시판' 카테고리의 다른 글
AI가 우크라이나 유튜버를 러시아인으로 만든 방법 (1) | 2024.05.16 |
---|---|
미국 인플레이션 완화로 금리 인하 논란 촉발 (0) | 2024.05.16 |
Bumble, 반발 후 반독신 광고 사과 (0) | 2024.05.16 |
친애하는 AI: 알고리즘에 관계 조언을 요청하면 이런 일이 발생합니다. (0) | 2024.05.16 |
단 12초 만에 2,500만 달러 상당의 암호화폐를 훔친 미국 형제 체포 (0) | 2024.05.16 |
댓글