Google is developing an AI that controls web browsers to perform various tasks. They are also creating an agent to control the entire computer beyond the browser. According to Reuters, this AI tool is set to be introduced in browsers under the name 'Project Jarvis' and is expected to be unveiled alongside the next release of the Gemini LLM. Google is not alone in developing such a system. OpenAI is also reportedly working on a Computer Using Agent (CUA) that autonomously navigates the web in browsers. Browser-based AI will make it easier for users to conduct online research. This is because there will no longer be a need to develop APIs or use screen recording to read user data. Instead, users can directly issue commands in the browser, and it will automatically perform all necessary tasks, including filling out forms and clicking buttons. ㅜExamples of tasks the AI can perform include opening relevant web pages, organizing search data into easily readable tables, purchasing products, and booking flights.
구글이 다양한 작업을 수행하기 위해 웹 브라우저를 제어하는 AI를 개발 중이다. 또한 브라우저를 넘어 컴퓨터 전체를 제어할 에이전트도 만들고 있다. 로이터 통신에 따르면, 이 AI 도구는 '프로젝트 자비스(Project Jarvis)'라는 이름으로 브라우저에 도입될 예정이며, 차기 Gemini LLM 출시와 함께 공개될 것으로 보인다. 구글만이 이런 시스템을 개발하는 것은 아니다. 오픈AI도 브라우저에서 자율적으로 웹을 탐색하는 컴퓨터 사용 에이전트(CUA)를 개발 중인 것으로 알려졌다. 브라우저 기반 AI는 사용자들이 온라인 리서치를 더 쉽게 할 수 있게 해줄 것이다. 사용자 데이터를 읽기 위해 API를 개발하거나 화면 녹화를 할 필요가 없어지기 때문이다. 대신 브라우저에서 직접 명령을 내리면 양식 작성이나 버튼 클릭을 포함한 모든 필요한 작업을 자동으로 수행할 것이다. AI가 수행할 수 있는 작업의 예로는 관련 웹 페이지 열기, 검색 데이터를 읽기 쉬운 표로 정리하기, 제품 구매하기, 항공편 예약하기 등이 있다.