AI 브라우저 에이전트 완전 가이드

게시 2026/01/25

By BLUEBUG

30 분읽는 시간

AI 브라우저 에이전트 완전 가이드

Claude in Chrome vs Google Antigravity 심층 분석

개요

AI 브라우저 에이전트의 시대

2026년 현재, AI는 단순히 질문에 답하는 수준을 넘어 실제로 행동하는 에이전트(Agentic AI) 시대로 진입했습니다. 특히 브라우저는 AI 에이전트의 주요 전장으로 부상하고 있으며, 주요 AI 기업들이 경쟁적으로 브라우저 기반 에이전트를 출시하고 있습니다:

Anthropic: Claude in Chrome (2025년 8월 베타 출시, 12월 유료 사용자 전체 확대)
Google: Antigravity (2025년 11월 공개 프리뷰)
Perplexity: Comet 브라우저
OpenAI: ChatGPT Atlas (출시 예정)

이들은 단순한 도구가 아니라 인터넷과 사용자 사이의 인터페이스 자체를 재정의하려는 시도입니다.

왜 브라우저인가?

브라우저는 현대 업무의 중심입니다:

대부분의 작업이 브라우저에서 이루어짐 (이메일, 문서, 분석, 커뮤니케이션)
다양한 웹 애플리케이션과 SaaS 도구들의 통합 지점
정보 접근과 작업 수행의 주요 게이트웨이

AI가 브라우저를 제어할 수 있다면, 수많은 반복적 업무를 자동화할 수 있습니다.

Claude in Chrome 상세 분석

기본 정보

개발사: Anthropic
출시일: 2025년 8월 (연구 프리뷰), 2025년 12월 (전체 유료 사용자 확대)
가격:

Pro 플랜: $20/월
Team 플랜: $30/월/사용자
Max 플랜: $100-200/월

지원 플랫폼: Chrome 브라우저 (데스크톱만, 모바일 미지원)

핵심 기능

1. 브라우저 컨텍스트 인식

현재 탭 내용 읽기: Claude가 열린 웹페이지, 이메일, 문서를 실시간으로 인식
멀티탭 컨텍스트: 여러 탭의 정보를 종합적으로 이해
스크린샷 불필요: 별도로 캡처하거나 복사-붙여넣기 할 필요 없음

2. 자동화된 액션 수행

클릭 및 네비게이션: 버튼 클릭, 링크 이동, 페이지 탐색
폼 작성: 양식 자동 입력, 제출
데이터 추출: 웹페이지에서 필요한 정보 수집 및 정리
이메일 관리: Gmail에서 특정 발신자 이메일 검색, 삭제, 답장 작성
복합 워크플로우: 여러 단계를 거치는 작업 자동 실행

3. 사이드 패널 인터페이스

Chrome 브라우저 옆에 독립된 대화 창
현재 페이지를 보면서 동시에 Claude와 대화
작업 진행 상황 실시간 모니터링

4. Claude Code 통합

개발자를 위한 특별 기능
터미널에서 코드 작성 → 브라우저에서 테스트 → 디버깅의 순환 워크플로우
빌드-테스트-수정 사이클 단축

5. 워크플로우 녹화 기능

사용자가 수행하는 작업을 녹화
Claude가 패턴을 학습하여 자동화
반복 작업을 쉽게 자동화

기술적 아키텍처

Claude in Chrome은 여러 컴포넌트로 구성됩니다:

백그라운드 서비스 워커: 지속적인 상태 유지 및 에이전트 행동 조율
콘텐츠 스크립트: 웹페이지에 주입되어 DOM 관찰 및 액션 실행
사이드 패널 인터페이스: 사용자 상호작용 및 작업 모니터링
Anthropic API 연결 레이어: 페이지 컨텍스트 전송 및 에이전트 명령 수신

페이지 인식 메커니즘

Claude는 웹페이지를 다양한 방식으로 “봅니다”:

read_page 도구: 접근성 트리(Accessibility Tree)를 통한 구조화된 페이지 표현
- 각 상호작용 가능한 요소(버튼, 텍스트박스 등)에 고유 식별자 부여
- ARIA 속성을 활용한 의미론적 이해
get_page_text 도구: 순수 텍스트 추출
- 기사, 블로그 포스트 등 텍스트 위주 페이지에 최적화
컴퓨터 비전 도구: 스크린샷 기반 시각적 처리
- 복잡한 UI 요소 인식
- 레이아웃 및 디자인 이해

권한 관리 시스템

작동 모드 선택

Ask before acting (사전 승인): 각 액션마다 사용자 승인 요청
Act without asking (자율 작동): 승인 없이 자동 실행

사이트별 권한

특정 웹사이트에만 선택적으로 액세스 허용
민감한 사이트는 기본적으로 차단 (금융, 성인 콘텐츠, 불법 복제 사이트)

고위험 액션 보호

구매, 게시, 개인정보 공유 등 중요한 작업은 항상 승인 요청

실제 활용 사례

이메일 관리

사용자: "Gmail에서 특정 발신자의 이메일을 모두 찾아서 삭제해줘"
Claude: [검색 → 필터링 → 선택 → 삭제]

문서 분석

사용자: "이 회사의 IR 자료를 읽고 왜 이번 분기 매출이 늘었는지 설명해줘"
Claude: [PDF 읽기 → 재무 데이터 분석 → 요약 제공]

데이터 수집 및 정리

사용자: "IREN의 밸류에이션을 구글 스프레드시트에 작성해줘"
Claude: [SEC EDGAR 접속 → 재무 자료 검색 → 데이터 추출 → 스프레드시트 정리]

Google Antigravity 상세 분석

기본 정보

개발사: Google
출시일: 2025년 11월 18일 (공개 프리뷰)
가격: 무료 (프리뷰 기간 동안)
기본 모델: Gemini 3 Pro (추가로 Claude Sonnet 4.5, GPT-OSS-120B 지원)
지원 플랫폼: macOS, Windows, Linux

핵심 개념: Agent-First Platform

Antigravity는 기존 IDE의 진화가 아니라 에이전트를 위한 운영 체제로 설계되었습니다.

전통적 IDE vs Antigravity

특성	전통 IDE	Antigravity
주 사용자	개발자	AI 에이전트 + 개발자
작업 방식	코드 작성 (동기)	작업 위임 (비동기)
인터페이스	텍스트 에디터 중심	3개 표면 (Editor, Browser, Agent Manager)
멀티태스킹	순차적	병렬 (여러 에이전트 동시 작업)

3개의 핵심 표면 (Three Surfaces)

1. Editor View (에디터 뷰)

VS Code 기반의 익숙한 코딩 환경
AI 기반 탭 자동완성 및 인라인 명령
개발자가 직접 코드를 작성할 때 사용
동기적(synchronous) 워크플로우

2. Agent Manager (에이전트 매니저)

가장 혁신적인 부분
별도의 독립 창으로 작동
개발 작업의 “받은편지함(Inbox)” 역할
여러 에이전트를 동시에 관리 가능

Agent Manager의 기능:

개발자: "5개의 다른 버그를 5개의 다른 에이전트에게 할당"
결과: 5개 에이전트가 병렬로 작업 수행, 각각의 진행 상황 실시간 모니터링

이는 전통적인 챗봇 방식의 선형적(linear) 상호작용을 탈피한 것입니다.

3. Browser (브라우저)

완전히 제어되는 Chrome 인스턴스
에이전트가 애플리케이션 테스트 및 검증 수행
블루 테두리로 에이전트 제어 상태 표시
빨간 점이 AI의 커서를 나타냄

Artifacts: 신뢰 구축 메커니즘

에이전트에게 작업을 위임할 때 가장 큰 문제는 신뢰입니다. “정말 제대로 했을까?”

Antigravity는 Artifacts를 통해 이를 해결합니다:

Artifacts 종류

Task Lists (작업 목록)
- 에이전트가 계획한 하위 작업들
- 진행 상황 및 완료 여부
Implementation Plans (구현 계획)
- 어떻게 문제를 해결할 것인지 상세 계획
- Plan 모드에서 자동 생성
Screenshots (스크린샷)
- 중요 단계마다 자동 캡처
- 시각적 검증 가능
Browser Recordings (브라우저 녹화)
- 에이전트가 브라우저에서 수행한 작업의 비디오 녹화
- “로그인 버튼 클릭 → 스피너 대기 → 대시보드 로딩 확인” 같은 동적 상호작용 기록
- 나중에 재생하여 검증 가능
Test Results (테스트 결과)
- 에이전트가 생성하고 실행한 테스트의 통과/실패 로그

Google Docs 스타일 코멘트

Artifacts에 직접 피드백 작성 가능
“이 부분은 다르게 해줘”라고 코멘트
에이전트가 실행을 중단하지 않고 피드백을 반영

작업 모드

Plan Mode (계획 모드)

먼저 상세한 Plan Artifact 생성
사용자 승인 후 실행
복잡한 작업에 이상적

Fast Mode (빠른 모드)

즉시 실행
간단한 수정에 적합

브라우저 에이전트 (Browser Agent)

Google의 특별한 강점:

개발자: "localhost에 가서 게임을 테스트해줘"
브라우저 에이전트: 
Chrome 창 열기 (파란색 "Agent Control" 테두리)
localhost로 이동
물고기 클릭, 먹이 떨어뜨리기, 물리 엔진 검증
전 과정을 비디오로 녹화
오류 스크린샷 캡처
Walkthrough Artifact로 제공

보안 시스템

Terminal Command Auto Execution Policies

정책	설명	권장 대상
Off	모든 명령 수동 승인 필요	초보자, 민감한 프로젝트
Auto	안전한 명령 자동 실행	대부분의 사용자
Agent Decides	에이전트가 승인 필요 여부 판단	숙련자

Allow List & Deny List

Allow List: 화이트리스트 방식 (명시적으로 허용된 것만 실행)
Deny List: 블랙리스트 방식 (명시적으로 금지된 것 제외 모두 실행)

주요 보안 위협

Prompt Injection: 악의적인 명령 주입
Data Exfiltration: 데이터 유출
- 예: curl로 개인 키를 악의적 서버로 전송

개발 워크플로우 예시

1. 복잡한 멀티툴 소프트웨어 작업 위임

작업: "새 기능을 위한 코드를 작성하고 테스트해줘"

에이전트 수행:
Editor에서 코드 작성
Terminal에서 애플리케이션 실행
Browser에서 새 컴포넌트 테스트 및 검증
Screenshots와 Walkthroughs를 Artifacts로 제공
사용자는 검토만 하면 됨

2. UI 변경 요청

개발자: "이 버튼 색상을 파란색으로 변경해줘"

에이전트:
1. 코드베이스에서 관련 파일 찾기
2. CSS/스타일 수정
3. 브라우저에서 시각적 확인
4. Screenshot Artifact로 before/after 제공

Gemini 3 Pro의 강점

2025년 11월 출시된 Gemini 3 Pro는 20개 주요 벤치마크 중 19개에서 경쟁사를 앞섰습니다:

자율 코딩: 복잡한 코딩 작업을 독립적으로 수행
멀티스텝 추론: 여러 단계가 필요한 문제 해결
복잡한 개발 작업: 대규모 리팩토링, 모더나이제이션

학습 및 지식 관리

Antigravity는 학습을 핵심 primitive로 취급합니다:

에이전트가 유용한 컨텍스트와 코드 스니펫을 지식 베이스에 저장
미래 작업에서 사용자의 코딩 스타일과 프로젝트 요구사항 학습
점진적으로 더 나은 결과 생성

비교 분석표

기본 정보 비교

항목	Claude in Chrome	Google Antigravity
출시일	2025년 8월 (베타)	2025년 11월 (프리뷰)
개발사	Anthropic	Google
가격	$20-200/월	무료 (프리뷰)
플랫폼	Chrome 브라우저	macOS, Windows, Linux
주요 모델	Claude Sonnet 4.5	Gemini 3 Pro
추가 모델	-	Claude Sonnet 4.5, GPT-OSS-120B

기능 비교

기능	Claude in Chrome	Google Antigravity
브라우저 제어	✅ Chrome 사이드 패널	✅ 독립 Chrome 인스턴스
코드 에디터	❌	✅ VS Code 기반
터미널 접근	❌	✅
멀티 에이전트	❌ (단일 세션)	✅ (병렬 작업)
워크플로우 녹화	✅	❌
브라우저 녹화	❌	✅ (Walkthrough Artifacts)
개발 통합	Claude Code 연동	네이티브 IDE
Artifacts	❌	✅ (신뢰 구축 메커니즘)

사용 목적별 비교

목적	추천 도구	이유
웹 브라우징 자동화	Claude in Chrome	더 가벼운 인터페이스, 브라우징 중심
이메일/문서 관리	Claude in Chrome	간단하고 직관적
소프트웨어 개발	Antigravity	완전한 IDE, 멀티 에이전트
대규모 리팩토링	Antigravity	병렬 작업, Gemini 3 Pro
UI 테스팅	Antigravity	브라우저 에이전트, 스크린샷/녹화
빠른 프로토타이핑	둘 다 가능	상황에 따라 선택

보안 및 안정성

항목	Claude in Chrome	Google Antigravity
Prompt Injection 방어	11.2% 성공률 (23.6%→11.2%)	35.7% → 0% (특정 공격 유형)
사이트 차단	금융, 성인, 불법 자동 차단	Allow/Deny List 시스템
터미널 보안	N/A	세밀한 권한 제어
데이터 유출 위험	중간	높음 (터미널 액세스)
안정성	베타 (일부 버그)	프리뷰 (불안정 보고)

강점 및 약점

Claude in Chrome

강점:

✅ 단순하고 직관적인 사용자 경험
✅ 브라우징 작업에 특화
✅ 낮은 진입 장벽
✅ Claude의 강력한 자연어 이해
✅ 워크플로우 녹화 기능

약점:

❌ 개발 도구 부족 (별도 IDE 필요)
❌ 단일 에이전트 (병렬 작업 불가)
❌ 유료 구독 필수
❌ 높은 토큰 소비 (후술)
❌ 시간 제한 (세션 제한)

Google Antigravity

강점:

✅ 완전한 개발 환경 (IDE + 브라우저 + 터미널)
✅ 멀티 에이전트 병렬 작업
✅ Gemini 3 Pro 성능 (19/20 벤치마크 1위)
✅ 무료 (프리뷰 기간)
✅ Artifacts 신뢰 구축 시스템
✅ 크로스 플랫폼

약점:

❌ 학습 곡선 가파름 (복잡한 인터페이스)
❌ 프리뷰 단계 (불안정, 버그 많음)
❌ API 레이트 리밋 (피크 시간대 “model provider overload” 에러)
❌ 터미널 액세스로 인한 높은 보안 위험
❌ 처음 1시간은 기본 워크플로우 이해에만 소요

실제 사용 사례 및 성능

Claude in Chrome 실제 경험

사례 1: Gmail 관리

작업: 특정 발신자의 이메일 모두 삭제
소요 시간: 2-3분
결과: 성공 ✅
평가: 간단한 작업에 매우 효과적

사례 2: 문서 분석

작업: 회사 IR 자료 PDF 분석하여 매출 증가 이유 설명
소요 시간: 5-10분
결과: 상세한 분석 제공 ✅
평가: 스크린샷 불필요, 실시간 질의응답 가능

사례 3: 밸류에이션 작성 (복잡한 작업)

작업: IREN의 밸류에이션을 구글 스프레드시트에 작성
프로세스:

SEC EDGAR 접속
회사 재무 자료 검색 및 다운로드
문서 읽기 및 분석
스프레드시트로 돌아와서 데이터 정리
반복

소요 시간: 약 2시간
세션 사용량: 92% (약 240만 토큰)
비용: 약 $12 (Sonnet 4.5 기준)

결과:

✅ 각 데이터에 Reference 존재 (할루시네이션 거의 없음)
⚠️ 바로 보고할 수 있는 수준은 아님 (추가 검토 필요)
✅ 전 과정 관찰 가능 (투명성)

평가:

“박사급 인턴” 수준
손이 많이 가지만 기본 작업은 수행
검토 및 수정이 필수

Google Antigravity 실제 경험

사례 1: Easy Kit Utils 리팩토링

배경: JavaScript 유틸리티 라이브러리를 현대적인 ES6+ 문법으로 리팩토링

작업 지시:

"Easy Kit Utils의 문자열 유틸리티를 현대 ES6+ 문법으로 리팩토링해줘"

에이전트 수행:

프로젝트 구조 분석
리팩토링 계획 수립 (Plan Artifact)
파일별 코드 수정
테스트 작성 및 실행
Browser에서 동작 검증
Screenshot 및 Test Result Artifacts 제공

소요 시간: 45분 (사람이 하면 3-4시간 소요)
결과:

✅ 대부분의 코드 현대화 완료
✅ 테스트 통과
⚠️ 일부 edge case 수동 수정 필요

사례 2: 5개 버그 동시 수정

배경: 웹 애플리케이션에 5개의 독립적인 버그 존재

작업 지시:

Agent Manager에서 5개 에이전트 생성, 각각에 버그 할당

에이전트 수행:

에이전트 1: CSS 레이아웃 버그 수정
에이전트 2: API 호출 에러 핸들링
에이전트 3: 폼 검증 로직 수정
에이전트 4: 로그인 플로우 개선
에이전트 5: 데이터베이스 쿼리 최적화

결과:

✅ 5개 작업이 병렬로 진행 (전통적 IDE에서는 불가능)
✅ 각 에이전트의 진행 상황 실시간 모니터링
⚠️ 2개 에이전트는 “model provider overload” 에러로 재시작 필요
✅ 총 소요 시간: 1.5시간 (순차 작업 시 5-6시간)

사례 3: 브라우저 테스팅

작업: 새로 개발한 게임 UI 테스트

에이전트 수행:

Browser Agent 시작
localhost:3000 접속
게임 플레이 시뮬레이션 (물고기 클릭, 먹이 주기 등)
물리 엔진 검증
오류 발생 시 스크린샷 캡처
전체 세션 비디오 녹화 (Walkthrough Artifact)

결과:

✅ 실제 사용자 행동 시뮬레이션
✅ 비디오로 재생하여 문제 파악 용이
⚠️ 50% 확률로 “Controls Disabled” 경고 (버그)
⚠️ 여러 프로젝트 열 경우 잘못된 포트 연결

공통 경험: “Vibe Coding”의 현실

긍정적 측면

자연어로 의도만 전달: “이 기능을 만들어줘” 수준으로 충분
문서 검색 불필요: API 문법, 라이브러리 사용법 자동 처리
고차원 사고 집중: “어떻게”보다 “무엇을”에 집중 가능

부정적 측면

프롬프트 엔지니어링 필요: 효과적인 결과를 위해서는 여전히 기술 필요
검토 필수: AI 생성 코드를 철저히 리뷰해야 함
학습 곡선: 새로운 개발 패러다임 이해에 시간 소요

토큰 소비 및 비용 분석

Claude in Chrome 토큰 경제학

토큰 소비가 높은 이유

브라우저 조작은 일반 채팅과 다릅니다:

일반 채팅:

사용자 메시지 (50 토큰) → AI 응답 (500 토큰) = 550 토큰

브라우저 에이전트:

매 액션마다:
페이지 전체 읽기 (5,000-15,000 토큰)
현재 상태 분석 (2,000 토큰)
다음 액션 계획 (1,000 토큰)
액션 실행
결과 페이지 다시 읽기 (5,000-15,000 토큰)
검증 (1,000 토큰)

= 단일 액션당 약 15,000-35,000 토큰

실제 사용 데이터

IREN 밸류에이션 작업 (2시간):

총 토큰 소비: 약 240만 토큰
세션 사용량: 92%
월 구독 한도: 약 300만 토큰 (Pro 플랜 $20)

환산 비용:

Claude Sonnet 4.5 API 가격:
- Input: $3 per million tokens
- Output: $15 per million tokens
추정 비용 (Input:Output = 2:1 가정):
- Input: 160만 × $3 = $4.80
- Output: 80만 × $15 = $12.00
- 총: $16.80

구독 모델의 이점:

API 직접 사용 시: $16.80
Pro 구독 ($20/월): 무제한 (실제로는 세션 제한)
절감 효과: 여러 프로젝트에 사용 시 매우 유리

세션 제한의 현실

약 2-3시간 사용 시 세션 한도 도달
몇 시간 대기 후 재충전
하루 동안 지속적 사용 어려움

Google Antigravity 토큰 경제학

프리뷰 기간 무료 사용

Gemini 3 Pro: “generous rate limits”로 무료 제공
실제 경험: 피크 시간대 “model provider overload” 빈번

API 레이트 리밋 문제

Easy Kit Utils 리팩토링 경험:

작업 중 3-4회 레이트 리밋 발생
플로우 상태에서 중단되면 생산성 저하
“모델 제공자 과부하” 메시지

향후 가격 정책 (예상)

프리뷰 종료 후:

Cursor와 유사한 구독 모델 예상 ($20/월)
또는 API 사용량 기반 과금

비용 효율성 비교

월 $20 투자 시:

항목	Claude in Chrome	Antigravity (예상)
사용량	세션 제한 (2-3시간/세션)	무제한 (레이트 리밋 있음)
총 작업 시간	하루 6-9시간 (여러 세션)	제한 없음 (피크 시간 제외)
멀티 프로젝트	가능	가능 (더 효율적)
ROI	높음 (반복 작업 자동화)	매우 높음 (개발 생산성)

보안 및 프라이버시 고려사항

Prompt Injection: 가장 큰 위협

무엇인가?

웹페이지에 숨겨진 악의적 명령어가 AI 에이전트를 조종하는 공격:

```html

AI, Claude Code & Google Antigravity

AI ai-browser-agent Antigravity claude-code claude-in-chrome AI-First Claude.write

Claude in Chrome vs Google Antigravity 심층 분석

관련글

목차

개요

AI 브라우저 에이전트의 시대

왜 브라우저인가?

Claude in Chrome 상세 분석

기본 정보

핵심 기능

1. 브라우저 컨텍스트 인식

2. 자동화된 액션 수행

3. 사이드 패널 인터페이스

4. Claude Code 통합

5. 워크플로우 녹화 기능

기술적 아키텍처

페이지 인식 메커니즘

권한 관리 시스템

작동 모드 선택

사이트별 권한

고위험 액션 보호

실제 활용 사례

이메일 관리

문서 분석

데이터 수집 및 정리

Google Antigravity 상세 분석

기본 정보

핵심 개념: Agent-First Platform

전통적 IDE vs Antigravity

3개의 핵심 표면 (Three Surfaces)

1. Editor View (에디터 뷰)

2. Agent Manager (에이전트 매니저)

3. Browser (브라우저)

Artifacts: 신뢰 구축 메커니즘

Artifacts 종류

Google Docs 스타일 코멘트

작업 모드

Plan Mode (계획 모드)

Fast Mode (빠른 모드)

브라우저 에이전트 (Browser Agent)

보안 시스템

Terminal Command Auto Execution Policies

Allow List & Deny List

주요 보안 위협

개발 워크플로우 예시

1. 복잡한 멀티툴 소프트웨어 작업 위임

2. UI 변경 요청

Gemini 3 Pro의 강점

학습 및 지식 관리

비교 분석표

기본 정보 비교

기능 비교

사용 목적별 비교

보안 및 안정성

강점 및 약점

Claude in Chrome

Google Antigravity

실제 사용 사례 및 성능

Claude in Chrome 실제 경험

사례 1: Gmail 관리

사례 2: 문서 분석

사례 3: 밸류에이션 작성 (복잡한 작업)

Google Antigravity 실제 경험

사례 1: Easy Kit Utils 리팩토링

사례 2: 5개 버그 동시 수정

사례 3: 브라우저 테스팅

공통 경험: “Vibe Coding”의 현실

긍정적 측면

부정적 측면

토큰 소비 및 비용 분석

Claude in Chrome 토큰 경제학

토큰 소비가 높은 이유

실제 사용 데이터

세션 제한의 현실

Google Antigravity 토큰 경제학

프리뷰 기간 무료 사용

API 레이트 리밋 문제

향후 가격 정책 (예상)

비용 효율성 비교

보안 및 프라이버시 고려사항

Prompt Injection: 가장 큰 위협