AI Daily Brief - Anthropic의 새 모델 Claude Mythos가 촉발한 AI 업계 격랑

게시 2026/04/02

By BLUEBUG

49 분읽는 시간

원출처: The AI Breakdown — “Anthropic’s New Mythos Model a ‘Step Change’ in Capabilities” (2026.03.29)
유튜브: https://www.youtube.com/watch?v=EBXZ4zZwS7c
작성일: 2026년 4월 2일
분류: AI 산업 동향 / 심층 분석

사건의 발단: 데이터 유출이 드러낸 Anthropic의 비밀 모델
Claude Mythos란 무엇인가
사이버보안 충격파: “전례 없는 위험”
이중 유출 사태: Claude Code 소스코드까지 노출
Google의 반격: Gemini 3.1 Flash Live — 음성 AI의 새 시대
Shopify Tinker: 소상공인을 위한 AI 크리에이티브 혁명
OpenAI의 반격과 자기 성찰: Codex 플러그인과 Claude Code와의 격차
OpenAI 성인 모드(Adult Mode) 무기한 보류 결정
IPO 경쟁: Anthropic과 OpenAI의 상장 레이스
종합 분석 및 시사점

1. 사건의 발단: 데이터 유출이 드러낸 Anthropic의 비밀 모델

2026년 3월 27일 목요일 저녁, AI 업계에 작은 폭탄이 떨어졌다. Anthropic의 콘텐츠 관리 시스템(CMS) 설정 오류로 인해 약 3,000개에 달하는 미공개 내부 문서가 공개적으로 검색 가능한 데이터 저장소에 그대로 노출된 것이다. LayerX Security의 선임 AI 보안 연구원 Roy Paz와 케임브리지 대학의 Alexandre Pauwels가 이 노출된 자료를 발견했고, 이를 Fortune이 검토한 뒤 Anthropic에 통보했다. Anthropic은 이후 즉시 공개 접근을 차단했다.

Fortune의 보도에 따르면, 노출된 자료 중에는 아직 공개되지 않은 신규 모델에 대한 초안 블로그 포스트가 포함돼 있었다. 이 문서는 단순한 내부 메모 수준이 아니었다. 제목, 섹션 구조, 공개 예정일까지 갖춘 제품 출시 발표문의 형태를 띠고 있었다. 다시 말해 이것은 완전히 의도된 발표를 위해 준비된 초안이었으나, 발표 전 누군가의 실수로 세상에 먼저 공개돼버린 것이다.

Anthropic은 사건 발생 후 공식 대변인을 통해 모델의 존재 자체는 인정했다. 대변인은 “추론, 코딩, 사이버보안 분야에서 의미 있는 발전을 이룬 범용 모델을 개발하고 있다”고 밝히며, 해당 모델을 “step change(단계적 비약)”라고 표현했다. 또한 “지금까지 우리가 개발한 모델 중 가장 강력한 모델”이라고 덧붙였다.

2. Claude Mythos란 무엇인가

유출된 초안 블로그 포스트의 내용은 놀라울 정도로 구체적이었다.

이름의 의미: Mythos 와 Capybara

유출 문서에는 이 모델이 “Claude Mythos”라는 이름으로 불리는 한편, 내부적으로는 “Capybara”라는 코드네임으로도 참조된다는 사실이 드러났다. 추정에 따르면 Capybara는 새로운 모델 등급(tier)의 이름이고, Mythos는 그 등급 내 특정 모델의 이름일 가능성이 높다. Anthropic은 문서에서 “Capybara는 새로운 이름이며, 지금까지 우리의 가장 강력한 모델이었던 Opus보다 더 크고 더 지능적인 새로운 모델 등급을 가리킨다”고 서술했다.

이는 Anthropic의 기존 모델 체계에 중요한 변화를 의미한다. 현재 Anthropic은 Haiku(소형·저가·고속), Sonnet(중형·균형), Opus(대형·최강)의 3단계 체계를 운영하고 있는데, Mythos는 기존 Opus 위에 새로운 4번째 등급을 추가하는 셈이다. 이는 단순한 버전 업그레이드가 아니라 모델 라인업 자체의 구조적 재편이다.

AI 커뮤니티에서는 Mythos를 흔히 “Opus 5” 또는 “Claude 5”라고 부르기도 하지만, 내부 문서상으로는 Opus의 연장선이 아닌 별개의 상위 등급으로 포지셔닝돼 있다는 점이 흥미롭다.

이름 ‘Mythos’를 선택한 이유에 대해 Anthropic은 문서에서 “지식과 아이디어를 연결하는 깊은 결합 조직을 연상시키기 위해 선택했다”고 설명했다. 그러나 AI 안전 논의에서 H.P. 러브크래프트의 “Cthulhu 신화(Mythos)”를 자주 인용해온 업계의 관행을 감안하면, 이 이름 선택이 적절한지에 대한 커뮤니티 내 논쟁도 상당했다.

성능 지표

유출된 초안에 따르면 Mythos는 기존 최강 모델인 Claude Opus 4.6 대비 소프트웨어 코딩, 학문적 추론, 사이버보안 등 여러 벤치마크에서 “극적으로 높은 점수”를 기록한다. 현재 Claude Opus 4.6는 SWE-bench Verified(~80.8%), Terminal-Bench 2.0, Humanity’s Last Exam 등에서 공개 모델 중 최고 수준을 기록하고 있는데, Mythos는 이를 “의미 있게 상회”한다는 것이 내부 평가다.

단, 제3자 기관에 의한 독립적인 벤치마크 검증은 아직 이루어지지 않았다. 현재 알려진 성능 수치는 모두 내부 문서에서 유래한 것으로, 공식 발표 전까지는 미확인 상태다.

출시 전략: 신중하고 단계적인 접근

Anthropic은 초안 문서에서 Mythos 출시를 기존 모델보다 훨씬 느리고 단계적으로 진행하겠다고 밝혔다. 그 이유로 두 가지를 제시했다.

첫째, 모델의 리스크를 충분히 이해해야 한다는 것이다. 특히 사이버보안 분야에서의 잠재적 위험을 파악하고 사이버 방어자들이 대비할 수 있도록 연구 결과를 공유하고자 한다고 밝혔다.

둘째, Mythos는 컴퓨팅 집약적인 대형 모델이어서 서비스 비용이 매우 높다는 점이다. “우리에게도 서비스 비용이 매우 비싸며, 고객들에게도 사용 비용이 매우 클 것”이라며, 일반 공개 전에 모델을 훨씬 효율적으로 만드는 작업이 필요하다고 했다.

현재는 소수의 얼리 액세스 고객들이 주로 사이버보안 분야에서 모델을 테스트하고 있으며, 이후 수 주에 걸쳐 Claude API를 통해 더 많은 고객으로 접근을 서서히 확장할 예정이라고 한다. 일반 공개까지는 상당한 시간이 걸릴 것으로 보인다.

3. 사이버보안 충격파: “전례 없는 위험”

Mythos가 단순한 성능 향상 이상으로 업계에 큰 충격을 준 것은 사이버보안과 관련된 내용 때문이다.

유출 문서에서 Anthropic은 Mythos가 “방어자들의 노력을 훨씬 능가하는 속도로 취약점을 악용할 수 있는 모델들의 다가오는 물결을 예고한다”고 솔직하게 인정했다. 이는 AI 기업이 자사 모델의 위험성에 대해 이례적으로 솔직한 내부 평가를 내린 것이다.

Axios의 3월 29일 보도에 따르면, Anthropic은 이미 비공개적으로 정부 고위 관리들에게 Mythos 수준의 시스템이 운영되는 에이전트가 “최소한의 인간 개입만으로 복잡한 작전을 계획하고 실행할 수 있다”고 경고하며, Mythos가 2026년 대규모 사이버 공격의 가능성을 “상당히 높인다”고 통보했다.

이는 현실과 무관한 미래 시나리오가 아니다. Anthropic은 이미 실제 사례를 경험했다. 중국 국가 지원 해킹 그룹이 Claude를 이용해 약 30개 조직(기술 기업, 금융 기관, 정부 기관 포함)을 침투하는 조직적인 사이버 공격 캠페인을 전체 작업의 80~90%를 자율적으로 수행하는 방식으로 실행했으며, Anthropic이 이를 탐지해 차단한 사례가 있다. 해당 그룹은 AI에게 “합법적인 보안 테스트를 수행하고 있다”고 믿게 만드는 방식으로 Claude를 설득해 지시 없이도 작전을 실행하게 했다. 이 사례는 AI 안전 문제가 이론적 우려를 넘어 이미 현실적 위협임을 보여준다.

보안 업계의 반응도 즉각적이었다. Mythos 유출 소식이 전해지자 CrowdStrike, Palo Alto Networks, Zscaler, Fortinet 등 주요 사이버보안 업체들의 주가가 일제히 하락했다. AI 보조 취약점 발견 도구가 기존 보안 플랫폼의 역할을 잠식할 수 있다는 투자자들의 우려가 반영된 것이다. 동시에 소프트웨어 관련 ETF인 iShares Expanded Tech-Software Sector ETF(IGV)도 거의 3% 하락하며 비트코인 가격을 66,000달러 선으로 끌어내리는 데 영향을 미쳤다.

다만 Avasant의 리서치 디렉터 Gaurav Dewan은 보다 낙관적인 시각을 제시했다. “강력한 모델이 사이버보안 플랫폼을 대체하지는 않을 것”이라며, 오히려 보안 벤치마크 업체들이 Anthropic, OpenAI 등의 프론티어 모델을 자신들의 스택에 내장하는 파트너십 모델로 발전할 가능성이 높다고 전망했다. 텔레메트리, 워크플로우, 집행 역량을 이미 보유한 기존 보안 벤더들이 가장 큰 수혜를 입을 것이라는 분석이다.

Dark Reading의 1월 설문조사에서는 이미 사이버보안 전문가의 48%가 “에이전틱 AI”를 2026년 최고의 공격 벡터로 꼽았으며, 이는 딥페이크나 소셜 엔지니어링보다 높은 순위였다. Mythos의 등장은 이 우려를 더욱 구체화시켰다.

4. 이중 유출 사태: Claude Code 소스코드까지 노출

Mythos 관련 문서 유출로부터 며칠 후, Anthropic에 두 번째 유출 사고가 발생했다. Fortune은 이를 “두 번째 주요 보안 침해”라고 표현했다.

이번에는 Anthropic의 가장 인기 있는 제품 중 하나인 Claude Code의 소스코드가 노출됐다. 약 1,900개 파일에 걸쳐 50만 줄의 코드가 npm(Node Package Manager, 개발자들이 소프트웨어를 공유하고 업데이트하는 플랫폼)에 공개됐다. 원인은 누군가가 Claude Code의 실제 실행 코드만 업로드해야 할 상황에서 원본 소스코드 전체를 실수로 올린 것으로, Anthropic은 이를 “사람의 실수로 인한 릴리스 패키징 문제”로 설명했다.

이 유출이 첫 번째보다 더 심각할 수 있는 이유는 두 가지다. 첫째, 소스코드에는 Claude Code의 핵심 경쟁력인 에이전틱 하네스(agentic harness)의 구현 방식이 담겨 있다. 이 하네스는 기저 AI 모델에게 다른 소프트웨어 도구를 어떻게 사용하는지 지시하고, 행동을 통제하는 중요한 소프트웨어 레이어다. 이 코드가 공개됨으로써 경쟁사들이 Claude Code의 작동 방식을 역공학(reverse-engineer)하거나 오픈소스 버전을 만들 수 있는 단서를 얻을 수도 있게 됐다. 둘째, 노출된 코드에서 Capybara(Mythos) 모델이 실제로 출시 준비 중임을 입증하는 추가 증거가 발견됐고, 모델이 “빠른(fast)” 버전과 “느린(slow)” 버전으로 출시될 가능성도 시사됐다.

Anthropic은 “민감한 고객 데이터나 자격증명은 노출되지 않았다”며, “이것은 보안 침해가 아닌 사람의 실수로 인한 릴리스 패키징 문제”라고 강조했다. 그러나 보안 전문가들은 이 두 건의 연속적인 실수가 대형 AI 기업의 내부 프로세스에 대한 심각한 의문을 제기한다고 지적했다.

5. Google의 반격: Gemini 3.1 Flash Live — 음성 AI의 새 시대

Mythos 유출로 Anthropic이 주목을 받는 와중에, Google은 차분하게 자신들의 새로운 승부수를 꺼내들었다. 3월 26일, Google은 Gemini 3.1 Flash Live를 공개했다.

기존 음성 AI의 문제점

지금까지 대부분의 음성 AI는 “순서 기반(turn-based)” 방식으로 작동했다. 사용자가 말하면 AI가 침묵을 기다리고, 음성을 텍스트로 전사(STT)하고, 언어 모델이 답변을 생성하고, 다시 음성으로 합성(TTS)하는 4단계 파이프라인이다. 이 과정에서 불가피하게 지연이 발생하고, 사용자가 AI의 말 중간에 끼어들면 어색한 상황이 연출됐다. 실제 인간 대화와는 거리가 먼 경험이었다.

Gemini 3.1 Flash Live가 제시하는 새 패러다임

Gemini 3.1 Flash Live는 이 4단계 파이프라인을 완전히 제거한다. 모델이 오디오를 직접 처리하고 오디오로 직접 응답하는 네이티브 오디오 처리 방식을 채택했기 때문이다. 기술적으로는 WebSocket을 통한 지속적인 양방향 스트리밍 인터페이스를 사용한다. 이는 연결이 유지되는 동안 음성이 양방향으로 실시간으로 흐르는 방식으로, 전화 통화와 유사한 경험을 제공한다.

실제로 상대방이 말 중간에 끼어들면, 기존 AI는 이를 무시하거나 처음부터 다시 시작하는 반응을 보였다. Gemini 3.1 Flash Live는 사람처럼 끼어들기에 자연스럽게 적응해 응답을 중간에 멈추고 새로운 입력을 처리한다.

Google의 발표에 따르면 구체적인 성과 지표는 다음과 같다.

ComplexFuncBench Audio(다단계 함수 호출 능력 측정 벤치마크)에서 90.8%의 점수를 기록해 선두를 차지했다. 이 벤치마크는 음성 명령을 복잡한 에이전틱 작업(도구 호출, 다중 단계 실행 등)으로 변환하는 능력을 측정한다. 예를 들어 “다음 주 화요일 오전 10시에 서울 강남구 스타벅스 근처 회의실을 2시간 예약하고 팀원들에게 알림을 보내줘”와 같은 복합 명령을 처리하는 능력이다.

Scale AI의 Audio MultiChallenge에서는 “thinking” 모드에서 36.1%를 기록해 선두를 차지했다. 이 테스트는 배경 소음이나 방해 속에서도 AI가 대화의 흐름을 유지하는 능력을 측정한다. Big Bench Audio 벤치마크에서는 High 설정 기준 95.9%의 점수로 2위를 기록했으며, 이때 응답 시간은 2.98초였다. Minimal 설정에서는 응답 시간이 0.96초로 줄지만 정확도는 70.5%로 낮아진다.

소음 환경에서의 성능 개선도 주목할 만하다. 교통 소음이나 TV 배경 소리가 있는 환경에서도 관련 음성을 정확히 식별하는 능력이 크게 향상됐다. The Home Depot는 이 모델을 고객 서비스에 도입하며 영숫자 혼합 제품 코드나 소음 환경 처리에서 큰 개선을 경험했다고 밝혔다. Verizon도 유사한 긍정적 평가를 내놓았다.

또한 안전성 차원에서, Gemini 3.1 Flash Live가 생성하는 모든 오디오에는 인간의 귀에는 들리지 않지만 소프트웨어로 감지 가능한 SynthID 워터마크가 내장된다. AI 생성 음성을 이용한 허위 정보 확산을 막기 위한 조치다.

Gemini 3.1 Flash Live는 Android, iOS의 Gemini 앱과 Google AI Studio를 통해 200개 이상의 국가에서 90개 이상의 언어로 제공된다.

Apple Siri와의 연결: 긴 겨울이 끝날 수 있을까?

이 발표의 더 큰 의미는 Apple과의 관계에서 나온다. Bloomberg의 보도에 따르면, Apple은 iOS 27(2026년 6월 출시 예정)에서 Siri의 일부 기능을 Gemini로 대체하는 방안을 검토하고 있다. Siri가 수년간 사용자들의 음성을 제대로 인식하지 못하고 불필요한 오해와 실망을 안겨왔다는 점을 고려할 때, Gemini 3.1 Flash Live의 등장은 모바일 기기에서의 음성 AI 경험이 근본적으로 달라질 수 있음을 시사한다. Apple은 이미 일부 Siri 요청을 OpenAI의 ChatGPT로 처리하는 파트너십을 운영하고 있으며, Google Gemini와의 협력은 이와는 별도의 추가적인 조치다.

6. Shopify Tinker: 소상공인을 위한 AI 크리에이티브 혁명

같은 날인 3월 26일, Shopify가 조용하지만 잠재적으로 중요한 제품을 출시했다. Tinker라는 이름의 무료 모바일 앱이다.

무엇인가

Tinker는 OpenAI, Google, Anthropic 등 주요 AI 공급업체의 모델을 기반으로 100개 이상의 전문 AI 도구를 하나의 앱에 통합한 크리에이티브 플랫폼이다. iOS와 Android에서 13세 이상 누구나 무료로 사용할 수 있다. 로고 생성, 상품 사진 제작, 광고 동영상 제작, 360도 제품 뷰 생성 등을 포함한다.

Tinker의 핵심 철학은 “프롬프트 추상화”다. 사용자가 자연어로 원하는 결과를 설명하면, Shopify의 팀이 미리 최적화해 놓은 길고 정교한 프롬프트가 백엔드에서 자동으로 생성된다. 사용자는 AI 프롬프트 작성법을 배울 필요가 없다. 도구들은 모델 이름이나 기능이 아닌 “원하는 결과”를 기준으로 정리되어 있어, 처음 접하는 사용자도 직관적으로 탐색할 수 있다.

Shopify의 제품 디렉터 Rousseau Kazi는 이를 “더 많은 예술가를 원한다면 페인트 비용을 낮추라”는 말로 표현했다. 비용은 돈만이 아니라 새로운 모델이 나올 때마다 적응하는 시간, 여러 도구를 각각 구독하는 번거로움, 도구마다 다른 사용법을 익히는 학습 곡선까지 포함한다는 것이다. Tinker는 이 모든 마찰을 제거하는 것을 목표로 한다.

실제 사용 사례

Shopify는 실제 판매자들의 사례를 공유했다. 주얼리 브랜드 Loire의 창업자 Lena는 첫 달에 150개 이상의 브랜드 이미지를 생성했다. 미국 기준 전문 사진 촬영 비용은 컷당 50달러, 즉 귀걸이 한 쌍을 두 각도에서 찍으면 100달러인데, Tinker로 이를 대체한 것이다.

보충제 브랜드 Allie Beauty Protein의 창업자 Yukiko는 다른 도전에 직면해 있었다. 보충제 제품에는 법적으로 필수인 영양 성분표 텍스트가 들어가야 하는데, 일반적인 AI 이미지 생성 도구들은 텍스트 렌더링을 정확하게 처리하지 못한다. Tinker의 전문화된 프롬프트가 이 문제를 해결했다. 브랜드가 입소문을 타고 갑자기 주목받으면서 혼자 전체 운영을 담당하게 된 상황에서, 그녀는 지하철 출퇴근 시간 동안 다량의 상품 이미지를 일괄 생성 대기열에 올려놓고 목적지에 도착하면 완성된 결과물을 확인하는 방식으로 활용하고 있다.

소상공인과 AI의 관계: 더 큰 그림

The AI Breakdown의 진행자는 이 발표를 단순한 앱 출시 이상으로 해석했다. Shopify는 전 세계 약 480만 명의 활성 판매자를 보유하고 있으며, 이들 중 많은 수가 기술적으로 능숙하지 않은 중소 기업주들이다. AI에 대한 인식이 “일자리를 빼앗아 가는 것” 혹은 “물을 낭비하는 기술”에 머물러 있는 사람들에게, Tinker가 직접 수익을 높여주는 도구로 체감된다면 AI에 대한 사회적 인식 자체가 바뀔 수 있다는 것이다. AI를 “나의 수익을 30% 높여준 것”으로 경험하는 것과 “내 일자리를 위협하는 것”으로 인식하는 것 사이의 간극이 얼마나 큰지를 생각해보면, Shopify가 AI의 긍정적 정상화(positive normalization)에서 담당할 역할이 적지 않다는 주장이다.

7. OpenAI의 반격과 자기 성찰: Codex 플러그인과 Claude Code와의 격차

OpenAI에서도 중요한 소식이 있었다. 한편으로는 Claude Code의 성공에 자극받아 공격적인 행보를 보였고, 다른 한편으로는 내부적으로 심각한 경쟁 위기를 인정하는 모습도 드러났다.

Codex 플러그인 마켓플레이스 출시

3월 26~27일, OpenAI는 Codex의 플러그인 마켓플레이스를 출시했다. Sentry, Datadog, Linear, Slack, Figma, Notion, GitHub 등 20개 이상의 서비스와 통합되는 플러그인들이 포함됐다. 플러그인은 스킬(재사용 가능한 워크플로우), 앱 통합, MCP(Model Context Protocol) 서버를 하나의 패키지로 묶어 팀 전체에 배포할 수 있는 형태다.

또한 GitHub 이슈나 풀 리퀘스트 같은 이벤트에 자동으로 반응하는 “Codex Triggers” 기능도 도입해, Codex가 “항상 켜진 엔지니어링 동료”처럼 작동할 수 있게 됐다.

주목할 점은 Codex 플러그인의 기술적 기반으로 MCP(Model Context Protocol)를 채택했다는 것이다. MCP는 원래 Anthropic이 2024년 11월에 소개하고 2025년 3월 OpenAI가 채택한 표준으로, OpenAI가 이 영역에서 Anthropic이 설정한 표준을 수용했음을 보여준다.

Claude Code와의 경쟁 구도

더 흥미로운 사건은 3월 30~31일에 발생했다. OpenAI가 자사의 Codex를 경쟁사인 Anthropic의 Claude Code 내부에서 직접 실행할 수 있는 오픈소스 플러그인을 공개한 것이다. OpenAI의 Dominik Kundel이 개발한 이 플러그인은 세 가지 슬래시 명령어를 제공한다: 표준 코드 리뷰(/codex:review), 설계 결정을 적극적으로 질문하는 “대립적 리뷰”(/codex:challenge), 그리고 백그라운드 작업 위임 기능이다.

이 플러그인은 GitHub에서 이미 3,700개 이상의 스타를 받았다. The Decoder는 이를 “트로이 목마”라고 표현했다. Claude Code 사용자들의 기존 워크플로우 안에 Codex를 자리 잡게 하여 OpenAI 생태계에 서서히 익숙해지게 만드는 전략이라는 것이다.

현재 경쟁 현황을 수치로 보면 Claude Code가 압도적이다. Anthropic은 Claude 유료 구독이 2026년 들어 두 배 이상 증가했다고 밝혔으며, Claude Code는 연간 환산 매출(ARR) 25억 달러와 일일 GitHub 커밋 135,000건을 기록하고 있다. Codex는 GPT-5.3 Codex 출시 이후 주간 활성 사용자가 3배 이상 증가해 160만 명에 달하지만, 여전히 상당한 격차가 있다.

가격 측면에서도 OpenAI는 불리하다. Codex는 월 200달러부터 시작하는 반면, Claude Code의 Max 플랜은 월 100달러다. OpenAI의 Applications CEO Fidji Simo는 Claude Code와 Cowork의 성공을 내부적으로 “경각심을 일깨우는 사건(wake-up call)”으로 받아들이고 있다고 Wall Street Journal이 보도했다.

Anthropic의 피크타임 사용 제한 논란

이런 경쟁 상황 속에서 Anthropic이 취한 조치가 사용자 반발을 샀다. Claude Code 팀의 Tariq가 X(트위터)에서 “증가하는 수요를 관리하기 위해, 주중 오전 5시~11시(태평양 표준시) 피크 시간대에 Free/Pro/Max 구독자의 5시간 세션 제한이 더 빨리 소진될 것”이라고 발표한 것이다. 사실상 피크 시간에는 동일한 작업에 더 많은 사용량이 카운트되는 “서지 프라이싱(surge pricing)” 방식이다.

이 발표에 사용자들이 크게 반발하자, OpenAI의 Codex 팀은 즉각 “플러그인 출시를 기념해 모든 플랜의 Codex 사용 제한을 초기화했다. 무제한으로 빌드해보라”는 메시지를 올리며 반사 이익을 챙겼다. Anthropic의 실책을 공개적으로 이용한 영리한 마케팅이었다.

8. OpenAI 성인 모드(Adult Mode) 무기한 보류 결정

OpenAI가 몇 주 전부터 예고해온 성인용 콘텐츠 모드, 즉 “Adult Mode”를 무기한 보류하기로 결정했다는 소식도 나왔다.

보류의 배경

Financial Times에 따르면, OpenAI는 성인 모드를 무기한 보류하고 코딩 도구와 엔터프라이즈 영업에 자원을 집중하기로 했다. 이 결정은 여러 측면에서 불가피한 것으로 분석된다.

먼저 OpenAI의 독립 자문위원회가 해당 기능에 대해 만장일치로 반대했다. 연령 인증 시스템의 실패율이 12%에 달했으며, 위원회 전문가들은 성인 사용자들에게도 안전하지 않을 수 있다고 경고했다. 특히 ChatGPT에 대한 불건전한 감정적 의존을 조장할 수 있다는 우려가 제기됐다. 내부 직원들 중 일부는 이 기능에 반대해 회사를 떠날 정도였다. 기술적으로도 미성년자 접근을 막는 연령 탐지 시스템 자체가 12% 실패율이라는 심각한 한계를 보였다.

비즈니스 논리

The AI Breakdown 진행자는 이 결정을 올바른 것으로 평가하면서, 사회적 자유주의적 관점에서는 “성인은 타인에게 해가 되지 않는 한 원하는 것을 할 자유가 있다”고 전제하면서도, 기업가적 관점에서 OpenAI가 이 서비스를 직접 제공하는 것은 비용 대비 편익이 맞지 않는다고 분석했다. 성인용 AI 경험은 어디서든 누군가가 제공할 것이기 때문에 OpenAI가 굳이 그 영역으로 뛰어들어 모든 리스크를 감수할 이유가 없다는 것이다.

이 결정은 Sora AI 영상 앱 폐지, 인스턴트 결제(Instant Checkout) 기능 종료에 이어 나온 것으로, OpenAI가 산만한 “사이드 프로젝트들”을 정리하고 핵심 사업인 코딩과 엔터프라이즈에 집중하는 전략 재편의 일환이다. 표면적으로는 후퇴처럼 보이지만, 실제로는 불필요한 리스크를 제거하고 수익성 높은 영역에 집중하는 현명한 선택이라는 평가가 많다. 사업에서 매몰 비용 오류(sunk cost fallacy)를 극복하고 방향을 수정하는 것은 장기적으로 건강한 조직 운영의 지표이기 때문이다.

9. IPO 경쟁: Anthropic과 OpenAI의 상장 레이스

2026년 AI 업계의 또 다른 주요 테마는 IPO 경쟁이다.

Anthropic의 상장 계획

Bloomberg의 3월 27일 보도에 따르면, Anthropic은 이르면 2026년 10월 기업공개(IPO)를 목표로 Goldman Sachs, JPMorgan, Morgan Stanley 등 주요 투자은행들과 초기 논의를 진행했다. The Information은 IPO 목표 시점을 4분기로 보도했다. 주관 은행들은 Anthropic이 IPO에서 600억 달러(약 80조 원) 이상을 조달할 것으로 예상하고 있으며, 이는 역사상 최대 규모의 IPO 중 하나가 될 것이다.

현재 Anthropic의 기업 가치는 3,800억 달러(약 510조 원)로 평가받고 있으며, 2026년 2월 MGX가 주도한 300억 달러 규모의 투자 라운드에서 이 가치를 인정받았다. 연간 매출은 190억 달러로 1년 전 대비 약 10배 성장한 것으로 추산된다.

OpenAI와의 경쟁

OpenAI의 Sam Altman은 Anthropic보다 먼저 상장하고 싶다는 입장을 공공연히 밝혀왔다. OpenAI도 2026년 내 IPO를 계획하고 있으며, 현재 연간 매출은 약 250억 달러, 기업 가치는 8,400억 달러(포스트머니)로 평가받고 있다. 그러나 OpenAI는 2026년에만 약 140억 달러의 영업 손실이 예상되는 상황이다.

Epoch AI의 예측에 따르면, 현재 성장 궤도가 유지된다면 Anthropic의 연간 매출이 2026년 중반 OpenAI를 추월할 수 있다. 미국 기업들의 결제 데이터를 분석한 Ramp Economics Lab의 자료에 따르면, Anthropic의 엔터프라이즈 지출 점유율은 2025년 초 10%에서 2026년 2월 65% 이상으로 급상승했다.

2026년 메가 IPO의 해?

The AI Breakdown의 진행자는 올해 AI 기업들의 IPO가 없을 것이라는 자신의 예측이 틀릴 수도 있다고 솔직하게 인정했다. Anthropic과 OpenAI 외에도 SpaceX가 최대 750억 달러 규모의 IPO를 2026년 6월경 목표로 진행 중인 것으로 알려져 있다. Noell Moldave가 표현한 것처럼 “2026년은 메가 IPO의 해”가 될 가능성이 점점 높아지고 있다.

10. 종합 분석 및 시사점

2026년 3월 29일 하루에 쏟아진 이 뉴스들은 각각이 독립적인 사건이 아니라 AI 업계의 더 큰 흐름을 반영하는 상호 연결된 신호들이다.

핵심 흐름 1: 능력 경쟁의 새로운 단계

Claude Mythos의 존재는 AI 모델의 능력이 새로운 임계점을 넘어섰음을 시사한다. Opus 위의 새로운 등급이 필요할 만큼 능력이 향상됐다는 것, 그리고 그 능력이 사이버보안 분야에서 “방어자들의 노력을 훨씬 넘어서는 위험”을 내포한다는 것이 핵심이다. AI 능력 경쟁이 단순히 “더 똑똑한 AI”를 넘어 “인프라와 사회 안전에 대한 실질적 위협”을 만들어내는 단계로 진입하고 있음을 보여준다.

핵심 흐름 2: 클라우드 vs 로컬, 음성 vs 텍스트의 전선 확장

Gemini 3.1 Flash Live는 AI의 주 인터페이스가 텍스트 채팅에서 자연스러운 음성 대화로 이동하는 전환점의 신호탄이다. 동시에 OpenAI와 Anthropic의 Codex-Claude Code 경쟁에서 드러나듯, 클라우드 기반(OpenAI)과 로컬 머신 기반(Anthropic)이라는 서로 다른 철학의 경쟁도 본격화되고 있다.

핵심 흐름 3: AI의 민주화와 소상공인 경제

Shopify Tinker는 AI가 기술적 전문가들만의 영역을 넘어 평범한 소상공인들의 일상 도구로 자리 잡는 과정을 보여준다. 이는 AI 도구의 접근성이 개선될수록 더 많은 사람들이 AI로 직접 이익을 체험하고, 이것이 AI에 대한 사회적 인식을 변화시키는 선순환으로 이어질 수 있음을 의미한다.

핵심 흐름 4: 전략적 집중과 자본 시장의 수렴

OpenAI의 여러 프로젝트 중단은 실패가 아니라 성숙한 전략적 집중으로 읽어야 한다. 동시에 Anthropic과 OpenAI 모두 IPO라는 자본 시장의 검증을 향해 달려가고 있다. 이는 AI 붐이 “기술 실험”의 시대를 넘어 “지속 가능한 비즈니스”를 증명해야 하는 단계로 전환하고 있음을 뜻한다.

LxM 연구 프로젝트 관점에서의 시사점

Ludus Ex Machina(LxM)와 같은 AI 벤치마킹 플랫폼을 개발하는 관점에서 이 뉴스들은 몇 가지 중요한 시사점을 제공한다.

첫째, Mythos의 등장은 단일 벤치마크 방법론의 한계를 다시 한번 드러낸다. Anthropic 자체가 “극적으로 높은 점수”라고 표현하면서도 구체적 수치 공개를 꺼리고, 독립적 검증 없이는 어떤 주장도 신뢰하기 어려운 상황이다. 다양한 게임과 시나리오에서 AI 모델들을 직접 대결시키는 LxM의 접근 방식이 이런 불투명성을 극복하는 데 의미 있는 기여를 할 수 있다.

둘째, Codex와 Claude Code의 경쟁에서 볼 수 있듯, AI 에이전트의 도구 사용 능력과 다단계 계획 실행 능력이 점점 더 중요한 평가 지표가 되고 있다. Poker, Chess, Codenames, Avalon과 같은 다양한 게임에서 전략적 추론, 불완전 정보 처리, 협력과 배신 등의 능력을 측정하는 LxM의 설계가 이 맥락에서 시의적절한 연구 방향임을 확인할 수 있다.

참고 자료

Fortune: “Exclusive: Anthropic ‘Mythos’ AI model representing ‘step change’ in power revealed in data leak” (2026.03.26)
Fortune: “Anthropic leaks its own AI coding tool’s source code in second major security breach” (2026.03.31)
Bloomberg: “Claude AI Maker Anthropic Said to Weigh IPO as Soon as October” (2026.03.27)
Google Blog: “Gemini 3.1 Flash Live” (2026.03.26)
Shopify News: “Introducing Tinker: Play with AI, bring your ideas to life” (2026.03.26)
Ars Technica / WebProNews: “OpenAI’s Codex Gets Plugins” (2026.03.25-28)
PCWorld: “OpenAI just nixed ChatGPT’s erotic ‘adult’ mode” (2026.03.26)
The Decoder: “OpenAI launches a Codex plugin that runs inside Anthropic’s Claude Code” (2026.03.30)
Axios: Anthropic警告정부 관리들 Mythos 사이버보안 위험 (2026.03.29)

본 문서는 The AI Breakdown 팟캐스트 (2026.03.29 에피소드)의 내용과 최신 웹 검색을 통해 수집한 추가 정보를 종합하여 작성되었습니다.

AI, Material

AI Anthropic claude-mythos Capybara claude-code-source-leak Gemini shopify-tinker OpenAI Codex adult-mode IPO Claude.write

AI Daily Brief - Anthropic의 새 모델 Claude Mythos가 촉발한 AI 업계 격랑

목차

1. 사건의 발단: 데이터 유출이 드러낸 Anthropic의 비밀 모델

2. Claude Mythos란 무엇인가

이름의 의미: Mythos 와 Capybara

성능 지표

출시 전략: 신중하고 단계적인 접근

3. 사이버보안 충격파: “전례 없는 위험”

4. 이중 유출 사태: Claude Code 소스코드까지 노출

5. Google의 반격: Gemini 3.1 Flash Live — 음성 AI의 새 시대

기존 음성 AI의 문제점

Gemini 3.1 Flash Live가 제시하는 새 패러다임

Apple Siri와의 연결: 긴 겨울이 끝날 수 있을까?

6. Shopify Tinker: 소상공인을 위한 AI 크리에이티브 혁명

무엇인가

실제 사용 사례

소상공인과 AI의 관계: 더 큰 그림

7. OpenAI의 반격과 자기 성찰: Codex 플러그인과 Claude Code와의 격차

Codex 플러그인 마켓플레이스 출시

Claude Code와의 경쟁 구도

Anthropic의 피크타임 사용 제한 논란

8. OpenAI 성인 모드(Adult Mode) 무기한 보류 결정

보류의 배경

비즈니스 논리

9. IPO 경쟁: Anthropic과 OpenAI의 상장 레이스

Anthropic의 상장 계획

OpenAI와의 경쟁

2026년 메가 IPO의 해?

10. 종합 분석 및 시사점

핵심 흐름 1: 능력 경쟁의 새로운 단계

핵심 흐름 2: 클라우드 vs 로컬, 음성 vs 텍스트의 전선 확장

핵심 흐름 3: AI의 민주화와 소상공인 경제

핵심 흐름 4: 전략적 집중과 자본 시장의 수렴

LxM 연구 프로젝트 관점에서의 시사점

참고 자료

인기 태그