Claude의 순환들 — AI가 수학 미해결 문제를 푼 역사적 사건 분석

게시 2026/03/08

By BLUEBUG

39 분읽는 시간

원문: Donald Knuth, “Claude’s Cycles” (Stanford University, 2026년 2월 28일 / 3월 2일 개정)
원문 PDF: https://www-cs-faculty.stanford.edu/~knuth/papers/claude-cycles.pdf
GeekNews 토론: https://news.hada.io/topic?id=27183

들어가며: 충격의 순간

2026년 2월, 컴퓨터 과학의 전설 도널드 크누스(Donald Knuth)는 스스로 “충격”이라는 단어로 시작하는 보고서를 썼다. 그가 몇 주 동안 매달려 있던 미해결 문제를 Anthropic의 AI 모델 Claude Opus 4.6이 단 한 시간 만에 풀어냈기 때문이다.

크누스는 The Art of Computer Programming 시리즈의 저자로, 알고리즘과 프로그래밍의 성경이라 불리는 이 책은 컴퓨터 과학자라면 반드시 거쳐야 할 고전이다. 그러한 거장이 “AI에 대한 내 견해를 재고해야 할 것 같다”고 솔직하게 고백했다는 사실 자체가 이 사건이 얼마나 특별한 것인지를 말해준다. 이 문서는 그 사건의 전말과 수학적 의미, 그리고 AI와 인간 협업이 가져온 새로운 가능성을 깊이 있게 살펴본다.

1장. 문제의 탄생 — 방향성 해밀토니안 순환이란 무엇인가

1.1 해밀토니안 순환의 개념

수학에서 해밀토니안 순환(Hamiltonian cycle) 이란 그래프의 모든 꼭짓점(vertex)을 정확히 한 번씩 방문하고 출발점으로 돌아오는 경로를 말한다. 이 개념은 19세기 아일랜드 수학자 윌리엄 로완 해밀턴(William Rowan Hamilton)이 도입한 것으로, 이후 그래프 이론의 핵심 문제 중 하나가 되었다.

방향성 해밀토니안 순환(directed Hamiltonian cycle) 은 각 간선(edge, 혹은 방향 그래프에서는 호(arc)라 부른다)이 방향을 갖는 경우다. 즉 A에서 B로 가는 간선이 있다고 해서 B에서 A로도 갈 수 있는 건 아니다. 이는 실생활에서 일방통행 도로망에 해당하는 구조다.

1.2 크누스가 정의한 문제

크누스가 마주한 문제는 다음과 같은 특수한 방향 그래프에서 출발한다.

그래프의 정의:

꼭짓점의 수: m³개 (m이 자연수일 때)
각 꼭짓점은 세 자리 숫자 조합 (i, j, k)로 표현되며, 각 좌표는 0 이상 m-1 이하의 정수다
각 꼭짓점에서 정확히 세 개의 나가는 호(arc)가 존재한다:
- i⁺jk : i를 1 증가 (mod m)
- ij⁺k : j를 1 증가 (mod m)
- ijk⁺ : k를 1 증가 (mod m)

여기서 i⁺ = (i+1) mod m이다.

목표: 이 그래프의 모든 호를 세 개의 방향성 m³-순환으로 분해하는 것. 즉, 세 개의 경로를 찾아서 각 경로가 m³개의 꼭짓점을 모두 한 번씩 방문하고, 이 세 경로에 쓰인 간선들을 합치면 그래프의 모든 호가 정확히 한 번씩 포함되어야 한다.

1.3 문제의 난이도와 배경

크누스는 m=3인 경우(즉, 27개의 꼭짓점으로 이루어진 그래프)에 대해서는 이미 해법을 구했고, 이를 The Art of Computer Programming 미래 권(volume)의 연습문제 해답으로 수록할 예정이었다. 그런데 모든 m>2에 대한 일반 해법이 좀처럼 나오지 않았다.

크누스의 친구 Filip Stappers는 경험적 탐색을 통해 m=4부터 m=16까지의 경우에서 해법을 발견했다. 이로써 m≤2를 제외한 모든 경우에 해법이 존재할 것이라는 강한 정황 증거는 쌓였지만, 일반 해법의 수학적 구성과 증명은 여전히 미해결로 남아 있었다.

2장. Claude의 투입 — Filip Stappers의 실험

2.1 실험 설계

크누스의 친구 Filip Stappers가 Claude Opus 4.6에게 문제를 제시하는 방식은 매우 체계적이었다. 그는 크누스가 원래 정의한 그대로의 문장으로 문제를 제시하면서, 중요한 지시를 추가했다.

** After EVERY exploreXX.py run, IMMEDIATELY update this file [plan.md]
before doing anything else. ** No exceptions. Do not start the next exploration
until the previous one is documented here.

이 지시의 핵심은 진행 과정의 문서화를 강제하는 것이다. Claude가 각 탐색 단계 후 반드시 자신의 발견과 현재 이해를 기록하게 함으로써, 세션 전반에 걸쳐 컨텍스트와 방향성을 유지할 수 있게 했다. 이는 일종의 “작업 일지” 기법으로, AI 에이전트의 장기 탐색을 안내하는 데 매우 효과적인 방법이다.

사용된 모델은 Claude Opus 4.6 — Anthropic의 혼합 추론(hybrid reasoning) 모델로, 단순 응답 생성을 넘어 다단계의 계획, 코드 실행, 결과 분석, 전략 수정을 반복적으로 수행할 수 있는 모델이다.

2.2 Claude의 탐색 여정 — 31단계의 지적 도전

Claude의 탐색은 수학적 재정의에서 시작해 점진적으로 더 깊은 구조적 통찰로 나아가는 인상적인 여정이었다.

[탐색 1단계: 문제의 재정의]

Claude는 가장 먼저 문제를 다른 언어로 번역했다. 수학적 재정의의 내용은 다음과 같다: “각 꼭짓점 v에서 {0, 1, 2}의 순열 σ(v)를 배정해야 한다. 순환 c는 꼭짓점 v에서 방향 σ(v)[c]로 이동한다. 각 결과 함수 그래프는 단일 해밀토니안 순환이어야 한다.”

이렇게 문제를 순열 배정 문제로 재정의한 것은 탁월한 출발점이었다. 이어서 Claude는 가장 단순한 해법 — 선형 함수나 2차 함수로 순열을 결정하는 방법 — 을 시도했지만 실패했다.

[탐색 2단계: DFS 탐색]

무차별 탐색(brute-force DFS)을 m=3에 적용했지만, 탐색 공간이 6²⁷에 달해 적절한 가지치기 없이는 너무 느렸다. 이 단계는 실패였지만, 문제의 계산 복잡도를 파악하는 데 도움이 됐다.

[탐색 3단계: 2D 뱀형 패턴 분석]

이 단계에서 Claude는 놀라운 통찰을 보였다. 2D 케일리 그래프(Cayley digraph)에서 “뱀형(serpentine) 패턴”이 해밀토니안 순환을 형성한다는 것을 발견한 것이다. 크누스는 이를 “정말 인상적”이라고 평가했다. Claude가 스스로 수학적 구조를 인식하고, 그것에 새로운 이름(“serpentine pattern”)까지 붙인 것은 단순한 패턴 매칭을 넘어선 창의적 개념화의 시작이었다.

[탐색 4단계: 3D 뱀형 패턴]

2D 패턴을 3D로 확장한 시도. 결과적으로 이 패턴은 “모듈식 m진 Gray 코드”와 동일한 고전적 수열임이 밝혀졌다. 이 순환을 그래프에서 제거한 후 남은 구조를 분석했지만, 해밀토니안 분해를 완성하기에는 충분하지 않았다.

[탐색 5~14단계: 연속적 실패와 학습]

잔여 그래프 분석, 하이퍼플레인 기반 조건 탐색 등 다양한 방법을 시도했으나 모두 유망한 결과를 내지 못했다. 그러나 이 과정은 결코 낭비가 아니었다. 각 실패는 어떤 접근이 왜 작동하지 않는지에 대한 이해를 축적시켰다.

[탐색 15단계: 섬유 분해의 등장]

전환점이 된 핵심 아이디어가 드디어 나타났다. Claude는 섬유 분해(fiber decomposition) 라는 개념을 도입했다.

핵심 아이디어: s = (i+j+k) mod m이라는 값을 기준으로 꼭짓점들을 “층(fiber)”으로 나누는 것이다. 이 지도(map) φ(i,j,k) = (i+j+k) mod m은 모든 호를 섬유 Fₛ에서 Fₛ₊₁로 보내는 성질이 있다. 즉 그래프는 이 기준으로 층화된 구조를 가진다.

이 관찰을 통해 문제를 “각 섬유 내에서 (i,j)에 어떤 순열을 배정할 것인가”로 단순화할 수 있게 됐다.

[탐색 18단계: 코드 구현과 m=3 해결]

섬유 프레임워크를 실행 가능한 코드로 구현하여, m=3에서 완전한 역추적(backtracking) 탐색으로 유효한 분해를 0.1초 만에 발견했다. 중요한 특징: 이 해법에서 s=0인 섬유의 순열은 (i,j)에 무관하게 일정했다.

[탐색 20단계: 시뮬레이티드 어닐링으로 m=4 시도]

m=4에서 시뮬레이티드 어닐링(Simulated Annealing, SA)을 적용해 부분적 해를 찾았다. 이 과정에서 섬유 0에서의 균일한 선택과 나머지 섬유에서의 뱀형 패턴 조합이 홀수 m에서만 효과가 있다는 단서를 얻었다.

[탐색 21~25단계: 시뮬레이티드 어닐링의 한계 직면]

대규모 SA 실험을 진행했지만, “SA는 해를 찾을 수 있지만 일반 구성(general construction)을 줄 수 없다. 순수 수학이 필요하다”는 결론에 도달했다. 이는 매우 중요한 자기 인식이다. 단순히 특정 경우의 해를 찾는 것이 아니라, 일반화 가능한 패턴을 찾아야 한다는 방향 전환이었다.

[탐색 27단계: 아슬아슬한 접근]

세 개의 순환을 모두 좌표 순환(cyclic coordinate rotation)으로 생성하는 방법을 시도했다. m=3~9에서 세 순환 모두 해밀토니안이었지만, m³개의 꼭짓점 중 3(m-1)개의 꼭짓점에서 충돌이 발생했다. 모든 충돌이 하이퍼플레인 i+j+k ≡ m-1 (mod m) 위에 있었다. 아깝지만 완전한 해법은 아니었다.

[탐색 29단계: 부정적 결과의 활용]

여러 유망해 보이는 시나리오들이 실제로 불가능함을 증명했다. “이것은 ‘단일 하이퍼플레인 + 회전’ 접근을 완전히 제거한다. 방향 함수가 회전 궤도에서 서로 다른 값을 사용해야 한다.” 이처럼 부정적 결과도 탐색 공간을 좁히는 데 기여했다.

[탐색 30~31단계: 돌파구]

탐색 30에서 Claude는 탐색 20에서 SA로 찾은 해법을 다시 검토하다가 결정적인 패턴을 발견했다. 각 섬유에서의 순열 선택이 단 하나의 좌표에만 의존한다는 것이다:

s=0일 때: j 좌표에만 의존
s=1, s=2일 때: i 좌표에만 의존

이 관찰을 바탕으로 탐색 31에서 구체적인 Python 프로그램을 작성했고, m=3, 5, 7, 9, 11 모두에서 완전한 세 개의 해밀토니안 순환 분해를 확인했다.

3장. Claude의 해법 — 구체적 내용

3.1 알고리즘의 구조

Claude가 발견하고 크누스가 C 코드로 단순화한 해법의 핵심은 다음과 같다.

  
int c, i, j, k, m, s, t;
char *d;
for (c = 0; c < 3; c++) {
    for (t = i = j = k = 0; ; t++) {
        printf("%x%x%x ", i, j, k);
        if (t == m*m*m) break;
        s = (i+j+k) % m;
        if (s == 0) d = (j == m-1 ? "012" : "210");
        else if (s == m-1) d = (i > 0 ? "120" : "210");
        else d = (i == m-1 ? "201" : "102");
        switch (d[c]) {
            case '0': i = (i+1) % m; break;
            case '1': j = (j+1) % m; break;
            case '2': k = (k+1) % m; break;
        }
    }
    printf("\n");
}

이 코드는 세 개의 순환(c=0, 1, 2)을 각각 생성한다. 각 순환에서 다음 꼭짓점으로 이동할 때 어떤 좌표를 증가시킬지가 d[c]로 결정된다.

3.2 순환 c=0의 규칙 (자세한 설명)

s = (i+j+k) mod m 값에 따라 규칙이 달라진다:

s = 0일 때: j가 m-1이면 i를 증가(bump), 그렇지 않으면 k를 증가
0 < s < m-1일 때: i가 m-1이면 j를 증가, 그렇지 않으면 k를 증가
(정정: 실제 코드의 “102”는 c=0에서 k 증가를 의미)
s = m-1일 때: i > 0이면 j를 증가, i=0이면 k를 증가

3.3 m=3 경우의 예시 순환

위 규칙을 m=3에 적용하면, 첫 번째 순환(c=0)은 다음과 같다:

→ 002 → 000 → 001 → 011 → 012 → 010 → 020 → 021 →
→ 101 → 111 → 112 → 122 → 102 → 100 → 110 → 120 →
→ 221 → 201 → 202 → 200 → 210 → 211 → 212 → 222 → 022

총 27개의 꼭짓점이 정확히 한 번씩 등장하고 출발점으로 돌아온다. 이것이 바로 m³=27 길이의 해밀토니안 순환이다.

3.4 나머지 두 순환의 규칙

두 번째 순환 (c=1):

s=0이면 j를 증가
0 < s < m-1이면 i를 증가
s=m-1이고 i > 0이면 k를 증가
s=m-1이고 i=0이면 j를 증가

세 번째 순환 (c=2):

s=0이고 j < m-1이면 i를 증가
s=0이고 j=m-1이면 k를 증가
0 < s < m-1이고 i < m-1이면 k를 증가
0 < s < m-1이고 i=m-1이면 j를 증가
s=m-1이면 i를 증가

4장. 수학적 증명 — 크누스의 기여

4.1 증명의 필요성과 접근 방식

Claude가 Python 프로그램을 작성하고 Filip Stappers가 m=3에서 101까지의 홀수 m에 대해 검증했다고 해서 수학적 증명이 완료된 것은 아니다. 수학에서 무한히 많은 경우에 대한 주장은 반드시 일반적 증명이 필요하다. 크누스는 바로 이 작업을 담당했다.

4.2 첫 번째 순환의 증명 아이디어

증명의 핵심 관찰은 세 가지다.

첫째, i 좌표의 독립적 블록 구조: i 좌표가 변하는 것은 오직 s=0이고 j=m-1일 때뿐이다. 따라서 같은 i 값을 가진 m²개의 꼭짓점들은 모두 연속적으로 등장한다.

둘째, s=0에서의 j 값 변화 패턴: i=0인 꼭짓점들의 방문 순서를 분석하면, s=0에서 만나는 꼭짓점들의 k 성분이 매번 2씩 증가(mod m)한다는 것을 보일 수 있다. m이 홀수이므로, 2와 m은 서로소(gcd=1)여서 결국 s=0에서 가능한 모든 꼭짓점을 방문하게 된다.

셋째, i=m-1 구간의 처리: i=m-1인 꼭짓점들에서는 규칙이 바뀌지만, 유사한 논증으로 모든 꼭짓점이 방문됨을 보일 수 있다.

이로써 m이 홀수일 때 첫 번째 순환이 m³ 길이의 해밀토니안 순환임이 수학적으로 증명된다. 이 증명에서 m이 홀수여야 한다는 조건이 결정적으로 사용된다는 점이 흥미롭다.

4.3 일반화 가능성의 이론

크누스는 더 나아가 Claude의 해법이 하나의 특수한 사례임을 보이고, 더 광범위한 이론적 틀을 수립했다.

일반화 가능한 순환의 정의: m=3에서 정의된 해밀토니안 순환 C가, 임의의 홀수 m에 대해서도 해밀토니안 순환을 생성하는 자연스러운 방법으로 확장될 수 있을 때, C를 일반화 가능(generalizable) 하다고 한다.

일반화의 방법: 임의의 꼭짓점 IJK (0 ≤ I, J, K < m)에 대해:

S = (I+J+K) mod m를 계산
s를 S의 “압축” 값으로 변환 (0→0, m-1→2, 그 외→1)
k = (s-i-j) mod 3 계산
C에서 ijk의 후속자가 어느 방향으로 이동하는지 확인
그 방향으로 IJK의 후속자를 결정

계산 결과: m=3에서 총 11,502개의 해밀토니안 순환이 존재한다. 이 중:

1,012개가 m=5로 일반화 가능
996개가 m=5와 m=7 모두로 일반화 가능
이 996개는 모든 홀수 m>1에 대해 일반화 가능

4.4 Claude-like 분해의 정의와 정리

크누스는 Claude가 발견한 해법의 특성을 추상화하여 “Claude-like 분해”라는 개념을 정의했다.

정의: 분해가 “Claude-like”이려면, 순열 d의 선택이 i, j, s의 경계값(0 또는 m-1 또는 그 외)에만 의존해야 한다.

주요 정리: Claude-like 분해가 모든 홀수 m>1에 대해 유효하기 위한 필요충분조건은, m=3에서 그것이 정의하는 세 순환 모두가 일반화 가능한 해밀토니안 순환이어야 한다는 것이다.

이 정리를 이용하면 가능한 모든 Claude-like 분해를 체계적으로 열거할 수 있다. 4,554개의 3×3×3 분해 해법 중, 모두 일반화 가능한 순환만으로 이루어진 것은 정확히 760개다.

크누스는 Claude가 발견한 해법이 이 760개 중 하나임을 확인했고, 다른 해법들과 비교했을 때 딱히 더 “예쁘거나” 더 “단순한” 것은 아니었다고 언급한다.

5장. 짝수 m의 미스터리

5.1 왜 짝수는 다른가

홀수 m에 대한 아름다운 성공과 대조적으로, 짝수 m의 경우는 여전히 미해결 상태다.

m=2의 경우는 이미 1982년에 Aubert와 Schneider에 의해 분해가 불가능함이 증명되었다. 그렇다면 m=4, 6, 8, …은 어떨까?

5.2 Claude의 한계

Claude는 m=4, 6, 8에서 부분적인 해를 찾았다고 보고했지만, 홀수 m처럼 일반화할 수 있는 패턴을 발견하지는 못했다. 더불어, 짝수 케이스 탐색 도중 Claude의 동작이 이상해졌다.

Filip Stappers는 이렇게 설명했다: “홀수 케이스가 해결된 후 짝수 케이스로 계속 진행하도록 요청했지만, 어느 순간부터 탐색 프로그램을 제대로 작성하고 실행하지도 못하게 됐다. 매우 이상했다. 그래서 탐색을 중단했다.”

5.3 컨텍스트 소진 문제

HN(Hacker News) 커뮤니티의 분석에 따르면, 이는 아마도 LLM의 컨텍스트 윈도우 소진 문제일 가능성이 높다. 긴 세션 동안 누적된 탐색 기록이 컨텍스트를 가득 채우면, 모델의 성능이 급격히 저하되는 현상(“dumb zone”이라고 불림)이 발생한다. 컨텍스트 압축(compacting)이나 세션 재시작 없이는 이 문제를 피하기 어렵다.

이는 현재 AI 에이전트 기반 수학 탐색의 실질적인 한계를 보여주는 사례다. Filip의 plan.md 기법이 이 문제를 완화하는 데 도움이 됐지만, 완전히 해결하지는 못한 것으로 보인다.

6장. 성과의 평가 — 누가 무엇을 했나

6.1 크누스의 평가

크누스는 이 결과를 “AI 기반 자동 추론의 역사적 성취”로 평가하며, “Claude Shannon의 이름에 걸맞은 진보”라고 언급했다. 이는 AI 모델의 이름인 Claude가 전설적인 정보이론의 창시자 Claude Shannon과 같은 이름임을 활용한 멋진 언어유희이기도 하다.

주목할 점은, 2023년 크누스가 GPT-4와의 대화 후 생성형 AI에 대해 다소 회의적인 입장을 표명했다는 것이다. 그런데 이번에는 스스로 “AI에 대한 견해를 재고해야 할 것”이라고 말했다. 새로운 증거에 따라 생각을 바꾸는 이 솔직함은 진정한 과학자의 태도라 할 수 있다.

6.2 공로의 배분

누가 진짜 문제를 “푼” 것인가? 이는 HN 커뮤니티에서도 활발히 논의된 주제다.

Claude의 기여:

31단계에 걸친 체계적 탐색과 전략 수정
섬유 분해라는 핵심 수학적 프레임워크 발견
구체적인 Python 알고리즘 구성
탐색 실패에서 배우고 방향을 전환하는 능력

인간(Filip Stappers)의 기여:

적절한 문제 제시와 문서화 강제 지침 설계
탐색이 막힐 때의 재시작과 리마인드
m=3에서 101까지의 검증
크누스에게 결과 전달

크누스의 기여:

문제의 원래 정의 및 m=3 해법
일반화 이론의 수립
엄밀한 수학적 증명
Claude-like 분해의 완전한 분류(760개)

크누스 본인은 이를 “careful human guidance”라고 표현했는데, 실제로는 Claude가 자주 멈추거나 오류를 낼 때 인간이 리마인드해주는 수준이었다는 평가도 있다. 어쨌든 이번 성취는 AI와 인간의 시너지가 만들어낸 결과임이 분명하다.

7장. 더 넓은 시각 — AI와 수학 연구의 미래

7.1 이번 사건이 시사하는 바

이번 사건은 몇 가지 중요한 함의를 지닌다.

방대한 탐색과 빠른 반성: LLM은 지치지 않고 반복적으로 가설을 세우고, 실패하고, 반성하고, 방향을 바꾼다. 이 능력은 수학 탐색에서 강력한 도구가 된다.

방향 설정의 중요성: Claude의 탐색에서 핵심적인 돌파구는 항상 “어떻게 생각할 것인가”의 재정의에서 나왔다. 섬유 분해 도입이 그 예다. 인간이 방향을 제시하거나 Claude 스스로 프레임을 바꾸는 능력이 결정적이었다.

코드 실행과 즉각적 피드백: Claude가 탐색 중 직접 Python 코드를 작성하고 실행하여 결과를 확인한 것은 순수 언어 추론의 한계를 보완하는 핵심 요소였다.

7.2 RL 확장성과 미래 전망

HN 커뮤니티의 한 댓글은 이번 사건을 강화학습(RL) 기반 추론의 확장성이라는 관점에서 분석했다. 이전에는 이런 수학적 탐색이 전문 수학자의 직관과 경험에 의존해야 했다면, 이제는 모델의 확률 분포 안에 그러한 패턴이 내재화되어 누구나 접근할 수 있게 됐다는 것이다.

흥미로운 순환 논리도 제기됐다: AI의 추론 결과가 미래 AI 학습 데이터가 될 수 있다. 이렇게 되면 모델은 자신의 탐색 결과로부터 배우는 자기강화 루프를 형성할 수 있다. 2030년에는 오히려 Claude가 Anthropic을 최신 상태로 유지하게 될지도 모른다는 반농담 섞인 전망도 나왔다.

7.3 LLM의 “생각”에 대한 철학적 질문

“LLM은 다음 단어를 예측하는 기계에 불과하다”는 비판적 시각이 있다. 하지만 이번 사건은 그 단순한 메커니즘이 어떻게 실제 수학적 문제 해결로 이어질 수 있는지를 보여준다.

한 HN 댓글은 이를 이렇게 표현했다: “만약 아인슈타인이 다음에 말할 단어를 완벽히 예측할 수 있다면, 그것은 이미 지능을 구현한 것이다.” 즉 다음 단어 예측이라는 메커니즘 자체가 지능의 한 형태일 수 있다.

Claude Opus 4.6 같은 모델은 단순 베이스 모델이 아니라 RLHF(인간 피드백 강화학습)와 추가 훈련이 적용된 모델이다. 특히 혼합 추론(hybrid reasoning) 기능은 단순 응답 생성을 넘어서, 다단계 계획과 검증을 가능하게 한다.

8장. 기술적 맥락 — Claude Opus 4.6의 특징

8.1 혼합 추론 모델이란

Claude Opus 4.6은 Anthropic의 혼합 추론(hybrid reasoning) 모델이다. 이는 단순히 텍스트를 생성하는 것을 넘어서, 내부적으로 더 긴 “사고(thinking)” 과정을 수행할 수 있는 아키텍처를 의미한다. 수학 문제나 코딩 과제처럼 단계적 추론이 필요한 작업에서 특히 강점을 보인다.

8.2 에이전트적 탐색 능력

이번 탐색에서 Claude는 단발성 응답이 아닌 31단계에 걸친 연속적 탐색을 수행했다. 각 단계에서:

현재 상황을 평가
새로운 전략을 세움
Python 코드를 작성
코드를 실행하고 결과를 분석
실패 이유를 진단
다음 전략으로 전환

이 과정은 인간 수학자가 연구를 수행하는 방식과 놀랍도록 유사하다.

8.3 컨텍스트 관리의 한계

동시에, 짝수 케이스에서 보인 이상 동작은 현재 LLM 기반 에이전트의 실질적 한계를 보여준다. 긴 세션에서 컨텍스트 윈도우가 가득 차면 성능이 저하된다. Filip의 plan.md 기법은 이를 완화하려는 시도였지만, 완전한 해결책은 아니었다. 컨텍스트 압축(context compacting) 기술의 발전이 이런 장기 탐색 작업에서 매우 중요한 요소임을 이번 사례가 잘 보여준다.

맺음말: 수학의 미래와 AI의 역할

이번 사건은 AI가 단순한 도구를 넘어 수학 연구의 적극적 파트너가 될 수 있음을 보여주는 중요한 이정표다. Claude가 발견한 것은 단순한 숫자 계산이 아니라, 수학적 구조를 파악하고 새로운 개념적 프레임을 도입하고 반복적 실패에서 배워 해법을 찾아내는 능력이었다.

동시에, 수학적 증명이라는 가장 엄밀한 형태의 지적 작업은 여전히 도널드 크누스 같은 인간 수학자의 몫이었다. 짝수 m 문제는 여전히 미해결로 남아 있다.

어쩌면 가장 중요한 교훈은 이것이다: AI와 인간은 서로 다른 강점을 가지고 있으며, 그 시너지가 혼자서는 도달하기 어려운 경지를 가능하게 한다. Filip Stappers가 설계한 탐색 방식 — 문제를 명확히 정의하고, 진행 과정을 문서화하게 하고, 막힐 때 방향을 제시하는 — 은 미래 AI 활용의 좋은 모델이 될 것이다.

Knuth의 말처럼, 이것은 정말 “Claude Shannon의 정신이 자랑스러워할 만한 진보”다.

참고 문헌

Aubert, J., & Schneider, B. (1982). “Graphes orientés indécomposables en circuits hamiltoniens.” Journal of Combinatorial Theory B32, 347–349.
Knuth, D. E. (2011). The Art of Computer Programming, Volume 4A: Combinatorial Algorithms, Part 1. Addison–Wesley.
Knuth, D. E. “Hamiltonian paths and cycles.” 예비 초고. https://cs.stanford.edu/~knuth/fasc8a.ps.gz
Knuth, D. E. (2026). “Claude’s Cycles.” Stanford University. https://www-cs-faculty.stanford.edu/~knuth/papers/claude-cycles.pdf
GeekNews 토론: https://news.hada.io/topic?id=27183
Hacker News 토론: https://news.ycombinator.com/item?id=47230710

작성 일자: 2026-03-08

AI, Claude

AI Material Claude.write