EP 89. 딸깍과 덜컹 — AI 코딩 시대의 성공과 실패 사이

게시 2026/03/15

By BLUEBUG

32 분읽는 시간

AI 프론티어 팟캐스트 | 2026년 3월 15일 방영
출연: 노정석, 최승준
원본 영상: https://www.youtube.com/watch?v=E-19gxHeBRU
자료 및 전사본: https://erucipe.notion.site/31bd5c9e7e59808497b1d98c6b1430f3, https://aifrontier.kr/ko/episodes/ep89/

개요

2026년 3월, GPT-5.4와 Claude의 신기능 발표가 맞물리며 AI 코딩 도구의 “딸깍” 시대가 본격화되었다. 이 에피소드는 그 격변의 한가운데서 노정석, 최승준 두 호스트가 나누는 깊은 성찰의 기록이다. 단순히 “AI가 이걸 해냈다”는 기술 소개를 넘어, 딸깍(성공)과 덜컹(막힘) 사이의 경계를 탐색하고, 그 안에서 인간이 지켜야 할 역량과 가치가 무엇인지를 진지하게 묻는다.

1. GPT-5.4 출시와 “딸깍”의 시대

녹화 시점인 2026년 3월 7일 기준으로 GPT-5.4가 새롭게 출시되었고, Claude 역시 새로운 기능들을 연이어 발표했다. 최승준은 이 시기를 “주 단위 릴리즈가 아니라 일 단위 릴리즈”라고 표현할 정도로, AI 개발 툴의 기능 출시 속도가 따라가기 어려울 만큼 빨라졌다고 진단한다.

“딸깍”이라는 표현은 이 에피소드의 핵심 키워드다. 클릭 몇 번, 혹은 간단한 프롬프트 하나로 복잡한 결과물이 뚝딱 만들어지는 현상을 가리킨다. 소셜미디어 타임라인에는 “나 이거 만들었어”라는 간증기가 쏟아지고 있고, GPT-5.4의 Computer Use 에이전트(CUA)가 게임, 3D 장면, 앱 등을 손쉽게 생성하는 데모들이 공식 쇼케이스 사이트에 공유되고 있다.

노정석은 이 현상의 본질을 이렇게 짚는다. “시작해라와 어떤 결과를 내야 된다라는 것만 해주면, 그 결과를 내기 위해서 필요한 거의 대부분의 지식들을 모델이 가지고 있어서, 그야말로 정말 딸깍이 일어나는 것 같습니다.” GPT-5.4의 성능에 대해 두 호스트 모두 “지금까지 나온 모델 중 가장 최강”이라는 공감대를 보이며, 표준적인 인간보다 훨씬 뛰어난 업무 수행 능력이 이제는 자연스럽게 받아들여야 할 현실이 됐다고 말한다.

2. AI 프론티어 사이트와 정보 활용

에피소드 초반에는 편집자 김유진이 직접 만든 AI 프론티어 사이트(aifrontier.kr) 가 소개된다. 유튜브의 폐쇄적 구조 때문에 자막을 공들여 만들어도 Claude나 ChatGPT 같은 에이전트가 읽지 못하는 문제를 해결하기 위해 만들어진 사이트다. 포스트 전체 다운로드, 챕터별 링크 분리, 특정 챕터만 복사하는 기능 등을 제공해서 청취자들이 원하는 챕터를 ChatGPT나 Claude에게 직접 질문하는 방식으로 활용할 수 있도록 설계되어 있다.

3. 주목할 만한 기술 사례들

Ricardo Cabello의 Quake 포팅

Three.js의 창시자로 알려진 Ricardo Cabello(Mr.doob)가 Claude와 함께 고전 게임 Quake와 Descent를 Three.js로 포팅한 사례가 소개된다. “오케이 Claude, Quake를 Three.js로 포팅할 수 있어?”라는 메시지로 시작해 불과 1시간 만에 동작 가능한 수준의 결과물이 나왔다. 물론 GitHub의 커밋 이력에는 그보다 더 많은 조정 과정이 남아 있지만, 핵심은 “얼마나 빠른 시간 안에 끝났느냐”다.

Andrej Karpathy의 자기 개선 루프 실험

Andrej Karpathy는 GPT-2를 학습시키는 데 걸리는 시간이 몇 달 전 3시간에서 현재 8개의 H100으로 2시간으로 줄었다고 밝혔다. 더 흥미로운 것은 그가 nanochat을 AI 에이전트들이 자동으로 반복 개선하도록 만들어 두고 “post-AGI의 기분을 즐기려 한다”고 농담처럼 말한 것이다. 12시간 동안 110번의 변경이 이루어졌고, 이를 통해 loss가 지속적으로 줄어드는 자기 개선 루프(self-improvement loop)가 실현되었다.

4. 하네스 엔지니어링: 에이전트를 조이는 기술

개념의 출처

“하네스 엔지니어링(Harness Engineering)”이라는 용어는 Ghostty의 창시자이자 HashiCorp의 공동창업자인 Mitchell Hashimoto의 블로그 글에서 비롯되었다. 그의 글 “나의 AI 도입 여정”은 6개의 챕터로 이루어져 있으며, 그 중 5번째 챕터가 “하네스를 설계하라”다.

최승준이 소개하는 하네스의 핵심 정의는 다음과 같다. “에이전트가 실수를 하는 것을 발견할 때마다 시간을 들여 그 실수를 다시는 하지 않게 만드는 해결책을 설계한다.” 이는 크게 두 가지 방식으로 구현된다. 하나는 프롬프팅이고, 다른 하나는 실제 프로그래밍 도구를 통해 에이전트가 나쁜 행동을 반복하지 못하도록 막는 것이다.

하네스의 뉘앙스

노정석은 하네스를 “Claude Code나 Codex같이 모델 옆에 붙어가지고 하는 어떤 프로그램 덩어리”로 이해하지만, Mitchell Hashimoto의 관점에서는 그보다 넓은 프론트까지 포함하는 개념임을 지적한다. 최승준은 말(馬)의 안장이나 마구(馬具)처럼 “딱 조이는” 느낌이 뉘앙스의 핵심이라고 설명한다. 즉, 증강하는 도구이면서 동시에 에이전트의 행동을 검증하고 제어하는 도구다.

구체적 구현 사례: Alloy 언어

코르카의 CTO 강규영이 형식 검증 언어인 Alloy를 활용해 end-to-end 테스트와 자연어 설명이 결합된 실행 가능한 명세서를 만든 사례가 소개된다. 단순한 lint 이상의 검증 도구를 통해 모델이 정확한 작업을 수행할 수 있도록 하네스를 엔지니어링하는 접근이다.

5. “누군가 이미 성공했다면 될 일이다”

에피소드에서 반복적으로 등장하는 핵심 명제다.

국내 시니어 개발자들의 사례로 두 가지가 소개된다. 첫째, 정규 님이 40일간 100만 라인의 코드베이스를 혼자 작업했다. 둘째, 김민태 님(NC, 우아한형제들 등을 거친 시니어 개발자)이 AI와 6개월간 25만 라인의 시스템을 만들며 발견한 것들을 블로그에 공개했다. 셋째, 강규영 님이 3주간 AI와 함께 4만 LOC 규모의 코드베이스를 작업하는 패턴을 보여주고 있다.

최승준이 이 맥락에서 말하는 것은, 누군가 어떤 일을 해냈다는 사실 자체가 “그게 가능하다”는 증거이며, 그 증거를 아는 것만으로도 엄청난 힌트가 된다는 것이다. Lablup의 CTO가 HWP 바이너리 생성에 성공했다는 소식을 들었다면, 어떻게 했을지를 모델과 함께 추리해볼 수 있다. 결과물의 코드베이스가 있다면 그것은 설계서를 입수한 것과 마찬가지고, 동작하는 use case만 봐도 모델이 decompose해서 구현 계획을 세워준다.

노정석은 이를 “리버스 엔지니어링”이라고 표현하며, 이러한 방식으로 성공 사례를 역추적하는 일이 이미 광범위하게 일어나고 있다고 말한다.

6. Donald Knuth: 88세 노장의 AI 전향

The Art of Computer Programming의 저자 Donald Knuth가 2026년 현재 88세의 나이에도 미해결 조합론 문제를 AI의 도움으로 풀어내어 논문으로 공개했다는 소식이 소개된다. 평소 AI를 쓰지 않는 쪽이었다가, AI가 실제로 되는 것을 보고 나서 초고수도 AI를 활용하기 시작했다는 이야기다.

노정석은 누군가 트위터에서 해당 조합론 문제를 그대로 GPT-5.4 Thinking에 넣었더니 정답을 모두 풀어냈다고 전했다. 검색하지 말고 풀라고 지시했음에도 불구하고 말이다. 최승준은 현재 4B까지 집필 중인 Knuth의 조합론 알고리즘 책 작업에 AI의 도움이 결합되었을 것이라 추정한다.

Donald Knuth에 대한 배경 설명도 곁들여진다. 젊은 시절 펀치카드 시절 “Electronic Coach” 영상, 조판 시스템이 없어서 직접 TeX을 만들어 결국 LaTeX으로 발전시킨 이야기, 그리고 일찍이 “리터럴 프로그래밍(literate programming)”이라는 개념을 제안했던 선구자적 면모 등이 언급된다.

7. Guido van Rossum과 Kent Beck의 AI 전향

Python의 창시자 Guido van Rossum(올해 70세)이 최근 Claude를 활용해 개발하는 모습을 타임라인에서 확인할 수 있다는 이야기가 소개된다.

더 흥미로운 것은 Kent Beck의 이야기다. Extreme Programming, Agile Manifesto 참여, Ward Cunningham과의 협업으로 유명한 그는 올해 64세다. 그는 AI를 “genie”라고 부르며 라이브 코딩 세션(genie session)을 공개적으로 올리고 있다. 2023년에는 “마음에 확 와닿지 않지만 억지로 ChatGPT를 써봤다가, 내 skill의 90%가 사라지는 것 같다”고 했던 그가, 지금은 코딩이 굉장히 재미있고 신난다고 말한다.

Kent Beck이 2023년에 남긴 말은 이 에피소드에서 핵심 통찰로 반복 인용된다.

“내가 가지고 있는 90%의 skill은 가치가 떨어졌지만, 남아 있는 10%의 값어치는 천 배가 뛰었다.”

단순 코딩 기술이 아닌 도메인 암묵지, 즉 어떤 문제를 어떻게 봐야 하는지에 대한 깊은 감각의 가치가 AI 시대에 폭등했다는 의미다.

8. 하네스와 스캐폴딩: 위임과 스킬 형성의 딜레마

최승준은 AI 활용 방식을 두 가지로 나눠 설명한다.

하네스(Harness): 에이전트를 조이고 검증하는 도구. 작은 단위로 확인하면서 실수를 막는 방식.

스캐폴딩(Scaffolding): 교육학에서 비계(飛階) 설정이라 불리는 개념으로, 학습자가 스스로 올라갈 수 있도록 임시 지지대를 놓아주는 것. 에이전트에게 단계별 도움 계단을 제공하는 방식.

스캐폴딩의 실제 사례로, GPT-5에게 어려운 문제를 그대로 던지면 답이 안 나오지만, 주변에 스캐폴딩을 구축하면 된다는 연구가 소개된다. 구체적으로는 아이디어를 제안하는 에이전트, 실행하는 에이전트, 검증하는 에이전트, 결과를 병합하는 에이전트를 분리해서 제공하고, 모델을 워밍업시켜 이미 알고 있는 유사 문제를 먼저 풀게 한 뒤 그 해법을 더 어려운 문제에 적용하게 하는 방식이다.

위임의 역설: Anthropic의 스킬 형성 논문

여기서 중요한 딜레마가 등장한다. Mitchell Hashimoto의 글에서도 언급된 Anthropic의 스킬 형성 논문이다. 핵심은 이것이다. “에이전트에 위임한 작업에 대해서는 인간의 스킬이 형성되지 않는다. 반면 내가 계속 수동으로 하는 작업에서는 자연스럽게 스킬이 계속 형성된다.”

Kent Beck은 자신의 남은 10%가 여전히 천 배의 가치를 가진다고 믿지만, 보통의 사람들은 AI에게 위임하다 보면 기존 역량을 잃어버릴 수 있다. 이것을 최승준은 “위임하되 잃지 않으려면, 퇴화하지 않으려면, 또는 다른 역량을 개발하려면 어떻게 할 수 있을까”라는 질문으로 정리한다.

9. 소프트웨어 엔지니어링의 상향 평준화와 다음 도메인

노정석은 지난 20 ~ 30년간 황금기를 구가했던 소프트웨어 엔지니어링이 변곡점을 맞이했다고 단언한다. 코로나 시기 6주짜리 부트캠프만으로 15~20만 달러 연봉을 받던 시대는 끝났다. 그 변화는 산업혁명 당시 방직기계에 일자리를 잃었던 숙련공들과 본질적으로 다르지 않다. 다만 그들은 한 세대(약 30년)에 걸쳐 변화를 겪었는데, 우리는 불과 1년(Claude Code 출시 이후)만에 이 변화를 경험하고 있다.

결론은 상향 평준화다. 모두가 고수준의 코딩을 할 수 있게 되면, 가장 잘하는 사람이 모든 일을 하는 구조가 아니라, 코딩 자체가 인프라로 내려가고 그 위에서의 경쟁이 시작된다. 마치 자동차, 철도, 섬유 산업처럼, 고도 성장기가 끝나면 서너 개의 회사가 시장을 장악하는 구조로 수렴된다.

두 호스트가 주목하는 “다음 도메인”은 과학(Science)이다. 물리학, 생명공학, 화학 등 과거에는 해당 분야의 전문가만 접근할 수 있었던 영역에 AI의 도움으로 진입하는 것이 전혀 이상하지 않은 세상이 됐다. 노정석은 생명공학 논문 몇 편을 AI의 도움으로 읽어내고, GPT-5.4가 그 논문 이상으로 앞으로 만들어낼 것들을 90%의 확률로 예측해주는 경험을 했다고 말한다. “지금은 노벨상을 노리는 생명공학자가 했어야 될 이야기를 AI가 하고 있다.”

10. 3D 메쉬 알고리즘 도전기: 논문 투 딸깍 실험

최승준의 직접 경험담이 에피소드의 하이라이트 중 하나다. 3월 1일부터 한 주간 약 60개의 대화, 각 대화마다 평균 1,000줄의 코드가 포함된 총 6만 라인 규모의 실험이었다.

목표

2020년에 공개적으로 “개발해 보고 싶다”고 밝혔던 비메쉬(vMesh) 알고리즘 구현이다. 블렌더나 지브러시에서 사용되는, 3D 모델을 부드럽게 만들어주는 알고리즘이다. AI 코딩 이전 시절 인간지능으로 유사한 것을 구현하려 했으나, 선형대수 라이브러리(Eigen) 의존성과 웹 환경의 한계로 실패했던 과제다.

과정

GPT-5.4 출시를 계기로 “논문 투 딸깍(Paper to 딸깍)”이 과연 가능한지 실험했다. 논문을 직접 보며 20~30분 만에 MVP를 구현하는 데는 성공했다. 다음으로 해당 논문의 GitHub 구현체를 웹 환경으로 포팅하는 “소스 투 딸깍”을 시도했는데, 10분 만에 완료됐지만 품질은 더 낮았다(포팅이기 때문에 난이도가 낮았기 때문).

PoC 수준에서 성공한 다른 시도들도 소개된다. 텍스트를 입력하면(“고질라”, “산타클로스”) 아이소서피스 알고리즘을 이용해 3D 캐릭터가 생성되는 도구를 30분 만에 만들었다. Gemini가 3D에 특히 강해서 이 부분은 쉽게 됐다고 한다.

덜컹 구간: 경계 연결 문제

진짜 어려움은 경계 연결(boundary edge connection) 문제였다. 서로 다른 메쉬 조각들의 끝단을 자연스럽게 잇는 것인데, 인간이 눈으로 보기에는 자명한 것처럼 보이지만 수학적으로 구현하기는 매우 어렵다. 이 문제를 풀기 위해 한 주간의 토큰 한도를 다 쓰면서 다양한 가설을 세우고 실험했다.

흥미로운 점은 세 가지다. 첫째, 동적 계획법(DP)을 메쉬 알고리즘에 적용하는 아이디어는 최승준이 생각하지 못했는데 모델이 제안했다. 둘째, 구면 투영을 이용한 컨벡스 헐(convex hull) 방식은 모델이 반대했지만 최승준의 직관으로 밀어붙인 아이디어다. 셋째, 이 직관은 결국 완전한 성공으로 이어지지는 않았지만, 다른 곳에 활용 가능한 유용한 부산물이 됐다.

노정석은 이 과정을 “따알 까지 갔고, 아직 깍이 안 나온 것”이라고 표현했다.

세이브포인트 전략

최승준이 제안하는 접근법은 특정 문제에 부딪히면 세이브포인트를 만들어 두고 다양한 가설을 우선 탐색한 뒤, 가설이 성공하면 나아가고 실패하면 저장 지점으로 돌아가는 것이다. Ralph loop(무한 반복 시도)는 토큰을 낭비할 수 있기 때문에, 스캐폴딩을 어떻게 구축하느냐가 이 구간에서 핵심이 된다.

그럼에도 불구하고 최승준의 “사전 확률”은 “된다”는 것이다. 이미 존재하는 논문과 알고리즘이기 때문에, 좋은 경로를 찾으면 덜컹 하다가 결국 덜컥 될 것이라는 믿음이다.

11. 딸깍과 덜컹, 그리고 덜컥

에피소드의 제목이자 핵심 구조다.

딸깍: AI와 함께 간단히 성공하는 구간. 좋은 프롬프트, 올바른 하네스, 잘 정의된 문제 앞에서 결과가 뚝딱 나오는 순간.

덜컹: 막히는 구간. 모델도, 인간도, 쉽게 돌파하지 못하는 구간. 그래픽스처럼 시각적으로는 자명하지만 알고리즘적으로 검증하기 어려운 문제들, 또는 피드백 루프가 잘 구축되지 않은 구간에서 발생한다.

덜컥: 덜컹 구간이 끝나고 마침내 성공이 이루어지는 순간. “될 것 같다”는 믿음을 가지고 밀어붙이면 결국 찾아오는 돌파구.

12. 토큰이 끊기면 인간이 된다: 브라운아웃

에피소드 말미에 나오는 가장 인상적인 에피소드 중 하나. 노정석의 지인 엔지니어가 한 말이다.

“위클리 토큰을 자기가 갖고 있는 구독에서 다 써버려 가지고, 그게 딱 끝나는 순간 자기는 한낱 미물 인간으로 돌아온다고. 할 수 있는 일이 하나도 없기 때문에 잠을 자는 것만이 내가 할 수 있는 일이다.”

노정석은 Andrej Karpathy가 언급한 브라운아웃(brownout) 개념을 인용한다. AI가 없으면 사회 전체가 약간 전기가 떨어진 것처럼 기능이 저하되는 상태. 이미 하루의 대부분의 업무가 AI와 함께하는 방식으로 재편된 현실을 보여주는 비유다.

13. AI 시대에 강화해야 할 인간의 덕목

에피소드의 결론부에서 두 호스트는 다음과 같이 정리한다.

문제를 정의하는 능력이 핵심이다. AI가 아무리 강력해도, 어떤 문제를 풀어야 하는지를 정의하는 것은 여전히 인간의 몫이다. 무엇을 만들어야 하는지, 왜 만들어야 하는지, 어떤 부가가치를 창출해야 하는지를 포착하는 능력이 가장 중요한 역량이 됐다.

도메인 암묵지(tacit knowledge)의 가치가 폭등한다. Kent Beck의 말처럼 90%의 코딩 스킬이 평준화되더라도, 특정 도메인에서 쌓인 깊은 감각과 경험은 AI와 결합했을 때 천 배의 가치를 발휘한다.

끈기와 가설 설정 능력. 덜컹 구간에서 포기하지 않고, 좋은 가설을 세우고 실험을 반복하는 능력. 최승준이 3D 메쉬 알고리즘 문제를 일주일 동안 파고든 경험이 이 덕목의 실제 사례다.

쉼의 가치. “머리가 맑아야 좋은 가설들을 떠올릴 수 있다”는 말처럼, AI 시대에도 충분한 휴식과 성찰의 시간이 창의적 발견의 전제 조건이다.

탐색하는 자세. 소프트웨어 엔지니어링이라는 기존 영역에 안주하지 않고, 생명공학, 물리학, 화학 등 새로운 도메인으로 경계를 넓혀가는 탐험가적 태도.

총평

이 에피소드는 AI 도구의 기능 소개에 머물지 않고, 그 변화 앞에서 인간이 어떻게 재위치해야 하는지를 묻는다. “딸깍”의 시대에 누구나 코드를 생성할 수 있게 됐지만, 어떤 코드를 왜 만들어야 하는지를 묻는 능력, 막혔을 때 포기하지 않는 끈기, 그리고 AI가 닿지 못하는 도메인의 깊이를 쌓아가는 것이 바로 AI 시대의 인간적 차별점이라는 것이 이 에피소드가 전하는 핵심 메시지다.

본 문서는 AI 프론티어 팟캐스트 EP 89 전사본을 바탕으로 작성된 상세 요약입니다.
전사본 원본: https://aifrontier.kr/ko/episodes/ep89/

AI, Material

AI AndrejKarpathy harness-engineering KentBeck Harness Scaffolding Anthropic claude-code tacit-knowledge Claude.write