๐ฉ Garbage In, Garbage Out โ AI ์๋์ ๋ฐ์ดํฐ ํ์ง ๋ ผ์
์ด๋ฏธ์ง ์ถ์ฒ: @bioaio (Threads) / ํ๊ตญ ๋ฐ์ด์ค AI ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ ํ ๋ก ์ข ํฉ ๋ถ์
์์ฑ์ผ: 2026๋ 4์ 22์ผ
ํค์๋: #๋ฐ์ดํฐํ์ง #์๋ฒ๋ฆฐAI #๋ฐ์ด์คAI #GIGO #ํ๊ตญ์ฐ๊ตฌ์ํ๊ณ
๋ชฉ์ฐจ
- ๋ฐ(Meme) ํด์ค โ โ๐ฉ + AI = ๋ ํ๋ คํ ๐ฉโ
- GIGO ์์น์ ์ญ์ฌ์ ์๋ฏธ
- AI ๊ธฐ์ ๋จ๊ณ๋ณ ๋ถ์: ML โ AI โ GenAI โ Agentic AI
- ํ๊ตญ ๋ฐ์ด์ค ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ์ง๋จ
- ์๋ฒ๋ฆฐ AI ์ง์ฐฉ๊ณผ ๋ฐ์ดํฐ ์์ฐ์ ์ญ์ค
- NIH vs ํ๊ตญ ์ฐ๊ตฌ๋น ๊ด๋ฆฌ ์ฒด๊ณ ๋น๊ต
- ๋ฐ์ด์ค AI ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ ํ์ค
- ๋ฐ์ดํฐ ์ฃผ๊ถ๊ณผ ์ฐ๊ตฌ ๋ฐ์ดํฐ์ ๊ณต๊ฐ์ฑ ๋๋ ๋ง
- ์ธ๋๋ก : ์ ์ PI๋ค์ด ์ด์ ๋ฅผ ์ฅ ์ด์
- ์ ์ธ: ํ๊ตญ ๋ฐ์ด์ค AI ์ํ๊ณ๊ฐ ๋์๊ฐ ๋ฐฉํฅ
1. ๋ฐ(Meme) ํด์ค
์ด ์ด๋ฏธ์ง๋ ๋ฐ์ดํฐ ๊ณผํ ์ปค๋ฎค๋ํฐ์์ ์ค๋๋๋ก ํ์๋๋ โ์ฐ๋ ๊ธฐ ์ ๋ ฅ โ ์ฐ๋ ๊ธฐ ์ถ๋ ฅ(Garbage In, Garbage Out)โ ์์น์ AI ๊ธฐ์ ์งํ์ ์ญ์ฌ์ ์ ๋จธ๋ฌ์คํ๊ฒ ๋์ ํ ๋ฐ์ด๋ค. @bioaio ๊ณ์ ์ ๋ฐํ ์๋ฃ์์ ์ฐจ์ฉ๋ ์ด ์ด๋ฏธ์ง๋, ํ๊ตญ ๋ฐ์ด์ค ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์์ ์๋ฒ๋ฆฐ AI์ ๋ฐ์ดํฐ ์์ฐ ํฌ์๋ฅผ ๋๋ฌ์ผ ๋ ผ์์ ์ด๋ฐํ ํต์ฌ ์๊ฐ ์๋ฃ์ด๊ธฐ๋ ํ๋ค.
1-1. ์ด๋ฏธ์ง ๊ตฌ์กฐ ๋ถ์
๋ฐ์ ๋์ผํ ๊ณต์์ ๋ค ๋ฒ ๋ฐ๋ณตํ๋ค: Data(๋ฐ์ดํฐ) + [๊ธฐ์ ] = [๊ฒฐ๊ณผ๋ฌผ]
๊ทธ๋ฐ๋ฐ ๋ฐ์ดํฐ ์์ด์ฝ์๋ ๋งค๋ฒ ๐ฉ ์ด๋ชจ์ง๊ฐ ๋ถ์ด ์๋ค. ์ฆ, ๋ฐ์ดํฐ์ ์ง์ด ๋์ ์ํ๋ผ๋ ์ ์ ๊ฐ ๊ณ ์ ๋ ์ฑ๋ก ๊ธฐ์ ๋ง ๋ฐ๋๋ค.
| ํ | ๊ธฐ์ | ๊ฒฐ๊ณผ | ํด์ |
|---|---|---|---|
| 1ํ | Machine Learning | ๐ฉ (๊ทธ๋ฅ ๋ฅ) | ML์ ์ ๋ ฅ ๊ทธ๋๋ก ๋ฐํํ๋ค |
| 2ํ | Artificial Intelligence | โจ๐ฉโจ (๋ฐ์ง์ด๋ ๋ฅ) | AI๋ ํฌ์ฅ์ ํ๋ คํด์ก์ง๋ง ๋ณธ์ง์ ๊ฐ๋ค |
| 3ํ | Generative AI | ๐ฆ๐ฉ (์ ๋์ฝ ๋ฅ) | GenAI๋ ํ์์ ยท์ฐฝ์์ ์ผ๋ก ๋ณด์ด์ง๋ง ๋ด์ฉ์ ๋๊ฐ๋ค |
| 4ํ | Agentic AI | ๐ฉ๐ฉ๐ฉโฆ (์์ญ ๊ฐ์ ๋ค์ํ ๋ฅ) | ์์ด์ ํธ AI๋ ๋์๋ค๋ฐ์ ์ผ๋ก ์ฆ์ยทํ์ฐ๋๋ค |
1-2. ๋จ๊ณ๋ณ ์์ ์ ๊น์ด
1ํ โ Machine Learning: ๊ทธ๋ฅ ๋ฅ
ML ๋ชจ๋ธ์ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํจํด์ ํ์ตํ๋ค. ์
๋ ฅ ๋ฐ์ดํฐ๊ฐ ํธํฅ๋๊ฑฐ๋ ๋
ธ์ด์ฆ๊ฐ ๋ง์ผ๋ฉด ์ถ๋ ฅ๋ ๊ทธ๋๋ก ํธํฅ๋๋ค. ์๋ฌด๋ฐ ๋ถ์ ์์ด ์๋ ๊ทธ๋๋ก ๋ด๋ฑ๋ ์ง๊ด์ ์ธ GIGO์ ๊ตฌํ์ด๋ค. ํ๋ คํ ํฌ์ฅ์ง๋ ์๋ค.
2ํ โ Artificial Intelligence: ๋ฐ์ง์ด๋ ๋ฅ
๋ ๋ณต์กํ AI ์์คํ
(๋ฅ๋ฌ๋, ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ)์ ๊ฒฐ๊ณผ๋ฌผ์ โ์ธํ
๋ฆฌ์ ์คโ๋ผ๋ ๊ด์ฑ๋ฅผ ๋ํ๋ค. ๋ฐํ ์๋ฃ๊ฐ ๊ทธ๋ด์ธํด์ง๊ณ , ๋
ผ๋ฌธ ์ด๋ก์ด ์ ๊ตํด์ง๋ค. ํ์ง๋ง ํ์ต ๋ฐ์ดํฐ๊ฐ ๋์๋ค๋ฉด ๋ชจ๋ ์ ๊ตํจ์ ์ฅ์์ ๋ถ๊ณผํ๋ค. ์คํ๋ ค ์ ๋ฌธ๊ฐ๊ฐ ์๋ ์ฒญ์ค์๊ฒ๋ ๋ ์ค๋๋ ฅ ์์ด ๋ณด์ด๊ธฐ ๋๋ฌธ์ ์ํ์ฑ์ด ๋๋ค.
3ํ โ Generative AI: ์ ๋์ฝ ๋ฅ
GPT๋ฅ์ ์์ฑํ AI๋ ๊ฒฐ๊ณผ๋ฌผ์ ์์ ํ ์๋ก์ด ํํ๋ก ์ฌ์ฐฝ์กฐํด๋ธ๋ค. ํ๋ คํ ์์ฑ, ์ ๋์ฝ ๋ฟ, ๋ฐ์ง์ด๋ ๊ผฌ๋ฆฌ๊น์ง ๋ถ์๋ค. ์์ง๋ ์์ ์ฐธ๊ณ ๋ฌธํ์ ๊ทธ๋ด์ธํ๊ฒ ์์ฑํ๊ณ (ํ ๋ฃจ์๋ค์ด์
), ์๋ ์คํ ๊ฒฐ๊ณผ๋ฅผ ๋ฌธํ์ ์ผ๋ก ๋ฌ์ฌํ ์๋ ์๋ค. โ์ฐฝ์์ ์ผ๋ก ๋ณด์ด๋ ์ค๋ฅโ๊ฐ ๋ง๋ค์ด์ง๋ ๋จ๊ณ๋ค. ๋ฐ์ดํฐ ํ์ง ๋ฌธ์ ๊ฐ ์ฐฝ์์ฑ์ด๋ผ๋ ์ด๋ฆ์ผ๋ก ํฌ์ฅ๋๋ค.
4ํ โ Agentic AI: ์ฆ์ํ๋ ๐ฉ ๊ตฐ์ง
์์ด์ ํธ AI๋ ์ฌ๋ฌ AI๊ฐ ์๋ก ์ฐ๊ฒฐ๋์ด ์์จ์ ์ผ๋ก ์์
์ ๋ถํ ํ๊ณ ๋ณ๋ ฌ๋ก ์คํํ๋ค. ํ ์์ด์ ํธ๊ฐ ์๋ชป๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฆฐ ๊ฐ์ค์ ์ธ์ฐ๋ฉด, ๋ค์ ์์ด์ ํธ๋ ๊ทธ ๊ฐ์ค์ ๊ฒ์ฆํ๊ธฐ ์ํ ์คํ ๊ณํ์ ์๋ฆฝํ๊ณ , ๋ ๋ค๋ฅธ ์์ด์ ํธ๋ ๊ทธ ๊ณํ์ ๋ง๋ ๋
ผ๋ฌธ์ ๊ฒ์ํ๋ค. ์ค๋ฅ๊ฐ ์๋ํ๋๊ณ ๋ณ๋ ฌํ๋๋ฉฐ ์์คํ
์ ์ฒด์ ํผ์ง๋ค. ์์ ๐ฉ ํ๋๊ฐ ์์ญ ๊ฐ์ ๐ฉ์ผ๋ก ์ฆ์ํ๋ ๊ฒ์ด ์ด ํ์ ํต์ฌ์ด๋ค. ์์ด์ ํฑ AI ์๋์ ๋ฐ์ดํฐ ํ์ง ๋ฌธ์ ๋ ์ ํ์ด ์๋๋ผ ์ง์์ ์ผ๋ก ์
ํ๋ ์ ์๋ค.
2. GIGO ์์น์ ์ญ์ฌ์ ์๋ฏธ
GIGO(Garbage In, Garbage Out) ๋ ์ปดํจํฐ ๊ณผํ์ ๊ฐ์ฅ ์ค๋๋ ๊ฒฉ์ธ ์ค ํ๋๋ค.
1957๋ IBM์ ํ๋ก๊ทธ๋๋จธ ์กฐ์ง ํผ๋(George Fuechsel)์ด ์ฒ์ ์ฌ์ฉํ ๊ฒ์ผ๋ก ์๋ ค์ ธ ์์ผ๋ฉฐ, ์ด๊ธฐ ์ปดํจํ ์๋๋ถํฐ ์ง๊ธ๊น์ง ๋จ ํ ๋ฒ๋ ๊ทธ ์ ํจ์ฑ์ด ์ฌ๋ผ์ง ์ ์ด ์๋ค. AI์ ์๋์ ์คํ๋ ค ์ด ์์น์ ๋์ฑ ๊ฐ๋ ฅํ๊ฒ ์๋ํ๋ค.
timeline
title GIGO ์์น์ ๊ธฐ์ ์ฌ์ ๋งฅ๋ฝ
1957 : IBM ํผ๋, GIGO ๊ฐ๋
์ต์ด ์ธ๊ธ
: ์ด๊ธฐ ๋ฐฐ์น ์ฒ๋ฆฌ(Batch Processing) ์๋
1970s : ๋ฐ์ดํฐ๋ฒ ์ด์ค ์๋
: "Data Integrity" ๊ฐ๋
๋ถ์
1990s : ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค & ETL ์๋
: ๋ฐ์ดํฐ ํ์ง ๊ด๋ฆฌ ์ฐ์
ํ
2010s : ๋น
๋ฐ์ดํฐ ์๋
: "More Data > Better Algorithm" ๋
ผ์
2015s : ๋ฅ๋ฌ๋ ํ๋ช
: ๋๊ท๋ชจ ๋ ์ด๋ธ ๋ฐ์ดํฐ์ ์ค์์ฑ ํญ๋ฐ
2020s : ํ์ด๋ฐ์ด์
๋ชจ๋ธ ์๋
: ํ์ต ๋ฐ์ดํฐ ํ์ง์ด ๋ชจ๋ธ ๋ฅ๋ ฅ์ ๊ฒฐ์ ์
2024s : Agentic AI ์๋
: GIGO์ ์๋ํยท๋ณ๋ ฌํยท์ง์์ ์ฆํญ
ํต์ฌ์ ๊ธฐ์ ์ด ๋ฐ์ ํ ์๋ก GIGO์ ์ฆํญ ๊ณ์(amplification factor) ๊ฐ ์ปค์ง๋ค๋ ์ ์ด๋ค. ์ ๊ณ์ฐ๊ธฐ ์๋์๋ ์๋ชป๋ ์ซ์ ํ๋๊ฐ ์๋ชป๋ ๋ต ํ๋๋ฅผ ๋ง๋ค์๋ค. ์์ด์ ํฑ AI ์๋์๋ ์๋ชป๋ ๋ฐ์ดํฐ ํ๋๊ฐ ์์ญ ๊ฐ์ ์๋ชป๋ ์์ฌ๊ฒฐ์ , ๋ฌธ์, ์คํ ๊ณํ, ๋ ผ๋ฌธ ์ด์์ ์๋ ์์ฑํ ์ ์๋ค.
3. AI ๊ธฐ์ ๋จ๊ณ๋ณ ๋ถ์
3-1. ๋ฐ์ดํฐ โ ๊ฒฐ๊ณผ๋ฌผ ๋ณํ ํ๋ฆ
flowchart LR
subgraph INPUT["์
๋ ฅ ๊ณ์ธต"]
D1["๐ฉ ์ ํ์ง ๋ฐ์ดํฐ\n(ํธํฅยท๋
ธ์ด์ฆยท๋ถ์์ )"]
end
subgraph ML["Machine Learning"]
M1["ํน์ง ์ถ์ถ\n(Feature Engineering)"]
M2["๋ชจ๋ธ ํ๋ จ"]
M3["๐ฉ ์์ธก ์ถ๋ ฅ\nํธํฅ ๊ทธ๋๋ก ๋ฐ์"]
M1 --> M2 --> M3
end
subgraph AI["Artificial Intelligence"]
A1["์ฌ์ธต ์ ๊ฒฝ๋ง\n(Deep Learning)"]
A2["๋ณต์กํ ํจํด ํ์ต"]
A3["โจ๐ฉโจ ํ๋ คํ ์ถ๋ ฅ\nํ์ง๋ง ์ฌ์ ํ ํธํฅ"]
A1 --> A2 --> A3
end
subgraph GEN["Generative AI"]
G1["๋ํ ์ธ์ดยท์ด๋ฏธ์ง ๋ชจ๋ธ\n(LLM / Diffusion)"]
G2["์์ฑ์ ์ฌ์ฐฝ์กฐ"]
G3["๐ฆ๐ฉ ํ์์ ์ถ๋ ฅ\nํ ๋ฃจ์๋ค์ด์
ํฌํจ"]
G1 --> G2 --> G3
end
subgraph AGT["Agentic AI"]
AG1["๋ค์ค ์์ด์ ํธ ์์คํ
"]
AG2["์์จ ๊ณํยท์คํยท๊ฒ์ฆ"]
AG3["๐ฉรN ์ค๋ฅ์ ๋ณ๋ ฌํ\n์๋ํ๋ ์ฐ๋ ๊ธฐ ์์ฐ"]
AG1 --> AG2 --> AG3
end
D1 --> ML
D1 --> AI
D1 --> GEN
D1 --> AGT
style INPUT fill:#fff3e0,stroke:#ff6d00
style ML fill:#e8f5e9,stroke:#2e7d32
style AI fill:#e3f2fd,stroke:#1565c0
style GEN fill:#f3e5f5,stroke:#6a1b9a
style AGT fill:#fce4ec,stroke:#b71c1c
3-2. ์ํ์ฑ ์ง์: ๊ธฐ์ ๋จ๊ณ๋ณ ๋น๊ต
| ๊ธฐ์ ๋จ๊ณ | ์ค๋ฅ ๊ฐ์ง ๋์ด๋ | ์ค๋ฅ ํ์ฐ ์๋ | ์ฌํ์ ์ ๋ขฐ๋ | ์ํ ์ง์ |
|---|---|---|---|---|
| ML | ๋ฎ์ (๋ช ์์ ์ค๋ฅ) | ๋๋ฆผ | ๋ฎ์ | โ โ โโโ |
| AI | ์ค๊ฐ (๋ณต์กํ ํจํด) | ์ค๊ฐ | ์ค๊ฐ | โ โ โ โโ |
| Generative AI | ๋์ (๊ทธ๋ด์ธํ ํ๊ตฌ) | ๋น ๋ฆ | ๋์ | โ โ โ โ โ |
| Agentic AI | ๋งค์ฐ ๋์ (์์จ ๊ฒฐ์ ) | ๋งค์ฐ ๋น ๋ฆ | ๋งค์ฐ ๋์ | โ โ โ โ โ |
4. ํ๊ตญ ๋ฐ์ด์ค ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ์ง๋จ
Threads์ @humangenomicslab, @spring.sleep.joy, @bioaio ์ธ ๊ณ์ ์ด ์ฐ์์ผ๋ก ํผ์น ์ด ๋ ผ์์, ํ๊ตญ ๋ฐ์ด์ค-AI ์ฐ๊ตฌ ์ํ๊ณ์ ๊ตฌ์กฐ์ ๋ฌธ์ ๋ฅผ ๋ ์นด๋กญ๊ฒ ์ง์ด๋ธ๋ค.
4-1. ํต์ฌ ์ง๋จ: โ์๋ฒ๋ฆฐ AI์ ๋ฏธ์ณ์๋โ ์ฐ๊ตฌ ํ๊ฒฝ
์ด ์ฃผ์ฅ์ ๋ ผ๊ฑฐ๋ ์ด๋ ๋ค:
โ๋น์ฅ 1๋ ์ ๋๋ง ์ง๋๋, AI 1๋ ๋ชจ๋ฅด๋ ๋ถ๋ค๋ ์๊ธฐ ์ฐ๊ตฌ์์ ์ฐ๊ณ ์์ ๊ฒ. ๊ทธ๋์ ๋์ ํ๋ ค๋ฉด, ๋ฐ์ดํฐ ์์ฐ์ ๋์ ์จ์ผ ํจ.โ
์ด๋ AI ๋๊ตฌ์ ๋ฏผ์ฃผํ(democratization)๊ฐ ์ด๋ฏธ ์งํ ์ค์์ ์ ์ ํ๋ค. ChatGPT, Claude, Gemini ๋ฑ์ ์๋น์ค๋ ์ด๋ฏธ ์ ๋ฌธ ์ง์ ์์ด๋ ์ฌ์ฉ ๊ฐ๋ฅํ ์์ค์ด๋ค. ๋ฐ์ด์ค ์ฐ๊ตฌ์๊ฐ ํ์ด์ฌ์ ๋ชจ๋ฅด๋๋ผ๋ AI ๋ณด์กฐ ๋๊ตฌ๋ก ์ ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ์๋๋ ์ด๋ฏธ ์๋ค. ์ด ๋งฅ๋ฝ์์ ๊ตญ์ฐ AI ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ๋ณด๋ค ๋ชจ๋ธ์ด ํ์ตํ๊ณ ๊ฒ์ฆํ ๊ณ ํ์ง ๋ฐ์ดํฐ๋ฅผ ์์ฐํ๋ ๊ฒ์ด ํจ์ฌ ๋ ์ ๋ต์ ์ธ ํฌ์๋ผ๋ ์ฃผ์ฅ์ด๋ค.
4-2. ๋ฐ์ด์ค AI์ ๋ณ๋ชฉ: ์คํ(Wet Lab)
์ ๋ก์ท(Zero-shot) ๋ชจ๋ธ์ ๋ฑ์ฅ
์ด๋ฏธ 2024๋
๋ถํฐ ํ์ธํ๋ ์์ด ๊ทธ๋๋ก ์ฌ์ฉํ ์ ์๋(์ ๋ก์ท) ๋ฐ์ด์ค ํ์ด๋ฐ์ด์
๋ชจ๋ธ๋ค์ด ๋ค์ ๋ฑ์ฅํ๋ค. AlphaFold3, ESM-3, Evo ๋ฑ์ด ๋ํ์ ์ด๋ค. ์ด๋ฐ ๋ชจ๋ธ๋ค์ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ์์ธก, ์ ์ ์ ๊ธฐ๋ฅ ์ถ๋ก , ์ฝ๋ฌผ ๊ฒฐํฉ ์์ธก ๋ฑ์ ์ํํ ์ ์๋ค.
๋ณ๋ชฉ์ (Bottleneck)์ ์ด๋
AI๊ฐ ์์ธกํ ๊ฐ์ค์ ์ค์ ๋ก ๊ฒ์ฆํ๋ wet lab ์คํ์ด ์ด์ ๋ณ๋ชฉ์ด ๋์๋ค. ์ด์ ์๋ ๊ฐ์ค ์์ฑ์ด ๋๋ ธ๋ค๋ฉด, ์ด์ ๋ AI๊ฐ ๊ฐ์ค์ ์์๋ด๋ ์๋๋ฅผ ์คํ์ค์ด ๋ฐ๋ผ์ก์ง ๋ชปํ๋ค.
ํ์ธํ๋ ๊ฐ๋ฅ ๋ชจ๋ธ์ ์๋
ํ์ธํ๋์ ํ ์ ์๋ ๋ชจ๋ธ์ ๋์ฑ ๊ฐ๋ ฅํ๋ค. ์๊ท๋ชจ ๋๋ฉ์ธ ํนํ ๋ฐ์ดํฐ๋ก ํ์ธํ๋๋ ๋ชจ๋ธ์ ํน์ ์ฐ๊ตฌ ์ง๋ฌธ์ ์ง์ ํด๊ฒฐํ ์ ์๋ค. ๊ทธ๋ฌ๋ ํ์ธํ๋์ ์ํด์๋ ํ์คํ๋๊ณ ์ ํฉ์ฑ ์๋ ๋ฐ์ดํฐ๊ฐ ํ์๋ค.
flowchart TD
AI["๐ค ๋ฐ์ด์ค AI ํ์ด๋ฐ์ด์
๋ชจ๋ธ\n(AlphaFold3, ESM-3, Evo ๋ฑ)"]
AI -->|"๊ฐ์ค ์์ฑ (์ด๊ณ ์)"| HYP["๐ ์๋ฐฑ ๊ฐ์ ์ฐ๊ตฌ ๊ฐ์ค\n๋จ๋ฐฑ์ง ๊ฒฐํฉ / ์ ์ ์ ๊ธฐ๋ฅ / ์ฝ๋ฌผ ํ๋ณด"]
HYP -->|"๊ฒ์ฆ ํ์"| WET["๐งช Wet Lab ์คํ\n(๋ณ๋ชฉ ์ง์ โ ๏ธ)"]
WET -->|"๊ฒฐ๊ณผ ์์ฑ"| DATA["๐ ์คํ ๋ฐ์ดํฐ"]
DATA -->|"ํ์คํยท์ ํฉํ"| STD["โ
ํ์คํ๋ ๋ฐ์ดํฐ์
"]
STD -->|"ํ์ธํ๋"| FINE["๐ฏ ๋๋ฉ์ธ ํนํ ๋ชจ๋ธ\n๋ ์ ๋ฐํ ์์ธก"]
FINE -->|"์ ๊ฐ์ค ์์ฑ"| HYP
style WET fill:#ffcdd2,stroke:#c62828
style STD fill:#c8e6c9,stroke:#2e7d32
style AI fill:#e3f2fd,stroke:#1565c0
5. ์๋ฒ๋ฆฐ AI ์ง์ฐฉ๊ณผ ๋ฐ์ดํฐ ์์ฐ์ ์ญ์ค
5-1. ์๋ฒ๋ฆฐ AI๋ ๋ฌด์์ธ๊ฐ
์๋ฒ๋ฆฐ AI(Sovereign AI)๋ ๊ตญ๊ฐ๊ฐ ์๊ตญ์ ์ธ์ดยท๋ฌธํยท๋ฐ์ดํฐ๋ก ํ๋ จ๋ AI ์ธํ๋ผ๋ฅผ ์ง์ ๋ณด์ ํ๊ณ ํต์ ํ๋ ์ ๋ต์ด๋ค. ์๋น๋์์ ์ ์จ ํฉ์ด 2023-2024๋ ์ ๊ฐ์กฐํ๋ฉด์ ์ ์ธ๊ณ ์ ๋ถ์ ์ ์ฑ ํค์๋๊ฐ ๋์๋ค.
์๋ฒ๋ฆฐ AI์ ์ ๋นํ ๊ทผ๊ฑฐ๋ค:
- ๊ตญ๊ฐ ์๋ณด์ ๋ฐ์ดํฐ ์ฃผ๊ถ
- ์ธ์ดยท๋ฌธํ์ ํน์์ฑ ๋ฐ์
- ์ธ๊ตญ ๊ธฐ์ ์์กด๋ ํํผ
- ์ ๋ต ์ฐ์ ์ก์ฑ
๊ทธ๋ฌ๋ ํ๊ตญ ๋ฐ์ด์ค ์ฐ๊ตฌ ๋งฅ๋ฝ์์์ ๋ฌธ์ :
- ๋ฐ์ด์ค ์ฐ๊ตฌ๋ ์ด๋ฏธ ๊ธ๋ก๋ฒํ๊ฒ ํ์คํ๋ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ ์ฐ๊ฒ ๋์ด ์์
- ๋ช ๊ฐ์ง ๋ํ ๋ชจ๋ธ(AlphaFold, ESM ๋ฑ)์ด de facto ํ์ค์ด ๋์ด๋ฒ๋ฆผ
- ํ๊ตญ ๋จ๋ ์ผ๋ก ์ด ๋ชจ๋ธ๋ค์ ๋์ฒดํ ์์์ด ํ์ค์ ์ผ๋ก ๋ถ์กฑ
- ์ ์ ํ์ํ ๊ฒ์ ์ด ๊ธ๋ก๋ฒ ๋ชจ๋ธ๋ค์ด ํ์ตํ๊ฑฐ๋ ๊ฒ์ฆํ ์ ์๋ ํ๊ตญ ํน์ด์ ๊ณ ํ์ง ์๋ฌผ์ํ ๋ฐ์ดํฐ
5-2. ์ญ์ค ๊ตฌ์กฐ
quadrantChart
title ํฌ์ ๋ฐฉํฅ ๋ถ์: ์๋ฒ๋ฆฐ AI vs ๋ฐ์ดํฐ ์์ฐ
x-axis "๋ฎ์ ํ์ค์ ํจ๊ณผ" --> "๋์ ํ์ค์ ํจ๊ณผ"
y-axis "๋ฎ์ ์ ์ฑ
๊ด์ฌ๋" --> "๋์ ์ ์ฑ
๊ด์ฌ๋"
quadrant-1 "๊ณผ์ ํฌ์ ์์ญ"
quadrant-2 "์ ๋ต์ ๊ณต๋ฐฑ"
quadrant-3 "๋ฌด๊ด์ฌ ์์ญ"
quadrant-4 "์ ํ๊ฐ ๊ณ ํจ์จ"
"์๋ฒ๋ฆฐ AI ๋ชจ๋ธ ๊ฐ๋ฐ": [0.3, 0.85]
"AI ์ธํ๋ผ(GPU ํด๋ฌ์คํฐ)": [0.45, 0.80]
"ํ์คํ ๋ฐ์ดํฐ ์์ฐ": [0.85, 0.35]
"์ ์ PI ์ฐ๊ตฌ๋น ํ๋": [0.80, 0.25]
"๋ฐ์ดํฐ ๊ด๋ฆฌ ์ธ๋ ฅ ํ๋ณด": [0.75, 0.20]
"๊ตญ์ ํ๊ฐ์ฒด๊ณ ๋์
": [0.70, 0.15]
ํ์ฌ ํ๊ตญ ์ ์ฑ ์ ๊ณผ์ ํฌ์ ์์ญ(์๋ฒ๋ฆฐ AI, GPU ์ธํ๋ผ)์ ์ง์คํ๋ฉด์ ์ ํ๊ฐ ๊ณ ํจ์จ ์์ญ(๋ฐ์ดํฐ ์์ฐ, ์ ์ PI ์ง์)์ ๋ฐฉ์นํ๊ณ ์๋ค๋ ๊ฒ์ด ์ด ์ปค๋ฎค๋ํฐ์ ์ง๋จ์ด๋ค.
5-3. ์์ธก: ์๋ฒ๋ฆฐ AI์ ํดํ๋ํ
โ์๊ฐ์ด ์ง๋๊ณ ๊ฒฐ๊ตญ ๊ฐ์ ์์์ ๋ต์ ์ฐพ์๋ฏ. ๋ฐ์ดํฐ๋ ํด์ธ์๋ ๋ง์ด ๊ณต๊ฐ๋์๊ณ , ๊ฐ์์ ์ฐ๊ตฌ ์ง๋ฌธ์ ํ๊ธฐ ์ํด ์์ฒด์ ์ผ๋ก ํด์ธ์ ๋ชจ๋ธ์ ์ฌ์ฉํ ๊ฒ์ด๊ณ . ์๋ฒ๋ฆฐ AI๋ ์ด๋์ ๋ ์๋ ํดํ๋์ผ๋ก ๋๋ ๊ฒ.โ
์ด ์์ธก์ ๊ทผ๊ฑฐ๊ฐ ์๋ค. ํ๊ตญ ์ฐ๊ตฌ์๋ค์ ์ด๋ฏธ BioRxiv, dbGaP, GTEx, UK Biobank ๋ฑ์ ํด์ธ ๊ณต๊ฐ ๋ฐ์ดํฐ์ Hugging Face์ ๊ณต๊ฐ๋ ๊ธ๋ก๋ฒ ๋ชจ๋ธ๋ค์ ํ๋ฐํ ์ฌ์ฉํ๊ณ ์๋ค. ์ ์ฑ ์ด ํ์ค์ ๋ฐ๋ผ๊ฐ์ง ๋ชปํ๋ฉด, ์ฐ๊ตฌ์๋ค์ ์ ์ฑ ์์ด ๊ฐ์๋์ํ๋ค. ๊ทธ๊ฒ์ด ์ด ์ปค๋ฎค๋ํฐ๊ฐ ๋ชฉ๊ฒฉํ๊ณ ์๋ ํ์์ด๋ค.
6. NIH vs ํ๊ตญ ์ฐ๊ตฌ๋น ๊ด๋ฆฌ ์ฒด๊ณ ๋น๊ต
6-1. NIH ๋ชจ๋ธ์ ํน์ง
๋ฏธ๊ตญ NIH(National Institutes of Health)์ Extramural Grant ์์คํ ์ ๋ค์์ ํน์ง์ ๊ฐ๋๋ค:
Program Officer(PO) ์ ๋:
๊ณผ์ ๋ฅผ ๊ด๋ฆฌํ๋ Program Officer๋ ๋จ์ ํ์ ๊ฐ๊ฐ ์๋๋ผ ํด๋น ๋ถ์ผ์ ์ ๋ฌธ๊ฐ๋ค. @humangenomicslab์ด ์ธ๊ธํ PsychENCODE ๊ณผ์ ์ PO๋ Nature Neuroscience ์๋ํฐ ์ถ์ ์ด์๋ค. ์ฆ, ๋ถ์ผ์ ์ต์ ์ ์ฐ๊ตฌ์ ์์ค์ ์ ๋ฌธ์ฑ์ ๊ฐ์ถ ์ฌ๋์ด ๊ณผ์ ๋ฅผ ๊ด๋ฆฌํ๋ค.
์ฐ์ฐจ ํํ ํผ๋๋ฐฑ ์์คํ
:
๋งค๋
์ฐ์ฐจ ๋ณด๊ณ ๋ฅผ ๋จ์ ์๋ฅ๋ก ์ฒ๋ฆฌํ์ง ์๋๋ค. ์ฐ๊ตฌ์๋ค์ด ํํ์ ๋ชจ์ฌ ๋ผ์ด๋ธ๋ก ํผ๋๋ฐฑ์ ๊ตํํ๋ค. PO๊ฐ ์ง์ ์ฐธ์ํด ํ์ฅ์์ ๋ฐฉํฅ์ ์กฐ์จํ๋ค.
์ฅ๊ธฐ์ Follow-up:
๋จ๋ฐ์ฑ ๊ณผ์ ๊ฐ ์๋๋ผ ๊ณผ์ ์ข
๋ฃ ํ์๋ ์ฐ์์ฑ์ด ์ ์ง๋๋ค. ๋ฐ์ดํฐ ๊ด๋ฆฌ, ๋ค์ ๊ณผ์ ๋ก์ ์ฐ๊ฒฐ, ๋ฐ์ดํฐ ๊ณต๊ฐ ๊ด๋ฆฌ ๋ฑ์ด ์ฒด๊ณ์ ์ผ๋ก ์ด๋ฃจ์ด์ง๋ค.
๊ตญ์ ํ๊ฐ:
์ด์ค๋ผ์, ์๊ตญ, ์คํ์ธ ๋ฑ ์ฌ๋ฌ ๊ตญ๊ฐ์์๋ ํน์ ๋ถ์ผ ์ฐ๊ตฌ์๋ฅผ ๊ตญ์ ์ ์ผ๋ก ํ์
ํ๊ณ ํด์ธ ์ ๋ฌธ๊ฐ์๊ฒ ๊ณผ์ ํ๊ฐ๋ฅผ ๋งก๊ธฐ๋ ์์คํ
์ด ์ด์๋๋ค.
6-2. ํ๊ตญ ๋ชจ๋ธ์ ๊ตฌ์กฐ์ ํ๊ณ
flowchart LR
subgraph KR["๐ฐ๐ท ํ๊ตญ ์ฐ๊ตฌ๋น ๊ด๋ฆฌ ๊ตฌ์กฐ"]
KR1["๊ณผ์ ๊ณต๋ชจ"]
KR2["์ ์ ยท์ง์"]
KR3["์ฐ์ฐจ ๋ณด๊ณ \n(ํ์ ์์ฃผ)"]
KR4["๊ณผ์ ์ข
๋ฃ"]
KR5["๋ฐ์ดํฐ ๋ฐฉ์น\n(์ ๊ทผ ๋ถ๊ฐ)"]
KR1 --> KR2 --> KR3 --> KR4 --> KR5
KR5 -.->|"๋ค์ ๊ณผ์ ์ ๋จ์ "| KR1
end
subgraph US["๐บ๐ธ NIH ์ฐ๊ตฌ๋น ๊ด๋ฆฌ ๊ตฌ์กฐ"]
US1["๊ณผ์ ๊ณต๋ชจ\n(๋ถ์ผ ์ ๋ฌธ๊ฐ PO ์ค๊ณ)"]
US2["์ ์ ยท์ง์"]
US3["์ฐ์ฐจ ํํ\n(๋ผ์ด๋ธ ํผ๋๋ฐฑ)"]
US4["๊ณผ์ ์ข
๋ฃ"]
US5["๋ฐ์ดํฐ ๊ณต๊ฐ ๊ด๋ฆฌ\n(์ง์์ ์ ๊ทผ ๋ณด์ฅ)"]
US1 --> US2 --> US3 --> US4 --> US5
US5 -->|"์ฐ์ ๊ณผ์ ์ฐ๊ฒฐ"| US1
end
style KR5 fill:#ffcdd2,stroke:#c62828
style US5 fill:#c8e6c9,stroke:#2e7d32
ํต์ฌ ์ฐจ์ด: ์ธ๋ ฅ
๋ ๊ทผ๋ณธ์ ์ผ๋ก๋: โํ๊ตญ์ ์ฌ๋์ด ์ค์ํ์ง ์๊ธฐ ๋๋ฌธ์.โ
์ด๊ฒ์ ๋จ์ํ ๋์๊ฐ ์๋๋ค. ์์คํ
์ ๊ตฌ์กฐ๋ฅผ ๋๋ฌ๋ด๋ ๊ด์ฐฐ์ด๋ค. ํ๋์จ์ด(์๋ฒ, GPU, ์ฐ๊ตฌ์์ค)์ ๋ํ ํฌ์๋ ๊ฐ์์ ์ด๊ณ ์ ์น์ ์ผ๋ก ์ดํํ ์ ์๋ค. ํ์ง๋ง ์ ๋ฌธ ์ธ๋ ฅ์ ๋ํ ํฌ์๋ ๊ทธ ํจ๊ณผ๊ฐ ์ฅ๊ธฐ์ ์ด๊ณ ๋น๊ฐ์์ ์ด๋ผ ์์ฐ ์ฌ์๋ฅผ ํต๊ณผํ๊ธฐ ์ด๋ ต๋ค.
6-3. ๋ฐ์ดํฐ ์ ๊ทผ์ฑ ๋ฌธ์ ์ ์ค๋ก
7. ๋ฐ์ด์ค AI ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ ํ์ค
7-1. ์ฃผ์ ๋ฐ์ด์ค ํ์ด๋ฐ์ด์ ๋ชจ๋ธ ํํฉ
ํ์ฌ ๋ฐ์ด์ค ์ฐ๊ตฌ์์ ์ค์ ๋ก ์ฌ์ฉ๋๋ ์ฃผ์ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ๋ค์ ์ ๋ฆฌํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค:
| ๋ชจ๋ธ | ๊ฐ๋ฐ์ฌ/๊ธฐ๊ด | ๋๋ฉ์ธ | ํน์ง |
|---|---|---|---|
| AlphaFold3 | Google DeepMind | ๋จ๋ฐฑ์ง ๊ตฌ์กฐ | ๋ค๋ถ์ ๋ณตํฉ์ฒด ์์ธก, ์ ๋ก์ท |
| ESM-3 | Meta AI | ๋จ๋ฐฑ์ง ์ํ์คยท๊ตฌ์กฐ | ๋ฉํฐ๋ชจ๋ฌ, ํ์ธํ๋ ๊ฐ๋ฅ |
| Evo | Arc Institute | ์ ์ ์ฒด | DNA ์์ค์ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ |
| GeneFormer | NIH/Broad | ๋จ์ธํฌ ์ ์ฌ์ฒด | scRNA-seq ์ ๋ฌธ |
| BioMedGPT | ๋ค์ | ์์๋ช ๋ฌธํ | ์์-์ฐ๊ตฌ ์ตํฉ |
| scGPT | ๋ค์ ๊ธฐ๊ด | ๋จ์ธํฌ ์๋ฌผํ | ์ธํฌ ์ ํ ์์ธกยท์๋ฒ ๋ฉ |
7-2. 2025-2026๋ ํธ๋ ๋: ์๊ท๋ชจ ํนํ ๋ชจ๋ธ์ ๋ถ์
๋ํ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ด ๊ด๋ฒ์ํ ๋ฅ๋ ฅ์ ์ ๊ณตํ๋ ๋ฐ๋ฉด, ํน์ ์ฐ๊ตฌ์ค์ ํน์ ์คํ ์กฐ๊ฑด์ ์ต์ ํ๋ ์๊ท๋ชจ ๋ชจ๋ธ๋ค์ด ์ค์ ์ฐ๊ตฌ ํ์ฅ์์ ๋ ์ ์ฉํ ์ ์๋ค. ์ด๋ฐ ๋ชจ๋ธ์ ํ์ธํ๋ํ๊ธฐ ์ํด์๋ ํด๋น ๋๋ฉ์ธ์ ํ์คํ๋ ๋ฐ์ดํฐ๊ฐ ๊ฒฐ์ ์ ์ด๋ค.
7-3. ํ์ธํ๋์ ์ํ ๋ฐ์ดํฐ ์๊ตฌ์ฌํญ
mindmap
root((๋ฐ์ด์ค AI ํ์ธํ๋์ ์ํ ๋ฐ์ดํฐ ์๊ฑด))
ํ์คํ
๊ตญ์ ํ์ค ํฌ๋งท ์ค์
FASTQ/BAM for ์ํ์ฑ
NIfTI for ๋์์
DICOM for ์๋ฃ์์
์จํจ๋ก์ง ๊ธฐ๋ฐ ์ด๋
ธํ
์ด์
Gene Ontology
Disease Ontology
HPO
์ ํฉ์ฑ
๋ฐฐ์น ํจ๊ณผ ๋ณด์
QC ๊ธฐ์ค ํต์ผ
๊ฒฐ์ธก๊ฐ ์ฒ๋ฆฌ ํ์คํ
์ ๊ทผ์ฑ
์คํ ์ก์ธ์ค ๋ผ์ด์ ์ค
์์ ์ ์ ์ฅ์
์ง์์ ๊ด๋ฆฌ
๊ท๋ชจ
์ถฉ๋ถํ ์ํ ์
๋ค์ํ ์ธ๊ตฌ์ง๋จ ํฌํจ
์ข
๋จ ์ฐ๊ตฌ ๋ฐ์ดํฐ
8. ๋ฐ์ดํฐ ์ฃผ๊ถ๊ณผ ์ฐ๊ตฌ ๋ฐ์ดํฐ์ ๊ณต๊ฐ์ฑ ๋๋ ๋ง
8-1. @bioaio์ ํต์ฌ ๋นํ
โ๊ทธ๋ฅ ๋ฌด์กฐ๊ฑด ํ์์ ๋ง์ด QC ๊ธฐ์ค๋ง ํต๊ณผ์ํจ ๋ฐ์ดํฐ๋ค ์์ฒญ๋ ์ฐ๊ตฌ๋น ์์๋ถ์ด์ ๊ฒฐ๊ตญ ๋์ค์ ํ์์ ์ธ ์๋ฒ์์ ๊ฐ๋ฌ๋๊ณ ์ฐ๊ธฐ๋ ์ด๋ ต๊ฒ ํ๋ฉด์ ๋ฌด์จ ์ข์ ์ฐ๊ตฌ ์ฑ๊ณผ๋ฅผ ๊ธฐ๋ํ๋๊ฒ ์ฐธ ์ด๋ถ์ฑ์ค์ด์ฃ โ
์ด ๋ฌธ์ฅ ํ๋๊ฐ ํ๊ตญ ์์ ๋ฐ์ดํฐ ์ํ๊ณ์ ๋ฌธ์ ๋ฅผ ๋ชจ๋ ๋ด๊ณ ์๋ค:
- ์ ์์ฃผ์ ๋ฐ์ดํฐ ์์ง: QC ๊ธฐ์ค๋ง ํต๊ณผํ๋ฉด ๋๋ ์ ํ์ง ๋๋ ์์ง
- ํ์์ ๋ณด๊ด: ์์ง ํ ์ ๊ทผ ๋ถ๊ฐ๋ฅํ ์๋ฒ์ ๋ฐฉ์น
- ํฌ์ ๋๋น ์ฑ๊ณผ ์์: ๋๊ท๋ชจ ์ฐ๊ตฌ๋น ํฌ์ โ ํ์ฉ ๋ถ๊ฐ๋ฅ
8-2. ๊ณต๊ฐ์ฑ๊ณผ ๋ณด์์ ๊ธด์ฅ
๋ฐ์ด์ค ๋ฐ์ดํฐ, ํนํ ์์ ๋ฐ์ดํฐ๋ ๊ฐ์ธ์ ๋ณด ๋ณดํธ์ ๊ณต๊ฐ์ ํ์ฉ ์ฌ์ด์ ๊ธด์ฅ์ ํญ์ ์๊ณ ์๋ค. ํ์ง๋ง ์ด ๊ธด์ฅ์ ํ๊ณ๋ก ๋ฐ์ดํฐ๋ฅผ ์์ ํ ๋ด์ธํ๋ ๊ฒ์ ๋ค๋ฅธ ๋ฌธ์ ๋ค.
๊ตญ์ ๋ชจ๋ฒ ์ฌ๋ก:
- UK Biobank: 50๋ง ๋ช ์ฝํธํธ, ์ธ๊ณ ์ด๋์๋ ์ ์ฒญ ํ ์ ๊ทผ ๊ฐ๋ฅ
- dbGaP (NIH): ํต์ ์ ๊ทผ(Controlled Access) ์ ๋๋ก ์ฐ๊ตฌ์ ๊ฒ์ฆ ํ ๊ณต๊ฐ
- ENCODE Project: ์ ์ฌ์ฒดยทํ์ฑ์ ์ ์ฒด ๋ฐ์ดํฐ ์์ ๊ณต๊ฐ
- PsychENCODE: ๋ ์ ์ฌ์ฒดยทํ์ฑ์ ์ ์ฒด ๋ฐ์ดํฐ, NIH PO ๊ด๋ฆฌํ์ ๊ณต๊ฐ
ํ๊ตญ์ ํ์ค:
Korea Biobank ๋ฑ์ด ๊ตฌ์ถ๋์ด ์์ผ๋, ์ ๊ทผ ์ ์ฐจ์ ๋ณต์ก์ฑ, ์๋ต ์ง์ฐ, ์ง์์ ๊ด๋ฆฌ ๋ถ์ฌ ๋ฑ์ผ๋ก ์ค์ ํ์ฉ์จ์ด ๋ฎ๋ค.
9. ์ธ๋๋ก : ์ ์ PI๋ค์ด ์ด์ ๋ฅผ ์ฅ ์ด์
9-1. ์ธ๋ ๊ตฌ๋ถ์ ํต์ฌ
80๋
๋ ํ๋ฒ ๊ต์ ์ธ๋ (์ง๊ด ์ฐ๊ตฌ):
ํ์คํ๋ณด๋ค ์ง๊ด๊ณผ ๊ฒฝํ์ด ์ค์ฌ. ์คํ ๊ฒฐ๊ณผ์ ์ฌํ์ฑ๋ณด๋ค ๋ฐ๊ฒฌ ์์ฒด๊ฐ ์ฐ์ . ๋ฐ์ดํฐ ๊ณต์ ์ ํ์คํ๋ ๊ดํ์ด ์๋์๋ค.
์ต๊ทผ 10๋
๋ด ํธ๋ ์ด๋ PI ์ธ๋ (๋ฐ์ดํฐ ํ์คํ ์ฐ๊ตฌ):
๊ตญ์ ํ์ ์ง์ ๋ฐ์ดํฐ ๊ณต์ ์๊ตฌ, FAIR ์์น(Findable, Accessible, Interoperable, Reusable), ์ฌํ์ฑ ์๊ธฐ์ ๋ํ ๋์์ผ๋ก ํ์คํ๋ ๋ฐ์ดํฐ ์์ฐ์ด ๊ธฐ๋ณธ ํ๋ จ์ ํฌํจ๋ ์ธ๋. โwet lab 100%โ๋ผ๋ ๋ฐ์ดํฐ๋ฅผ ํ์คํ๋ ํํ๋ก ๊ธฐ๋กํ๊ณ ๊ณต์ ํ๋ ๊ฒ์ด ๋น์ฐํ ์ธ๋๋ค.
gantt
title ๋ฐ์ด์ค ์ฐ๊ตฌ PI ์ธ๋์ ๋ฐ์ดํฐ ํจ๋ฌ๋ค์ ๋ณํ
dateFormat YYYY
axisFormat %Y
section 80๋
๋ ํ๋ฒ (ํ์ฌ 50~60๋)
์ง๊ด ์ฐ๊ตฌ ์ ์ฑ๊ธฐ :1980, 2000
๊ตญ์ ํยทํ์คํ ์๋ฐ :1995, 2010
AI ๋๊ตฌ ์ ์ ์ค :2020, 2030
section 90~00๋
๋ ํ๋ฒ (ํ์ฌ 30~40๋)
ํ์คํ ํ๋ จ ์ํ ์ธ๋ :2000, 2015
๋น
๋ฐ์ดํฐยท์ค๋ฏน์ค ์ ์ฑ๊ธฐ :2010, 2020
AI ๋ค์ดํฐ๋ธ ์ฐ๊ตฌ ์์ :2018, 2030
section ํ์ฌ ์ฃผ๋์ด PI
AI ํ์ด๋ฐ์ด์
๋ชจ๋ธ ํ์ฉ :2022, 2030
์๊ท๋ชจ ํนํ ๋ชจ๋ธ ํ์ธํ๋:2024, 2030
9-2. โํคํธ๋ฅผ ์ฌ์ ์คํํ๋ ์ธ๋โ๋ผ๋ ๋นํ์ ์ญ์ค
์ผ๋ถ์์๋ ์ ์ ์ธ๋๋ฅผ โํ๋กํ ์ฝ ํคํธ๋ฅผ ์ฌ์ ๊ทธ๋๋ก ์คํํ๋ ์ธ๋โ๋ผ๊ณ ๋นํํ๋ค. ์ง์ ๋ฒํผ๋ฅผ ์กฐ์ ํ๊ณ ํ๋กํ ์ฝ์ ๊ฐ๋ฐํ๋ ์ด์ ์ธ๋์ ๊ด์ ์์ ๋ณด๋ฉด ๊ทธ๋ด ์ ์๋ค.
๊ทธ๋ฌ๋ AI ๋ฐ์ดํฐ ์์ฐ์ ๋งฅ๋ฝ์์ ์ด๊ฒ์ ํ์คํ์ ๊ฐ์ ์ด ๋๋ค. ํคํธ ๊ธฐ๋ฐ ์คํ์ ๋ฐฐ์น ๊ฐ ๋ณ์ด๊ฐ ์ ๊ณ , ๊ฒฐ๊ณผ๊ฐ ์ฌํ ๊ฐ๋ฅํ๋ฉฐ, ๋ค๋ฅธ ์ฐ๊ตฌ์ค๊ณผ ์ง์ ๋น๊ต ๊ฐ๋ฅํ๋ค. ์ด๋ AI ํ์ธํ๋ ๋ฐ์ดํฐ์ ํต์ฌ ์๊ฑด์ด๋ค.
9-3. ์ฐ๊ตฌ๋น ๋ฐฐ๋ถ์ ๊ตฌ์กฐ์ ์ญ์ค
์ ์ PI๋ค์ด AI ์๋์ ์ ํฉํ ๋ฐ์ดํฐ๋ฅผ ์์ฐํ ์ ์๋ ์ธ๋์์๋, ์ฐ๊ตฌ๋น ๋ฐฐ๋ถ์ ์๋์ด ๊ต์๋ค์๊ฒ ์ง์ค๋์ด ์๋ค. ์ด๊ฒ์ด @humangenomicslab์ด โ์ ์ ์ธ๋ PI๋ค์๊ฒ ์ฐ๊ตฌ๋น๋ฅผ ๋ ์ค์ผ ํ๋คโ๊ณ ์ฃผ์ฅํ๋ ์ด์ ๋ค.
10. ์ ์ธ: ํ๊ตญ ๋ฐ์ด์ค AI ์ํ๊ณ๊ฐ ๋์๊ฐ ๋ฐฉํฅ
์ด์์ ๋ถ์์ ์ข ํฉํ์ฌ, Threads ์ปค๋ฎค๋ํฐ์ ๋ ผ์๊ฐ ์๋ฌต์ ์ผ๋ก ์ ์ํ๋ ์ ์ฑ ๋ฐฉํฅ์ ๊ตฌ์กฐํํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
10-1. ํฌ์ ์ฐ์ ์์ ์ฌํธ
flowchart TD
PROB["๐ด ํ์ฌ ๋ฌธ์ \n์๋ฒ๋ฆฐ AI ์ง์ฐฉ + ๋ฐ์ดํฐ ์ํ๊ณ ๋ฐฉ์น"]
PROB --> S1
PROB --> S2
PROB --> S3
subgraph S1["1. ๋ฐ์ดํฐ ์ธํ๋ผ ํฌ์"]
D1["ํ์คํ ๋ฐ์ดํฐ ์์ฐ ๊ณผ์ ํ๋"]
D2["๋ฉํฐ์ผํฐ ์ฝํธํธ ๊ตฌ์ถ ์ง์"]
D3["๋ฐ์ดํฐ ์ฅ๊ธฐ ๊ด๋ฆฌ ์์ฐ ์๋ฌดํ"]
D1 --> D2 --> D3
end
subgraph S2["2. ์ธ๋ ฅ ๊ตฌ์กฐ ํ์ "]
H1["์ ๋ฌธ Program Officer ์ฑ์ฉ\n(๋ฐ์ฌ๊ธ ๋ถ์ผ ์ ๋ฌธ๊ฐ)"]
H2["๋ฐ์ดํฐ ์คํ์ด๋ ์ง๊ตฐ ์ ์ค"]
H3["๊ตญ์ ๋๋ฃ ํ๊ฐ ์์คํ
๋์
"]
H1 --> H2 --> H3
end
subgraph S3["3. ์ธ๋ ์ ํ ์ง์"]
G1["์ฃผ๋์ด PI ๋
๋ฆฝ ์ฐ๊ตฌ๋น ํ๋"]
G2["๊ธ๋ก๋ฒ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ํ์ฉ ์ง์"]
G3["๋ฐ์ดํฐ ๊ณต๊ฐยท๊ณต์ ์ธ์ผํฐ๋ธ"]
G1 --> G2 --> G3
end
S1 & S2 & S3 --> RESULT["๐ข ๋ชฉํ\n๊ธ๋ก๋ฒ ๋ฐ์ด์ค AI ์ฐ๊ตฌ ๊ฒฝ์๋ ฅ ํ๋ณด\n(์๋ฒ๋ฆฐ AI๊ฐ ์๋ ๋ฐ์ดํฐ ์ฃผ๊ถ)"]
style PROB fill:#ffcdd2,stroke:#c62828
style RESULT fill:#c8e6c9,stroke:#2e7d32
10-2. ์ง์ ํ ๋ฐ์ดํฐ ์ฃผ๊ถ์ ์๋ฏธ
์ญ์ค์ ์ผ๋ก, ๋ฐ์ดํฐ ์ฃผ๊ถ์ ํ๋ณดํ๋ ๊ฐ์ฅ ์คํจ์ ์ธ ๋ฐฉ๋ฒ์ ์๋ฒ๋ฆฐ AI ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ์ด ์๋๋ผ ํ๊ตญ ํน์ด์ ๋ฐ์ดํฐ๋ฅผ ๊ตญ์ ํ์ค์ผ๋ก ์์ฐํ๊ณ ๊ด๋ฆฌํ๋ ๊ฒ์ด๋ค.
ํ๊ตญ์ธ ์ ์ ์ฒด ๋ฐ์ดํฐ, ํ๊ตญ ํ์ ์์ ๋ฐ์ดํฐ, ํ๊ตญ ์ํยทํ๊ฒฝ ๋ ธ์ถ ๋ฐ์ดํฐ๊ฐ ์ ์ ๋น๋์ด ์๋ค๋ฉด:
- ๊ธ๋ก๋ฒ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ ํ์ธํ๋ ๋ ๋ฒ๋ฆฌ์ง๋ฅผ ๊ฐ์ง ์ ์๋ค
- ๊ตญ์ ๊ณต๋ ์ฐ๊ตฌ์์ ํ๊ตญ์ ํ์๋ ฅ์ด ๋์์ง๋ค
- ํ๊ตญ ์ฐ๊ตฌ์๋ค์ด ๊ธ๋ก๋ฒ ๋ชจ๋ธ์ ๋ํ ์ค์ง์ ์ํฅ๋ ฅ์ ํ์ฌํ ์ ์๋ค
์ด๊ฒ์ด ์ง์ ํ AI ์ฃผ๊ถ์ด๋ค.
10-3. ๋ฐ์ด ์ ํ๋ ์ต์ข ๋ฉ์์ง
์ฒ์์ ๋ฐ์ผ๋ก ๋์๊ฐ์. Agentic AI ์๋์ ๐ฉ ๊ตฐ์ง์ ๊ณตํฌ์ค๋ฝ์ง๋ง, ๋์์ ํฌ๋ง์ ์ญ์(้ๅ)์ด๊ธฐ๋ ํ๋ค.
๊ฐ์ ๋ ผ๋ฆฌ๋ก:
Good Data + Agentic AI = ์ฐ๊ตฌ ์ฑ๊ณผ์ ์ง์์ ์ฆํญ
์ข์ ๋ฐ์ดํฐ์ ์์ด์ ํฑ AI๋ฅผ ๋ํ๋ฉด, ์์ญ ๋ช ์ ์ฐ๊ตฌ์๊ฐ ํ์ ๊ฑธ๋ฆด ๊ฐ์ค ๊ฒ์ฆ์ ์๋ํํ ์ ์๋ค. ๋ฐ์ด ๊ฒฝ๊ณ ํ๋ ๊ฒ์ ๊ธฐ์ ์ด ์๋๋ผ ๋ฐ์ดํฐ์ ๋ํ ํ๋๋ค.
โ์ข์ ์๋ฆฌ๋ ์ข์ ์ฌ๋ฃ์์๋ถํฐ ์์ํ๋คโ๋ @bioaio์ ๋น์ ์ฒ๋ผ, AI ์๋์ ๊ฒฝ์๋ ฅ์ ๊ฒฐ๊ตญ ๋ฐ์ดํฐ๋ผ๋ ์ฌ๋ฃ๋ก ๊ฒฐ์ ๋๋ค.
๋ถ๋ก: ์ฐธ๊ณ ์ค๋ ๋ ๋ฐ ์๋ฃ
| ์ถ์ฒ | ์์ฑ์ | ํต์ฌ ์ฃผ์ |
|---|---|---|
| Threads @humangenomicslab | ๋ฐ์ด์ค AI ์ฐ๊ตฌ์ | ์๋ฒ๋ฆฐ AI vs ๋ฐ์ดํฐ ์์ฐ ํฌ์ |
| Threads @spring.sleep.joy | ๋ฐ์ด์ค ์ฐ๊ตฌ์ | NIH vs ํ๊ตญ ์ฐ๊ตฌ๋น ๊ด๋ฆฌ ๋น๊ต |
| Threads @bioaio | ๋ฐ์ด์ค AI ์ฐ๊ตฌ์ | ๋ฐ์ดํฐ ํ์ง๊ณผ AI ์ฐ๊ตฌ ์ฑ๊ณผ์ ๊ด๊ณ |
| @bioaio ๋ฐํ ์๋ฃ | โ | ๋ณธ ๋ฌธ์์ ํต์ฌ ๋ฐ ์ด๋ฏธ์ง ์์ถ์ฒ |
ํต์ฌ ์ฉ์ด ์ ๋ฆฌ
| ์ฉ์ด | ์ค๋ช |
|---|---|
| GIGO | Garbage In, Garbage Out. ๋์ ์ ๋ ฅ์ ๋์ ์ถ๋ ฅ์ ๋ณ๋๋ค๋ ์ปดํจํฐ ๊ณผํ์ ์์น |
| ์๋ฒ๋ฆฐ AI | ๊ตญ๊ฐ ์ฃผ๋๋ก ์๊ตญ ์ธ์ดยท๋ฌธํยท๋ฐ์ดํฐ ๊ธฐ๋ฐ AI ์ธํ๋ผ๋ฅผ ๋ณด์ ํ๋ ์ ๋ต |
| ํ์ด๋ฐ์ด์ ๋ชจ๋ธ | ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ก ์ฌ์ ํ๋ จ๋ ๋ํ AI ๋ชจ๋ธ. ํ์ธํ๋์ ํตํด ํนํ ๊ฐ๋ฅ |
| ์ ๋ก์ท(Zero-shot) | ํ์ธํ๋ ์์ด ์ฌ์ ํ๋ จ ์ํ ๊ทธ๋๋ก ์๋ก์ด ์์ ์ ์ ์ฉ |
| ํ์ธํ๋ | ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ํน์ ๋๋ฉ์ธ ๋ฐ์ดํฐ๋ก ์ถ๊ฐ ํ์ต |
| Wet Lab | ์ค์ ์๋ฌผยทํํ ์คํ์ ์ํํ๋ ์คํ์ค. In silico(๊ณ์ฐ) ์ฐ๊ตฌ์ ๋๋น ๊ฐ๋ |
| Program Officer (PO) | NIH ๋ฑ์์ ๊ณผ์ ๋ฅผ ๊ด๋ฆฌํ๋ ๋ถ์ผ ์ ๋ฌธ๊ฐ |
| FAIR ์์น | Findable, Accessible, Interoperable, Reusable. ๊ณผํ ๋ฐ์ดํฐ ๊ณต๊ฐ ํ์ค |
| PI | Principal Investigator. ์ฐ๊ตฌ์ฑ ์์ |
| Agentic AI | ์์จ์ ์ผ๋ก ๊ณํ-์คํ-๊ฒ์ฆ์ ์ํํ๋ ๋ค์ค AI ์์ด์ ํธ ์์คํ |
์ด ๋ฌธ์๋ 2026๋ 4์ 22์ผ ๊ธฐ์ค, Threads ํ๊ตญ ๋ฐ์ด์ค AI ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ๊ณต๊ฐ ํ ๋ก ๊ณผ ๋ฐ ์ด๋ฏธ์ง๋ฅผ ๋ถ์ํ์ฌ ์์ฑ๋ ์ฐธ๊ณ ์๋ฃ์ ๋๋ค. ์ธ์ฉ๋ Threads ๊ฒ์๋ฌผ์ ์ ์๊ถ์ ์์ ์์๊ฒ ์์ต๋๋ค.
