Physical AI란 무엇인가
지난 몇 년의 AI는 대부분 디지털 세계에 살았습니다 — 텍스트를 쓰고, 이미지를 그리고, 코드를 짰죠. 그런데 다음 물결은 물리 세계로 나옵니다. 로봇이 물건을 집고, 차가 길을 달리고, 드론이 지형을 납니다. 이렇게 물리 세계를 인지하고 그 안에서 행동하는 지능이 Physical AI입니다.
이 글은 시리즈의 출발점이라 조금 길게 갑니다 — Physical AI가 디지털 AI와 무엇이 다른지, 왜 지금 떠오르는지, 가장 큰 벽인 데이터 문제를 어떻게 푸는지, 그리고 그 답이 왜 시뮬레이션인지까지.
디지털 AI vs Physical AI
도식 렌더링 중…
결정적 차이는 닫힌 고리(closed loop) 입니다. 디지털 AI는 입력→출력으로 끝나지만, Physical AI는 행동이 세상을 바꾸고, 바뀐 세상을 다시 인지하는 순환 안에 있습니다. 그리고 그 세상은 — 중력이 있고, 마찰이 있고, 시간이 흐르고, 한 번의 실수가 물건을 부숩니다. 되돌리기(Ctrl+Z)가 없습니다.
왜 지금인가 — 세 조각이 맞물렸다
Physical AI라는 말 자체는 새롭지 않지만, 2024~2026년에 갑자기 현실이 된 건 세 가지가 동시에 도착했기 때문입니다.
도식 렌더링 중…
- 파운데이션 모델 — LLM·VLM이 로봇에게 "빨간 컵을 집어"를 이해하고 일반화하는 능력을 줬습니다.
- GPU 시뮬레이션 — 수천 개 환경을 한 번에 굴려 시행착오를 값싸게 만들었습니다.
- 월드 모델·생성 영상 — 부족한 현실 데이터를 합성으로 채우게 됐습니다.
각각은 따로 있었지만, 셋이 맞물리자 비로소 "데모"가 "현장"으로 넘어가기 시작했습니다.
가장 큰 벽 — 데이터
여기서 Physical AI의 핵심 난제를 짚어야 합니다. LLM은 인터넷이라는 거대한 공짜 데이터(수조 토큰) 위에서 자랐습니다. 그런데 로봇 경험의 인터넷은 존재하지 않습니다.
| 디지털 AI(LLM) | Physical AI(로봇) | |
|---|---|---|
| 데이터 출처 | 인터넷 (사실상 무한·공짜) | 직접 모아야 함 |
| 수집 속도 | 긁어오면 끝 | 실시간 (1초는 1초) |
| 비용 | 거의 0 | 하드웨어·사람·시간 |
| 위험 | 없음 | 넘어지면 부서짐 |
| 다양성 | 방대 | 한 로봇·한 작업에 갇히기 쉬움 |
⚠️ 데이터 부족이 Physical AI의 진짜 병목이다 — 알고리즘이 아니라 경험이 모자랍니다. 실제 로봇으로 무한한 상황을 다 겪게 하는 건 너무 느리고 비싸고 위험합니다. 이 한 줄이 이 분야의 거의 모든 설계 결정을 지배합니다.
왜 그렇게 어려운가 — Moravec의 역설
"AI가 박사 시험은 풀어도 컵은 못 집는다"는 말이 있습니다(Moravec의 역설). 인간에게 쉬운 감각운동(걷기·집기)이 AI에겐 가장 어렵습니다. 물리 세계는 무한히 다양하고, 연속적이고, 예측 불가능하기 때문입니다 — 체스의 규칙은 적지만, "컵을 든다"의 경우의 수는 사실상 무한합니다.
데이터를 얻는 세 가지 길
데이터 부족을 푸는 길은 셋이고, 보통 함께 씁니다.
도식 렌더링 중…
- 실물 원격조작 — 사람이 로봇을 직접 조종해 모은 진짜 데이터. 정확하지만 느리고 적습니다.
- 시뮬레이션 — 수천 번 안전하게 시행착오. 값싸고 무한하지만 현실과의 reality gap이 남습니다.
- 사람 영상·월드 모델 — 생성 모델로 합성 데이터를 대량 생산. 규모는 크지만 간접적입니다.
💡 그래서 시뮬레이션이 핵심 인프라다 — 세 길 중 값싸고 무한하며 라벨까지 공짜인 건 시뮬레이션뿐입니다. 시뮬에서 다양성을 채우고, 합성으로 늘리고, Sim-to-Real로 현실에 옮기는 — 이게 데이터 부족을 푸는 가장 현실적인 길입니다.
Physical AI의 스택
물리 지능은 여러 층이 쌓여 만들어집니다.
도식 렌더링 중…
센서가 세상을 읽고, 월드 모델이 다음을 예측하고, 정책이 행동을 정하고, 액추에이터가 움직입니다. 이 스택의 각 층을 안전하게 학습·검증하는 무대가 시뮬레이션입니다.
⚠️ 물리를 진짜로 풀어야 한다 — Physical AI의 검증은 물리를 진짜로 계산할 때만 의미가 있습니다. 위치를 텔레포트하는 가짜 물리로 학습한 정책은 현실에서 무너집니다. "물리 기반"이 Physical AI의 전제 조건입니다.
우리의 자리 — 검증
파운데이션 모델이 정책을 쏟아낼수록, 진짜 병목은 "만드는 것"이 아니라 "그게 다양한 로봇·환경·작업에서 안전한지 검증하는 것" 으로 옮겨갑니다. 어떤 로봇이든 명세 한 장으로 올리고, 물리로 돌려, 표준 KPI로 채점하는 무대 — 그게 Physical AI 시대에 시뮬레이션 검증 플랫폼이 서는 자리입니다.
한 줄 정리
📌 Physical AI는 물리 세계를 인지하고 그 안에서 행동하는 닫힌 고리 지능이다(디지털 AI의 입력→출력과 달리, 되돌리기가 없다). 파운데이션 모델·GPU 시뮬·월드 모델 셋이 맞물려 지금 떠올랐고, 진짜 병목은 데이터(경험) 부족이다. 실물·시뮬·합성을 함께 쓰되 값싸고 무한한 건 시뮬레이션뿐 — 그래서 시뮬이 Physical AI의 핵심 인프라이자 검증 무대다.
