서브에이전트 풀 / 병렬 실행 마스터 가이드
OpenClaw 서브에이전트 풀은 sessions_spawn로 최대 8개의 독립 에이전트를 병렬 격리 생성하며, execFileAsync/spawn 이중 실행 모드와 ACP 8단계 채널바인딩으로 토큰 비용 없는 결정적 라우팅을 실현한다. 결함 격리 이중 구조가 개별 에이전트 실패를 전체 파이프라인에 파급하지 않도록 보호하고, 무상태 설계가 비정상 종료 시 Stateless Reconnect와 자동 리소스 정리를 가능하게 하여 바이브코딩 환경에서 신뢰성 있는 병렬 실행을 보장한다.
이 글의 핵심 주장과 근거
서브에이전트 풀 아키텍처의 핵심 원리
OpenClaw의 서브에이전트 풀은 비동기 작업 큐와 워커 스레드 풀을 결합한 하이브리드 아키텍처로, 각 작업마다 독립된 메모리와 고정된 CPU 할당량을 부여함으로써 진정한 병렬 실행을 가능하게 한다. sessions_spawn 명령어는 하나의 부모 세션에서 최대 8개의 서브에이전트를 동시에 배경 세션에 격리 생성하며, 각 에이전트는 완전히 독립된 네임스페이스에서 실행된다. 이 구조는 서로 다른 서브에이전트가 동일한 파일을 동시에 수정하는 경합 조건을 원천 차단하여 데이터 무결성을 보장한다. pool 레벨 스로틀링이 시스템 부하를 실시간으로 감지하여 실행 에이전트 수를 동적으로 조절하므로, 과부하 상황에서도 시스템 안정성을 유지한다.
execFileAsync/spawn 이중 실행 모드와 ACP 세션 격리
execFileAsync/spawn 이중 실행 모드는 CLI 명령을 동기 또는 비동기로 실행하는 두 가지 실행 엔진으로, LMStudio 스트리밍과 ACP 세션 격리를 동시에 지원한다. execFileAsync 모드는 명령 실행 완료까지 대기하는 동기 방식이고, spawn 모드는 비차단 방식으로 즉시 제어권을 반환하여 다른 작업을 병렬 수행할 수 있게 한다. ACP 세션 격리는 각 서브에이전트가 독립된 ACP 세션 네임스페이스에서 동작하여 부모 세션의 LLM 컨텍스트와 물리적으로 완전히 분리된 실행 환경을 제공한다. 이 무상태 설계 기반의 격리 메커니즘은 에이전트 간 메모리 누수나 컨텍스트 오염이 전체 시스템으로 전파되지 않도록 차단하며, 비정상 종료 상황에서도 Stateless Reconnect를 통해 이전 상태에서 복구할 수 있다.
ACP 8단계 채널바인딩과 결정적 라우팅 체계
ACP 8단계 채널바인딩은 채널 식별에서 종료 바인딩까지 8단계 폐곡선 구조로 세션 응집력을 보장하는 결정적 메시지 라우팅 체계다. 8단계 우선순위 체계는 동일 채널 우선, 부모 채널, 길드+역할, 길드, 팀, 계정, 채널 기본값, 폴백 기본값 순서로 라우팅 경로를 결정하며, 이 과정에서 실제 LLM 추론을 수반하지 않으므로 토큰 비용이 발생하지 않는다. dmScope 격리와 8단계 우선순위 라우팅의 이중 안전망은 채널 혼잡과 세션 충돌을 방지하며, Fan-Out 병렬 실행에서 생성된 격리된 에이전트의 결과를 올바른 부모 채널로 결정적으로 전달함을 보장한다.
Fan-Out/Fan-In 2단계 실행 체계와 결함 격리
Fan-Out 단계에서 메인 오케스트레이터는 원본 작업을 분석하여 동적으로 분해하고 최대 8개의 서브에이전트에 역할별 태스크를 위임한다. 각 서브에이전트는 독립 네임스페이스에서 병렬 실행되어 코딩, 데이터 처리, 외부 API 호출 등 세부 작업을 수행한다. Fan-In 단계에서는 분석 에이전트가 모든 서브에이전트의 결과를 수집하고 검증한 뒤 최종 통합 보고서를 생성한다. 결함 격리 이중 구조는 물리적 격리(프로세스/메모리)와 논리적 라우팅(ACP 채널바인딩)의 조합으로 개별 에이전트의 실패나 비정상 출력이 전체 파이프라인에 파급되지 않도록 보호하며, 실패 시 자동 재배치 및 복구 메커니즘이 다른 노드로 작업을 이전하여 무중단 서비스를 유지한다.
실제 적용 사례와 베스트 프랙티스
코딩 작업 병렬화의 실제 사례로, 대형 리포지토리 전체에 대한 자동 리팩터링 시 메인 에이전트가 각 모듈별로 서브에이전트를 sessions_spawn로 생성하고 각각 독립 디렉터리에서 코드 변환을 수행하면, 전체 처리 시간이 45분에서 12분으로 단축된다. 데이터 집계 파이프라인에서는 30개 웹사이트의 가격 정보를 동시 수집하여 8분에 완료하며 단일 스레드 대비 70% 단축을 달성한다. 베스트 프랙티스로는 작업 경계를 사전 정의하고, runTimeoutSeconds와 timeout으로 리소스 소비를 제한하며, 반환된 파일에 체크섬을 부여해 결과 무결성을 검증하고, 실패한 서브에이전트는 즉시 종료 후 재시작 정책을 적용하는 것이 핵심이다.
이 주제의 최종 원문 탐색하기
이 지식 허브의 가장 깊고 권위 있는 아키텍처 원문과 전체 맥락은 [여기에서 확인하실 수 있습니다](https://brunch.co.kr/@955079bf143b468/19).