AI 에이전트 프레임워크는 퍼즐을 완성하는 마지막 조각인가? 프레임워크의 "파동-입자 이중성"은 어떻게 해석할 수 있을까?
저자: Kevin, BlockBooster의 연구원
AI 에이전트 프레임워크는 산업 발전의 핵심 퍼즐로서, 기술의 실현과 생태계의 성숙을 촉진할 수 있는 이중 잠재력을 내포하고 있습니다. 시장에서 뜨거운 논의가 이루어지고 있는 프레임워크로는 Eliza, Rig, Swarms, ZerePy 등이 있습니다. 이러한 프레임워크는 Github Repo를 통해 개발자를 유치하고 명성을 쌓고 있습니다. "라이브러리" 형태로 토큰을 발행함으로써 이러한 프레임워크는 빛과 동시에 파동과 입자의 특성을 모두 갖추게 되며, 에이전트 프레임워크는 심각한 외부성과 Memecoin의 특성을 동시에 지니고 있습니다. 본 문서에서는 프레임워크의 "파동-입자 이중성"과 에이전트 프레임워크가 마지막 조각이 될 수 있는 이유를 중점적으로 해석할 것입니다.
에이전트 프레임워크가 가져오는 외부성은 거품이 사라진 후에도 봄싹을 남길 수 있다
GOAT의 탄생 이후, 에이전트 서사는 시장에 대한 충격의 강도가 계속해서 상승하고 있으며, 마치 한 명의 무술 대가처럼, 왼손은 "Memecoin", 오른손은 "산업의 희망"을 쥐고 있어, 당신은 항상 그 중 하나의 기술에 패배하게 될 것입니다. 사실, AI 에이전트의 응용 장면은 엄격히 구분되지 않으며, 플랫폼, 프레임워크 및 구체적인 응용 간의 경계가 모호하지만, 토큰이나 프로토콜의 선호에 따라 대략적으로 분류할 수 있습니다. 그러나 토큰이나 프로토콜의 발전 선호에 따라 다음과 같이 분류할 수 있습니다:
- Launchpad: 자산 발행 플랫폼. Base 체인의 Virtuals Protocol과 clanker, Solana 체인의 Dasha.
- AI 에이전트 응용: 에이전트와 Memecoin 사이에 떠 있는, 메모리 구성에서 두드러진 부분이 있는 응용, 예를 들어 GOAT, aixbt 등. 이러한 응용은 일반적으로 단방향 출력이며, 입력 조건이 매우 제한적입니다.
- AI 에이전트 엔진: Solana 체인의 griffain 및 base 체인의 Spectre AI. griffain은 읽기-쓰기 모드에서 읽기, 쓰기, 행동 모드로 진화할 수 있습니다; Spectre AI는 RAG 엔진으로, 체인 상 검색을 수행합니다.
- AI 에이전트 프레임워크: 프레임워크 플랫폼에 대해 에이전트 자체가 자산이므로, 에이전트 프레임워크는 에이전트의 자산 발행 플랫폼이며, 에이전트의 Launchpad입니다. 현재 대표적인 프로젝트로는 ai16, Zerebro, ARC 및 최근에 뜨거운 논의가 이루어지고 있는 Swarms가 있습니다.
- 기타 소규모 방향: 종합형 에이전트 Simmi; AgentFi 프로토콜 Mode; 반증형 에이전트 Seraph; 실시간 API 에이전트 Creator.Bid.
에이전트 프레임워크에 대해 더 논의해보면, 그것이 충분한 외부성을 가지고 있음을 알 수 있습니다. 각 대형 공공 체인과 프로토콜의 개발자는 서로 다른 개발 언어 환경에서 선택할 수 있지만, 산업 내 전체 개발자 규모는 해당 시장 가치 증가 속도에 비례하여 증가하지 않았습니다. Github Repo는 Web2와 Web3 개발자가 합의를 형성하는 장소로, 여기서 개발자 커뮤니티를 구축하는 것은 어떤 프로토콜이 단독으로 개발한 "즉시 사용 가능한" 패키지보다 Web2 개발자에게 더 강력한 매력과 영향을 미칩니다.
본 문서에서 언급된 4가지 프레임워크는 모두 오픈 소스입니다: ai16z의 Eliza 프레임워크는 6200개의 별을 받았고; Zerebro의 ZerePy 프레임워크는 191개의 별을 받았으며; ARC의 RIG 프레임워크는 1700개의 별을 받았고; Swarms의 Swarms 프레임워크는 2100개의 별을 받았습니다. 현재 Eliza 프레임워크는 다양한 에이전트 응용에 널리 사용되며, 가장 넓은 범위를 커버하는 프레임워크입니다. ZerePy의 개발 정도는 높지 않으며, 발전 방향은 주로 X에 있으며, 아직 로컬 LLM 및 통합 메모리를 지원하지 않습니다. RIG는 상대적으로 개발 난이도가 가장 높지만, 개발자에게 최대한의 성능 최적화를 실현할 수 있는 자유를 제공합니다. Swarms는 팀이 mcs를 출시한 것 외에는 다른 사용 사례가 없지만, Swarms는 다양한 프레임워크를 통합할 수 있어 큰 상상력을 제공합니다.
또한, 위의 분류에서 에이전트 엔진과 프레임워크를 분리하는 것은 혼란을 초래할 수 있습니다. 하지만 저는 두 가지가 다르다고 생각합니다. 먼저, 왜 엔진인가? 현실 생활의 검색 엔진과 비유하는 것이 상대적으로 적합합니다. 동질화된 에이전트 응용과는 달리, 에이전트 엔진의 성능은 그 위에 있지만, 동시에 완전히 캡슐화되어 있으며, API 인터페이스를 통해 조정되는 블랙박스입니다. 사용자는 포크 형태로 에이전트 엔진의 성능을 경험할 수 있지만, 기본 프레임워크처럼 전체 모습과 맞춤형 자유를 장악할 수는 없습니다. 각 사용자의 엔진은 조정된 에이전트에서 생성된 이미지와 같으며, 이미지를 상호작용하는 것입니다. 프레임워크는 본질적으로 체인에 적응하기 위해 존재하며, 에이전트가 에이전트 프레임워크를 만들 때, 최종 목적은 해당 체인과 통합하는 것입니다. 데이터 상호작용 방식을 어떻게 정의할 것인지, 데이터 검증 방식을 어떻게 정의할 것인지, 블록 크기를 어떻게 정의할 것인지, 합의와 성능의 균형을 어떻게 맞출 것인지, 이러한 것들은 프레임워크가 고려해야 할 사항입니다. 반면 엔진은 특정 방향에서 모델과 데이터 상호작용 및 메모리 간의 관계를 충분히 미세 조정하면 되며, 성능이 유일한 평가 기준이지만, 프레임워크는 그렇지 않습니다.
"파동-입자 이중성"의 관점에서 에이전트 프레임워크를 평가하는 것은 올바른 방향으로 나아가는 전제 조건일 수 있다
에이전트가 한 번의 입력 출력 생애 주기를 실행하는 데는 세 가지 부분이 필요합니다. 첫째, 기본 모델이 사고의 깊이와 방식을 결정하고, 그 다음 메모리는 사용자 정의할 수 있는 부분으로, 기본 모델에서 출력이 생성된 후 메모리에 따라 수정됩니다. 마지막으로 다양한 클라이언트에서 출력 작업을 완료합니다.
출처: @SuhailKakar
에이전트 프레임워크가 "파동-입자 이중성"을 가지고 있음을 증명하기 위해, "파동"은 "Memecoin"의 특성을 가지고 있으며, 커뮤니티 문화와 개발자 활발성을 나타내고, 에이전트의 매력과 전파 능력을 강조합니다; "입자"는 "산업 기대"의 특성을 나타내며, 기본 성능, 실제 사용 사례 및 기술 깊이를 나타냅니다. 저는 두 가지 측면에서 세 가지 프레임워크의 개발 튜토리얼을 예로 들어 설명할 것입니다:
빠른 조합식 Eliza 프레임워크
- 환경 설정
출처: @SuhailKakar
- Eliza 설치
출처: @SuhailKakar
- 구성 파일
출처: @SuhailKakar
- 에이전트 성격 설정
출처: @SuhailKakar
Eliza의 프레임워크는 상대적으로 사용하기 쉽습니다. TypeScript를 기반으로 하며, 이는 대부분의 Web 및 Web3 개발자가 익숙한 언어입니다. 프레임워크는 간결하며, 과도한 추상화가 없어 개발자가 원하는 기능을 쉽게 추가할 수 있습니다. 3단계를 통해 Eliza가 다중 클라이언트 통합을 지원할 수 있음을 알 수 있으며, 이를 다중 클라이언트 통합의 조립기로 이해할 수 있습니다. Eliza는 DC, TG 및 X와 같은 플랫폼을 지원하며, 다양한 대형 언어 모델을 지원하여 위의 소셜 미디어를 통해 입력하고, LLM 모델을 통해 출력을 생성하며, 내장 메모리 관리 기능을 통해 어떤 습관의 개발자라도 AI 에이전트를 신속하게 배포할 수 있습니다.
프레임워크의 간결성과 인터페이스의 풍부성 덕분에 Eliza는 접속 장벽을 크게 낮추어 상대적으로 통일된 인터페이스 표준을 실현했습니다.
원클릭 사용식 ZerePy 프레임워크
- ZerePy 라이브러리 포크하기
출처: https://replit.com/@blormdev/ZerePy?v=1
- X 및 GPT 구성
출처: https://replit.com/@blormdev/ZerePy?v=1
- 에이전트 성격 설정
출처: https://replit.com/@blormdev/ZerePy?v=1
성능 최적화식 Rig 프레임워크
RAG(검색 강화 생성) 에이전트를 구축하는 예로:
- 환경 및 OpenAI 키 설정
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
- OpenAI 클라이언트 설정 및 Chunking을 사용하여 PDF 처리
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
- 문서 구조 및 임베딩 설정
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
- 벡터 저장소 및 RAG 에이전트 생성
출처: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig(ARC)은 Rust 언어를 기반으로 한 LLM 워크플로 엔진의 AI 시스템 구축 프레임워크로, 더 낮은 수준의 성능 최적화 문제를 해결해야 합니다. 다시 말해, ARC는 AI 호출, 성능 최적화, 데이터 저장, 예외 처리 등의 백엔드 지원 서비스를 제공하는 AI 엔진 "툴박스"입니다.
Rig가 해결해야 할 것은 "호출" 문제로, 개발자가 LLM을 더 잘 선택하고, 프롬프트를 더 잘 최적화하며, 토큰을 더 효과적으로 관리하고, 동시 처리, 자원 관리, 지연 감소 등을 처리하는 방법에 중점을 두고 있습니다. AI LLM 모델과 AI 에이전트 시스템 협력 과정에서 "잘 활용하는 것"이 중요합니다.
++Rig++은 LLM 기반 응용(예: RAG 에이전트)의 개발을 간소화하기 위해 설계된 오픈 소스 Rust 라이브러리입니다. Rig의 개방 정도가 더 깊기 때문에 개발자에게 더 높은 요구 사항이 있으며, Rust와 에이전트에 대한 이해가 필요합니다. 여기의 튜토리얼은 가장 기본적인 RAG 에이전트의 구성 프로세스입니다. RAG는 LLM과 외부 지식 검색을 결합하여 LLM을 강화합니다. 공식 웹사이트의 다른 데모에서 Rig는 다음과 같은 특징을 가지고 있음을 알 수 있습니다:
- LLM 인터페이스 통일: 다양한 LLM 제공자의 일관된 API를 지원하여 통합을 간소화합니다.
- 추상화된 워크플로: 미리 구축된 모듈화된 구성 요소가 Rig가 복잡한 AI 시스템 설계를 수용할 수 있게 합니다.
- 벡터 저장소 통합: RAG 에이전트와 같은 유사 검색 에이전트에서 효율적인 성능을 제공하기 위해 내장된 체적 저장소 지원을 제공합니다.
- 유연한 임베딩: 임베딩을 처리하기 위한 사용하기 쉬운 API를 제공하여 RAG 에이전트와 같은 유사 검색 에이전트 개발 시 의미 이해의 난이도를 낮춥니다.
Eliza와 비교할 때, Rig는 개발자에게 추가적인 성능 최적화 공간을 제공하여 LLM과 에이전트의 호출 및 협력 최적화를 더 잘 조정할 수 있도록 돕습니다. Rig는 Rust의 성능, Rust의 장점을 활용한 제로 비용 추상화 및 메모리 안전성, 고성능, 저지연 LLM 작업을 통해 더 풍부한 자유도를 제공할 수 있습니다.
분해 조합식 Swarms 프레임워크
Swarms는 기업 수준의 생산급 다중 에이전트 오케스트레이션 프레임워크를 제공하는 것을 목표로 하며, 공식 웹사이트는 수십 가지 워크플로 및 에이전트의 병렬 및 직렬 아키텍처를 제공합니다. 여기서는 그 중 일부를 소개합니다.
순차 워크플로
순차 Swarm 아키텍처는 작업을 선형 순서로 처리합니다. 각 에이전트는 결과를 체인 내의 다음 에이전트에 전달하기 전에 자신의 작업을 완료합니다. 이 아키텍처는 정렬된 처리를 보장하며, 작업 간 의존성이 있을 때 매우 유용합니다.
사용 사례:
- 워크플로의 각 단계가 이전 단계에 의존하는 경우, 예를 들어 조립 라인 또는 순차 데이터 처리.
- 작업 순서를 엄격히 따라야 하는 경우.
계층화된 아키텍처:
상위 에이전트가 하위 에이전트 간의 작업을 조정하여 상향식 제어를 구현합니다. 각 에이전트는 동시에 작업을 수행하고, 결과를 피드백하여 최종 집계에 사용됩니다. 이는 높은 병렬화가 가능한 작업에 매우 유용합니다.
전자표 형식 아키텍처:
동시에 작업하는 여러 에이전트를 관리하기 위한 대규모 군집 아키텍처입니다. 수천 개의 에이전트를 동시에 관리할 수 있으며, 각 에이전트는 자신의 스레드에서 실행됩니다. 이는 대규모 에이전트 출력을 감독하는 데 이상적인 선택입니다.
Swarms는 단순한 에이전트 프레임워크가 아니라, 위의 Eliza, ZerePy 및 Rig 프레임워크와 호환되어 모듈화된 사고로 다양한 워크플로 및 아키텍처에서 에이전트 성능을 최대한 발휘하여 해당 문제를 해결할 수 있습니다. Swarms의 구상과 개발자 커뮤니티의 발전은 문제가 없습니다.
- Eliza: 사용성이 가장 뛰어나며, 초보자와 빠른 프로토타입 개발에 적합하고, 특히 소셜 미디어 플랫폼의 AI 상호작용에 적합합니다. 프레임워크가 간결하여 빠른 통합 및 수정이 용이하며, 과도한 성능 최적화가 필요 없는 상황에 적합합니다.
- ZerePy: 원클릭 배포로, Web3 및 소셜 플랫폼의 AI 에이전트 응용을 빠르게 개발하는 데 적합합니다. 경량 AI 응용에 적합하며, 프레임워크가 간단하고 구성 유연성이 뛰어나 빠른 구축 및 반복에 적합합니다.
- Rig: 성능 최적화에 중점을 두며, 특히 높은 동시성과 높은 성능 작업에서 뛰어난 성능을 발휘하여 세밀한 제어 및 최적화가 필요한 개발자에게 적합합니다. 프레임워크가 다소 복잡하여 일정 수준의 Rust 지식이 필요하며, 더 경험이 많은 개발자에게 적합합니다.
- Swarms: 기업 수준의 응용에 적합하며, 다중 에이전트 협업 및 복잡한 작업 관리를 지원합니다. 프레임워크가 유연하여 대규모 병렬 처리를 지원하며, 다양한 아키텍처 구성을 제공하지만, 그 복잡성으로 인해 효과적으로 적용하기 위해서는 더 강한 기술 배경이 필요할 수 있습니다.
전반적으로, Eliza와 ZerePy는 사용성과 빠른 개발 측면에서 장점이 있으며, Rig와 Swarms는 높은 성능과 대규모 처리가 필요한 전문 개발자 또는 기업 응용에 더 적합합니다.
이것이 에이전트 프레임워크가 "산업의 희망" 특성을 지니는 이유입니다. 위의 프레임워크는 아직 초기 단계에 있으며, 당면 과제는 선발 우위를 확보하고 활발한 개발자 커뮤니티를 구축하는 것입니다. 프레임워크 자체의 성능이 높고 상대적으로 Web2의 인기 응용에 비해 뒤처지지 않는 것이 주요한 문제는 아닙니다. 지속적으로 개발자가 유입되는 프레임워크만이 궁극적으로 승리할 수 있습니다. Web3 산업은 항상 시장의 주목을 끌어야 하며, 프레임워크 성능이 아무리 뛰어나고 기본이 탄탄하더라도, 사용하기 어렵고 관심을 받지 못한다면 본말이 전도됩니다. 프레임워크가 개발자를 끌어들일 수 있는 전제 하에, 더 성숙하고 완전한 토큰 경제 모델을 가진 프레임워크가 두각을 나타낼 것입니다.
에이전트 프레임워크가 "Memecoin" 특성을 지니고 있다는 점은 매우 이해하기 쉽습니다. 위의 프레임워크 토큰은 합리적인 토큰 경제 설계가 없으며, 토큰 사용 사례가 없거나 매우 단일하며, 검증된 비즈니스 모델이 없고, 효과적인 토큰 플라이휠이 없으며, 프레임워크는 단순히 프레임워크일 뿐이며, 토큰 간의 유기적 결합이 이루어지지 않았습니다. 토큰 가격의 상승은 FOMO 외에는 기본적인 지원을 받기 어려우며, 안정적이고 지속적인 가치 성장을 보장할 수 있는 충분한 방어선이 없습니다. 동시에, 위의 프레임워크 자체도 다소 거칠어 실제 가치와 현재 시가총액이 일치하지 않기 때문에 강한 "Memecoin" 특성을 지니고 있습니다.
주목할 점은 에이전트 프레임워크의 "파동-입자 이중성"이 결점이 아니라는 것입니다. 이를 단순히 Memecoin이 아니며, 토큰 사용 사례가 없는 반쪽짜리로 이해해서는 안 됩니다. 제가 이전 기사에서 언급한 바와 같이: 경량화된 에이전트는 애매한 Memecoin 베일을 덮고 있으며, 커뮤니티 문화와 기본면은 더 이상 모순이 되지 않을 것입니다. 새로운 자산 발전 경로가 서서히 드러나고 있습니다; 비록 에이전트 프레임워크 초기에는 거품과 불확실성이 존재하지만, 개발자를 끌어들이고 응용을 실현할 수 있는 잠재력은 무시할 수 없습니다. 미래에는 완벽한 토큰 경제 모델과 강력한 개발자 생태계를 갖춘 프레임워크가 이 분야의 핵심 기둥이 될 수 있습니다.
BlockBooster에 대하여: BlockBooster는 OKX Ventures 및 기타 최고의 기관이 지원하는 아시아 Web3 벤처 스튜디오로, 뛰어난 창업자들의 신뢰할 수 있는 파트너가 되는 것을 목표로 하고 있습니다. 우리는 전략적 투자와 심층 인큐베이션을 통해 Web3 프로젝트와 현실 세계를 연결하고, 우수한 창업 프로젝트의 성장을 지원합니다.
면책 조항: 본 문서/블로그는 참고용으로만 제공되며, 저자의 개인적인 견해를 나타내며 BlockBooster의 입장을 대변하지 않습니다. 본 문서는 (i) 투자 조언 또는 투자 추천을 제공할 의도가 없으며; (ii) 디지털 자산의 구매, 판매 또는 보유에 대한 제안이나 권유를 제공할 의도가 없으며; 또는 (iii) 재무, 회계, 법률 또는 세무 조언을 제공할 의도가 없습니다. 디지털 자산, 특히 스테이블코인 및 NFT의 보유는 매우 높은 위험을 동반하며, 가격 변동성이 크고 심지어 무가치해질 수 있습니다. 귀하는 자신의 재정 상황에 따라 거래 또는 디지털 자산 보유가 적합한지 신중히 고려해야 합니다. 특정 상황에 대한 질문이 있는 경우, 귀하의 법률, 세무 또는 투자 고문에게 상담하시기 바랍니다. 본 문서에서 제공하는 정보(시장 데이터 및 통계 정보 포함, 있을 경우)는 일반적인 참고용으로만 제공됩니다. 이러한 데이터 및 차트를 작성할 때 합리적인 주의를 기울였으나, 그 안에 표현된 사실적 오류나 누락에 대해서는 책임을 지지 않습니다.