대화에서 4,300만 달러 자금을 유치한 사하라 창립자: 마이크로소프트, 아마존에 서비스를 제공하며, 사하라는 어떻게 AI 자산화를 지원하는가?
인터뷰어: 자몽, ChainCatcher
게스트: Sean Ren, Tyler Zhou Sahara 공동 창립자
편집: Marco, ChainCatcher
OpenAI가 문생 비디오 AI 대모델 Sora를 발표한 이후, AI는 다시금 오늘날 시장에서 가장 큰 핫이슈가 되었으며, 투자 열풍이 끊임없이 이어지고 있습니다. AI와 Web3 두 분야의 융합 혁신 프로젝트가 우후죽순처럼 쏟아져 나오고 있습니다. 암호화 데이터 플랫폼 Rootdata에 따르면, "AI와 Web3" 섹터에 포함된 프로젝트는 거의 240개에 달하며, 명백히 독립적인 트랙이 되었고, 탈중앙화 AI 네트워크 Sahara는 이 섹터의 스타 프로젝트 중 하나입니다.
Sahara는 Sean Ren과 Tyler Zhou가 작년 5월에 설립한 탈중앙화 AI 네트워크 인프라로, AI 자산화를 지원하며, 사용자가 맞춤형, 개인화된 AI 제품을 배포하거나 구축하는 데 도움을 주는 것을 목표로 하고 있습니다.
Sean Ren은 남가주대학교 컴퓨터 과학부의 종신 교수로, AI 분야에서 15년의 산업 연구 경험을 가지고 있습니다. Tyler Zhou는 Binance Labs에서 투자 이사를 역임했으며, 여러 프로젝트 투자 및 인큐베이션에 참여했습니다.
올해 3월, Sahara는 작년 8월에 Polychain Capital이 주도한 600만 달러의 자금 조달을 완료했다고 발표했으며, 참여 투자자로는 세쿼이아 캐피탈, 삼성 넥스트, 노마드 캐피탈 등이 있습니다.
두 창립자는 ChainCatcher에 현재 Sahara가 Microsoft, Amazon, MIT, Snapchat, Character AI 등 유명 기업을 포함한 30개 이상의 기업 고객에게 데이터 서비스를 제공하고 있으며, 수백만 달러의 수익을 올렸다고 밝혔습니다.
ChainCatcher와의 인터뷰에서 Tyler Zhou는 Sahara가 4-5월에 C단 사용자 제품을 출시할 예정이며; Q3에는 Sahara 테스트넷(Testnet)을 론칭하고, Q4에는 메인넷을 출시할 계획이라고 밝혔습니다.
4월 4일, 초기 사용자들을 위해 Sahara는 작업 플랫폼 Galxe에서 첫 번째 포인트 활동인 Sahara Social을 출시했으며, 사용자는 Sahara 네트워크에 연결하고 대기 명단에 등록하는 등의 작업을 통해 초기 포인트 보상을 받을 수 있습니다.
Sahara 창립의 배경 이야기
1. ChainCatcher: Sean Ren의 개인적인 경험은 무엇이며, 어떤 계기로 Web3와 인연을 맺게 되었나요? Sahara에서 어떤 일을 담당하고 있나요?
Sean Ren: 제 개인적인 학습 및 경력은 공학적 배경에 가깝습니다.
Sahara를 창립하기 전, 저는 남가주대학교(USC) 컴퓨터 과학부에서 7년간 종신 교수로 재직하며 AI와 NLP 분야의 학술 연구를 주로 했습니다.
미국 일리노이 대학교 샴페인 캠퍼스에서 컴퓨터 과학 박사 과정을 공부할 때, 첫 번째 창업 프로젝트인 StylePuzzle(패션 추천 전자상거래 플랫폼)을 창립했으며, Plug & Play Ventures의 투자를 받아 엔젤 라운드에서 C 라운드까지 진행했습니다.
Tyler와는 6년간 친구로 지내왔으며, 우리가 창업하게 된 계기는 2022년으로, 그때 Web2 AI 제품의 여러 문제점, 특히 경제 모델 문제에 대해 많은 논의를 했습니다.
현재의 AI 경제 모델은 소수의 전문 인력만 이익을 보고 있으며, 데이터 소유자, 수집자, 제공자 및 모델 피드백 제공자 등 다른 AI 생태계 참여자들은 합리적인 경제적 보상을 받지 못하고 있으며, 사용자 데이터의 프라이버시 문제도 해결되지 않아 장기적인 발전에 불리합니다.
Sahara 제품의 첫 번째 원칙은 현재 전통 AI 산업의 문제점을 해결하고, AI 생태계의 모든 참여자가 자신의 기여에 따라 적절하거나 합리적인 수익을 얻을 수 있도록 하는 것입니다. 더 이상 대모델의 계산 능력 및 적용 장면에 국한되지 않습니다.
현재 저는 Sahara에서 주로 제품 개발 및 BD 관련 업무를 담당하고 있습니다.
ChainCatcher: Tyler Zhou는 이전에 Binance Labs에서 투자 이사를 역임했는데, 왜 바이낸스를 떠나 AI 분야에 뛰어들기로 결정했나요?
Tyler Zhou: 저는 UC 버클리에서 학부를 졸업한 후, 투자은행 및 PE 사모펀드 투자 분야에서 주로 인프라, 정보 기술 및 부동산 분야에 투자했습니다.
2022년 초 Binance Labs에 합류하여 미국 시장의 투자 업무를 담당했으며, 주로 인큐베이션 및 투자 프로젝트를 진행했습니다. 첫 번째 MVB는 제가 주도하여 출시했습니다.
2023년 초 바이낸스를 떠나 Ren 교수와 함께 Sahara를 설립하게 된 주된 이유는 몇 가지가 있습니다. 첫째, 전체 AI 생태계의 경제 모델에 많은 문제가 존재하며, 블록체인의 암호화 기술과 토큰 경제가 이러한 문제를 해결하는 데 도움이 될 수 있다고 생각했습니다.
개인적으로 Ren 교수의 배경과 전문 지식이 관련 제품을 만드는 데 가장 적합한 인물이라고 생각하며, 시장에는 Ren 교수처럼 AI 시스템의 생태, 기술 및 경제 전반을 이해하는 팀이 없습니다.
또한, Ren 교수는 전통적인 의미의 연구원만이 아니라 매우 강한 상업적 감각과 직관을 가지고 있습니다.
2. ChainCatcher: Sahara 제품의定位 및 목표는 무엇인가요? AI의 상업화 문제 외에 어떤 문제를 해결하고자 하나요?
Sean Ren: 현재 Sahara의 주요 제품은 탈중앙화 네트워크 인프라로, 누구나 개인화된 AI 제품을 구축하거나 배포할 수 있도록 지원합니다.
Sahara는 Execution Layer(실행 층), Transaction Layer(거래 층) 및 Application Layer(응용 층)로 구성된 탈중앙화 네트워크로 볼 수 있습니다.
응용 층에서 Sahara는 원주율 내장된 탈중앙화 데이터 시장(Decentralized Data Marketplace, Sahara Data)을 제공하며, 데이터 관련 도구 키트(예: 수집, 주석, QA 등)를 제공하여 사용자가 AI 모델을 훈련하는 데 도움을 줍니다.
사용자들은 Sahara에 방문하여 자신의 AI 제품을 구축하기 위해 데이터 수집, 주석 및 변환 문제를 해결하기 위해 Sahara Data를 활용합니다.
또한, 데이터 시장으로서 Sahara는 데이터 공급자와 수요자를 연결하는 중요한 플랫폼으로, AI 모델 훈련을 위한 고부가가치 데이터 서비스를 제공할 뿐만 아니라 데이터 수요가 있는 사용자가 더 많은 데이터 제공자를 발견하도록 도와줍니다.
Sahara Data 탈중앙화 데이터 시장은 Sahara 제품의 큰 장점이며, 시장의 Web3 AI 프로젝트와의 차별화 요소입니다. 작년 10월에 출시되어 현재까지 약 6개월 동안 운영되고 있으며, 처음에는 Microsoft, Snapchat, MIT, Motherson Group, Amazon 등 일부 기업 고객에게 관련 데이터 서비스를 제공하고, 업계에서 가장 어려운 데이터 요구 문제를 처리했습니다.
Sahara의 실행 층은 데이터 암호화 및 귀속을 지원하며, 소유권 증명을 통해 디지털 워터마크 혁신 기술과 공개 키 시설을 사용하여 구현됩니다. 이는 소유권 증명(proof of ownership)과 유사하며, 사용자가 데이터 포인트, 데이터 세트 또는 모델을 생성할 때 자신의 Did를 데이터나 모델에 삽입하여 워터마크를 생성하고 데이터 소유권을 증명할 수 있습니다. 이 워터마크는 사용자의 데이터와 모델이 이동하는 동안 계속 존재하여 데이터와 모델의 귀속을 가능하게 합니다.
소유권 증명 메커니즘을 사용함으로써, 사용자가 자신의 AI를 훈련하거나 추론할 때, 특정 개인이나 그룹이 구축한 기본 모델에 의존해야 할 경우, 해당 AI 제품이 이후 생성하는 수익은 기본 모델의 소유자에게 분배될 수 있습니다.
3. ChainCatcher: 3월 5일, Sahara는 Polychain Capital이 주도한 600만 달러의 시드 라운드 자금 조달을 완료했다고 발표했습니다. 투자자들은 어떻게 Sahara와 접촉하게 되었나요? Sahara가 그들에게 주목받는 이유는 무엇인가요? 투자 기관은 어떤 도움을 주었나요?
Tyler Zhou: 사실, 시드 라운드 자금 조달은 최근의 일이 아니라 작년 8월에 이미 완료되었습니다. 다른 팀과 달리, Sahara는 자금 조달이 완료되자마자 즉시 공개하지 않고, 적절한 시기를 기다렸다가 제품 출시 후에 홍보했습니다.
현재 발표하는 이유는 Sahara 제품 개발이 새로운 단계에 접어들었고, 앞으로 생태 관련 애플리케이션을 포함한 일련의 신제품을 출시할 예정이기 때문입니다.
Sahara의 시드 라운드는 초과 청약 상태였으며, 선택의 폭이 매우 넓었지만, 우리는 전략적으로 투자자를 선택했습니다. 이 투자자들은 Sahara가 AI 글로벌 기업의 발전 상황을 보고, AI의 다양한 단계에서 초기 기업들이 무엇을 하고 있는지, 글로벌 AI 경제의 트렌드, 그리고 각국의 AI 경제가 어떤 차이를 보이는지, 주요 AI 기업들이 무엇을 하고 있는지 등을 이해하는 데 도움을 줄 수 있습니다.
Sahara의 장점 및 개발 진행 상황
4. ChainCatcher: Sahara가 전통적인 ChatGPT와 같은 AI 제품과 어떤 차별점이 있다고 생각하나요?
Sahara 공동 창립자 Sean Ren: 두 가지 측면에서 볼 수 있습니다.
첫째, Sahara는 응용 프로그램을 만드는 것이 아니며, 최종적으로 제공되는 제품은 특정 GPT 제품이 아닙니다. Sahara는 탈중앙화 네트워크 인프라 제공자로, 응용 층에서도 개발자가 구축할 AI 에이전트 제품의 형태를 정의하지 않으며, 관련 API 및 SDK와 같은 도구 키트를 제공하여 누구나 쉽게 자신의 AI 에이전트를 구축할 수 있도록 합니다.
둘째, ChatGPT는 일문일답 형식의 대화형 로봇인 반면, Sahara의 Sahara Knowledge Agents(KA 지식 에이전트)는 맞춤형 인공지능 프로그램으로, 전통적인 대화형 로봇과는 큰 차이가 있습니다. KA는 데이터를 자율적으로 분석하고 특정 요구에 대해 신뢰할 수 있는 결정을 제시하며, 특정 지침에 따라 행동하거나 작업을 수행하여 특정 목적을 달성합니다.
예를 들어, 특정 KOL의 KA 목적은 자신의 트위터 DM에서 광고 초대 정보를 필터링하여 매일 간략한 보고서를 생성하고 다른 사람의 DM에 응답하는 것입니다. KA는 언제든지 이러한 명령을 자동으로 실행할 수 있습니다.
Sahara는 인프라 구축자로서 맞춤형 Knowledge Agents(KA)를 구축하기 위한 도구와 플랫폼을 제공합니다.
Tyler Zhou: ChatGPT 및 시장의 AI 프로젝트와 비교할 때, Sahara는 개인화된 에이전트(Personalized Agent)를 주력으로 하며, 이는 맞춤형 인공지능 프로그램으로, 대화에 국한되지 않고 사용자가 많은 작업을 수행하는 데 도움을 줄 수 있습니다.
"Personalized Agent"를 구축하려면 두 가지 전제가 필요합니다. 첫째, 자신의 데이터베이스가 필요하며, 자신의 데이터를 기반으로 AI 에이전트를 훈련시켜야 원하는 능력을 달성할 수 있습니다. 둘째, 에이전트를 구축하기 위한 관련 인프라 및 도구가 필요합니다.
Sahara는 데이터 시장 등 데이터 관련 처리 도구를 제공할 뿐만 아니라, 실행 층은 사용자가 데이터 프라이버시를 보호하면서 자신의 AI를 훈련할 수 있도록 보장하며, 사용자가 KA를 더 잘 구축할 수 있도록 관련 인프라 도구를 제공합니다.
Sahara 네트워크는 사용자가 자신의 데이터 프라이버시를 희생하지 않고도 맞춤형 AI 에이전트를 구성할 수 있도록 지원하며, 에이전트를 구축하기 위한 무코드(no-code) 플랫폼도 제공합니다.
5. ChainCatcher: Sahara 설립 이후 데이터는 어떤가요? 향후 작업의 초점은 무엇인가요?
Sean Ren: 우선 제품에 대해 말씀드리자면, Sahara는 탈중앙화 데이터 시장인 Sahara Data를 구축하고 있으며, 작년 10월에 제품을 출시했습니다.
현재까지 Sahara Data는 31개 기업 고객과 협력하여 기술을 다듬는 동시에 수익을 증가시켰습니다.
올해 Q1이 끝날 때까지 Sahara Data는 20만 사용자를 누적했습니다.
앞으로 Sahara는 세 가지에 중점을 두고 있으며, 이는 단기 내 중요한 조치입니다:
첫째, 탈중앙화 데이터 시장을 대중에게 개방하여 개인이나 기업이 사용할 수 있도록 합니다;
둘째, Sahara Data를 기반으로 실행 층과 관련된 C단 사용자 제품, 예를 들어 Knowledge Vault(지식 저장소), Knowledge Marketplace(지식 시장) 등을 구축하거나 출시할 것입니다.
셋째, Sahara 테스트넷(Testnet)은 Q3에 출시될 예정입니다.
6. ChainCatcher: 회사가 현재 직면한 가장 큰 도전은 무엇인가요?
Sean Ren: 회사 팀이 너무 빠르게 확장되어 처음 10명 남짓의 팀에서 40명 이상으로 늘어났으며, 최근 계획에 따르면 팀은 향후 한두 달 내에 30-40명을 추가할 수 있습니다.
Tyler Zhou: 시장 및 생태계 관점에서 볼 때, 초기 단계에서 Sahara의定位은 "Crypto for AI" 제품(즉, Crypto를 통해 전체 AI에 힘을 실어주는 것)으로, 도달할 수 있는 시장 및 생태계는 "AI for Crypto"보다 더 큽니다.
"Crypto for AI"와 "AI for Crypto"의 차이점에 대해 설명하자면, 전자는 Crypto와 블록체인 기술을 사용하여 AI 제품 관련 문제를 개선하고 향상시키는 것을 의미하며, 이는 더 큰 글로벌 시장입니다. 후자는 AI가 암호화 제품을 개선하는 데 사용되는 것으로, 현재 단계에서는 상대적으로 작은 시장이며, 주로 서사적입니다.
하지만 현재 시장에서 주류로 떠오르는 것은 "AI for Crypto" 제품으로, 전체 AI 생태계의 경제와 AI 시스템, 글로벌 경제의 동향을 간과하여 시장에 많은 소음이 발생하고 있습니다. 특히 지난 6개월 동안 시장의 소음이 매우 컸습니다.
Sahara가 이러한 소음 속에서도 여전히 초심을 지키고 하고 싶은 일, 해야 할 일, 옳은 일을 지속하는 것이 큰 도전입니다.
Sahara는 Microsoft, Amazon 등 30개 이상의 기업에 서비스 제공
7. ChainCatcher: Sahara는 설립 이후 Microsoft, Snapchat, MIT 등 30개 이상의 기업 고객을 유치했습니다. Sahara는 이들에게 어떤 서비스를 제공하며, 이러한 유명 기업들이 왜 회사와 협력하기로 선택했나요?
Sean Ren: Sahara가 처음 출시한 제품은 탈중앙화 데이터 시장인 Sahara Data로, Web2에서도 Skill AI와 같은 중앙화 데이터 서비스 제공업체가 있습니다. 중앙화 데이터 서비스 제공업체와 비교할 때, Sahara Data는 더 많은 장점을 가지고 있습니다.
우선, Sahara는 다양한 보상 및 경제적 인센티브 메커니즘을 통해 전 세계 여러 지역의 AI 데이터 수집 및 주석 작업자와 접촉할 수 있으며, 현재 Sahara 네트워크에는 약 20만 명의 AI 관련 작업자가 있으며, 대부분 Web2 AI 산업의 원주민입니다. 그들이 Sahara에 끌리는 이유는 데이터 기여를 통해 수익을 얻을 수 있기 때문입니다. 예를 들어, Crypto를 결제 수단으로 사용할 수 있습니다.
협력하는 기업들은 다양한 데이터 요구가 있으며, 예를 들어 Snapchat은 대화 데이터를 수집하고, Microsoft는 다중 모달 데이터를 수집하며, MIT는 다양한 비디오 데이터를 필요로 합니다.
Sahara는 데이터 공급자로서 데이터 다양성 측면에서 매우 유리하며, 고객이 선택할 수 있는 매우 다양한 후보자 데이터베이스를 보유하고 있어 다양한 데이터 요구에 적응할 수 있습니다.
30개 이상의 기업과 협력함으로써 Sahara는 제품을 지속적으로 다듬어가며, 제품이 점점 더 성숙해져 글로벌 다양한 기업 및 상인의 데이터 요구에 더 잘 적응할 수 있도록 하여 긍정적인 순환을 형성하고 있습니다.
8. ChainCatcher: 현재 사용자가 Sahara에 참여하려면 공식 웹사이트에서 대기 명단에 등록해야 하는데, 제품 개발 진행 상황은 어떤가요? 사용자가 Sahara에 참여하는 방법은 무엇이며, 초기 참여 사용자에게는 어떤 보상을 제공하나요?
Tyler Zhou: 4월과 5월에 Sahara는 첫 번째 C단 제품을 출시할 예정이며, 그때 C단 사용자는 플랫폼에서 자신의 지식 및 기술 등을 기여할 수 있습니다.
초기 사용자에게는 다양한 보상 메커니즘이 마련되어 있으며, 4월 또는 5월에 공개되면 더 많은 정보가 제공될 것입니다. Q3 또는 Q4에는 Sahara Testnet 테스트넷을 론칭할 예정이며, Q4에는 메인넷을 출시할 계획입니다.
9. ChainCatcher: 시장에서 유행하는 탈중앙화 GPU, 에이전트 등의 AI 암호화 프로젝트에 대한 의견은 무엇인가요? AI 암호화 프로젝트의 신뢰성을 어떻게 평가하나요?
Sean Ren: 현재 시장의 암호화 AI 제품은 "AI for Crypto"와 "Crypto for AI"로 두 가지 파로 나눌 수 있습니다.
"Crypto for AI"는 더 큰 시장으로, AI 산업의 원주민으로서 우리는 Web2 AI 제품의 여러 문제를 해결하기 위해 블록체인과 Web3 기술을 활용하는 방법에 더 집중하고 있습니다. 특히 경제 모델, 데이터 소유권 등의 문제입니다.
현재 많은 프로젝트가 블록체인의 경제 모델을 활용하여 AI 내 특정 행동을 유도하고 있지만, 개인적으로는 너무 얕은 접근이라고 생각합니다. 경제 모델만 보고 전체 AI 생태계, 즉 훈련 데이터의 프라이버시와 암호화 문제를 고려하지 않고 있습니다.
AI 생태계 전체를 바라보면, 가장 상위에는 데이터 및 데이터 처리 섹터가 있어야 하며, 시장에는 데이터 관련 프로젝트가 있지만, 대부분의 프로젝트는 가장 매력적인 암호화 경제 모델(예: Label to earn)만 가지고 있으며, 데이터 본질적인 문제인 소유권, 모델 귀속 등을 다루지 않고 단순히 애플리케이션을 구축하는 데 그치고 있습니다.
분산 GPU 방식으로 대모델을 훈련하는 것에 대해 개인적으로는 매우 도전적인 방향이라고 생각하며, 프로젝트의 탈중앙화 정도를 살펴봐야 합니다. 만약 단순히 같은 데이터 센터에 있거나 가까운 데이터 센터 몇 개를 묶어 인위적으로 탈중앙화를 시도한다면, 이는 인위적인 탈중앙화입니다. 만약 전 세계의 유휴 GPU를 묶어 탈중앙화 훈련을 시도한다면, 서로 다른 네트워크 간의 속도 차이로 인해 실현 가능성이 다소 멀어 보입니다.
또한, 머신 러닝 및 ZK 관련 발전은 아직 멀리 있는 분야입니다. 따라서 프로젝트를 판단할 때, 단기 내에 실현 가능하고 상업화할 수 있는 프로젝트와 연구성 프로젝트, 즉 장기적인 탐색이 필요한 프로젝트를 구분하는 것이 중요합니다.