姚前:데이터 호스팅은 데이터 안전성과 공유를 촉진합니다
출처: 야오치안, 중국 금융 잡지
디지털 경제 시대에 데이터는 새로운 생산 요소로 자리 잡았으며, 경제 전환 및 업그레이드의 기초적이고 전략적인 자원입니다. 데이터를 데이터 자산으로 전환하고, 이를 질서 있게 유통하며 합법적으로 사용하는 것은 디지털 경제 발전의 중요한 과제입니다. 최근 몇 년 동안, 우리나라는 《네트워크 보안법》, 《데이터 보안법》, 《개인 정보 보호법》 등 관련 법률과 규정을 제정하고 시행하여 데이터 법제 보장 체계를 초기적으로 구축하였습니다. 2022년 12월 2일, 중공중앙과 국무원은 《데이터 기본 제도를 구축하여 데이터 요소의 역할을 더욱 잘 발휘하는 의견》을 발표하였으며, 데이터 요소의 소유권 제도, 유통 거래 제도, 수익 분배 제도 및 관리 제도 등 20개의 정책 조치를 제안하였습니다. 이러한 기본 문서는 데이터 권리 확립, 가격 책정, 유통, 거래, 사용, 분배 및 관리의 구체적인 실행 방안을 탐색하는 데 중요한 지침이 됩니다.
데이터 권리 분배가 직면한 어려움
새로운 생산 요소로서 데이터의 가격 책정 및 수익 분배 방법은 많은 연구자와 업계 전문가의 관심을 끌고 있습니다. 2022년 2월, 튜링 상 수상자이자 중국 과학 아카데미의 야오치즈 교수는 데이터 요소 가격 책정 알고리즘 및 요소 수익 분배 플랫폼을 발표하였습니다. 그는 데이터 가격 책정 알고리즘이 경제학, 계산 과학, 인공지능을 포함하는 매우 혁신적인 교차 학문 분야라고 생각하며, 정보 경제학, 게임 이론 및 계산 경제학 등의 이론적 기초를 갖추어야 한다고 강조했습니다. 정보 경제학은 경제 활동에서 정보가 생성하는 가치와 역할을 연구하며, 게임 이론의 협력 게임 이론은 데이터 다자 모델링의 이론적 기초를 제공합니다. 계산 경제학은 데이터 요소의 공동 모델링 및 계산 비용을 포함합니다. 야오치즈 교수의 연구 결과는 게임 이론의 협력 게임 이론에 따라 의사 결정 모델에 대한 다양한 데이터의 기여도를 확립할 수 있음을 보여줍니다. 기여도가 클수록 데이터 요소의 가치는 높아집니다. 경제 주체의 효용 함수와 의사 결정 모델 기여도의 결합을 통해 우리는 다양한 데이터 요소가 가지는 경제적 가치를 합리적이고 공정하게 정량 평가할 수 있으며, 이를 통해 데이터 요소의 가격 책정 및 수익 분배를 할 수 있습니다. 이것이 데이터 요소 가격 책정의 메커니즘이며, 실제로는 시장 메커니즘의 역할을 발휘하여 데이터 자원의 효과적인 가격 책정과 합리적인 배치를 실현해야 합니다. 이를 위해서는 각 당사자 간의 관계를 정리하는 것이 매우 중요합니다.
데이터 관련자는 두 가지 수준으로 나눌 수 있습니다: 하나는 데이터 생산 및 소비와 직접 관련된 데이터 주체, 데이터 처리자 및 데이터 사용자이며, 다른 하나는 데이터 생산 및 소비와 간접적으로 관련된 규제 기관, 국가 및 국제 기구입니다. 데이터 생산 및 소비 활동과 직접 관련된 비즈니스 시나리오는 다음과 같습니다: 데이터 주체는 원시 데이터를 생성하며, 일반적으로 고객 식별(KYC) 데이터, 거래 세부 데이터 등을 포함합니다; 데이터 처리자는 원시 데이터를 수집하고 제어하여 고객 프로파일, 통계 분석 등과 같은 데이터 제품 및 서비스를 생성합니다; 데이터 사용자는 데이터 처리자로부터 데이터 제품 및 서비스를 받아 마케팅, 위험 식별 등의 상업적 목적으로 사용합니다. 데이터 생산 및 소비 활동과 간접적으로 관련된 비즈니스 시나리오는 다음과 같습니다: 규제 기관은 책임에 따라 산업을 감독하며, 예를 들어 자금 세탁 방지, 독점 금지 등을 포함합니다; 국가 차원에서는 데이터 관리를 위한 법률을 제정하며, 예를 들어 네트워크 보안법, 데이터 보안법, 개인 정보 보호법 등을 포함하고 데이터의 국경 간 흐름을 관리합니다; 국제 기구는 글로벌 데이터 표준 제정을 촉진합니다, 예를 들어 데이터 메시지 표준 ISO 8583, ISO 20022 등을 포함합니다.
현재 데이터 관련자의 권리 분배에는 여러 가지 불합리한 현상이 존재하며, 주로 데이터 처리자가 기술적 우위와 응용 시나리오의 우위를 이용하여 데이터 권리를 독점하는 형태로 나타납니다. 데이터 사용자는 데이터 처리자를 통해 데이터 제품 및 서비스를 얻고 대가를 지불합니다; 데이터 처리자는 데이터 권리를 독점하여 데이터 주체가 원시 데이터 이전으로 인한 수익을 얻지 못하게 하며, 국가도 해당 디지털 세금을 얻지 못하고, 규제 기관은 "손에 수가 없다"는 이유로 감독 및 집행의 어려움에 직면합니다. 또한, 데이터 처리자는 데이터 수익을 유지하기 위해 종종 자사의 기술적 우위를 이용하여 자체 표준을 구축하고 데이터 고립 및 데이터 독점을 형성합니다.
데이터 호스팅 기반 시설이 데이터 권리 분배 구조를 재편하다
전통적인 방식에서는 데이터 처리자가 데이터 저장 및 사용을 전담하였으나, 데이터 호스팅의 새로운 모델에서는 데이터의 저장, 사용 및 관리가 서로 분리되어 데이터 호스팅자가 각 당사자에게 공공 신뢰 데이터 저장 및 호스팅 서비스를 제공합니다. 데이터 저장 작업은 전문 데이터 호스팅 기관이 담당하며, 초기에는 고부가가치 데이터 및 데이터베이스 로그에서 시작하여 점차 전체 데이터로 전환됩니다. 데이터 처리자는 규제 조건 하에 데이터를 수집하고 가공하며, 소비자에게 데이터 제품 및 서비스를 제공합니다. 가공된 데이터는 데이터 호스팅 기관에 통합 저장되어야 합니다. 데이터 호스팅은 또한 규제 기관 및 국가 관련 부서가 데이터 남용 방지, 데이터 국경 간 흐름 모니터링, 집행 증거 수집, 디지털 세금 징수 등의 작업을 수행하는 것을 지원합니다.
데이터 호스팅의 새로운 기반 시설은 데이터 제어자를 중심으로 한 전통적인 모델을 변화시켜 데이터 중심의 새로운 생산 관계를 구축하며, 데이터 권리 분배 구조를 근본적으로 변화시켜 데이터 소비자와 데이터 처리자 간의 공정한 가격 책정 메커니즘을 구축하는 데 기여합니다(그림 1 참조).
데이터 처리 및 서비스 프로세스 관점에서 보면: 데이터 주체는 원시 데이터를 데이터 호스팅자에게 위탁합니다; 데이터 처리자는 데이터를 획득하고 가공하며, 가공된 데이터 제품도 호스팅되어야 합니다; 데이터 호스팅자는 데이터 처리자의 데이터 사용 및 서비스 과정을 감독합니다; 데이터 처리자는 시장화된 방식으로 데이터 사용자에게 데이터 제품 및 서비스를 제공합니다.
데이터 권리 분배 프로세스 관점에서 보면: 데이터 사용자는 데이터 제품 및 서비스를 소비하고 데이터 호스팅자에게 대가를 지불합니다; 데이터 호스팅자는 규칙에 따라 원시 데이터 권리를 데이터 주체에게 분배하고, 부가가치 데이터 권리를 데이터 처리자에게 분배합니다; 데이터 호스팅자는 규제 요구에 따라 규제 데이터를 제출하고 집행 증거 수집에 협조합니다; 데이터 호스팅자는 국가 요구에 따라 디지털 세금을 납부합니다; 데이터 호스팅자는 통용 표준에 따라 데이터 관리를 수행합니다.
데이터 호스팅의 국제적 실천
최근 몇 년 동안 국제적으로 데이터 호스팅에 대한 탐색이 진행되었으며, 일부 분야에서 초기 성과를 거두었습니다. 그 중 저작권 호스팅 분야의 실천은 일정한 참고 가치를 가지고 있습니다.
지식 전파와 저작권 보호 간의 균형을 이루기 위해, 글로벌 비영리 조직인 크리에이티브 커먼즈(Creative Commons)는 라이센스 모델을 도입하여, 타인이 지식 작품을 복사, 배포 및 사용할 수 있도록 허용하면서도 저작권이 침해되지 않도록 하는 자유롭고 간단하며 표준화된 저작권 부여 방식을 시도하였습니다. 라이센스 유형은 여섯 가지로 나뉘며, 가장 느슨한 라이센스는 재사용자가 출처를 명시하기만 하면 어떤 매체를 통해서도 원작을 배포, 수정 및 재구성할 수 있도록 허용하며, 상업적 목적에도 사용할 수 있습니다. 가장 엄격한 라이센스는 재사용자가 수정되지 않은 형태로만 작품을 복사하고 배포할 수 있으며, 비상업적 목적으로만 사용하고 원작자의 서명을 유지해야 합니다. 현재 크리에이티브 커먼즈는 지식의 개방 공유를 지원하는 교육자, 예술가, 기술자, 법률 전문가, 사회 운동가 및 관련 국제 단체를 모으고 있습니다. 그들은 작품의 저작권을 크리에이티브 커먼즈 라이센스를 지원하는 콘텐츠 플랫폼에 위탁하여, 라이센스 형태로 재사용자가 규정에 따라 배포, 재혼합, 수정 및 원작을 재구성할 수 있도록 허용하고 있습니다. 현재 Wikipedia, Google, Bing, Flickr, YouTube 등 인터넷 플랫폼은 모두 크리에이티브 커먼즈 라이센스를 통합하여 14억 개 이상의 작품이 이러한 플랫폼에 호스팅되어 라이센스 형태로 개방 공유되고 있으며, 문학 예술, 개방 교육, 과학 연구 등 분야의 비디오 또는 오디오 작품이 포함되어 있습니다.
라이센스를 기반으로 한 작품 호스팅 및 공유 모델은 창작자의 권리 보호와 지식 개방 공유 간의 모순을 효과적으로 해결하였으며, 본문에서 제안한 데이터 호스팅 아이디어와도 일치합니다. 그러나 우려되는 점은, 작품의 호스팅 기관에 Google, YouTube와 같은 상업 플랫폼이 포함되어 있어, 그 상업적 이익 추구가 결국 지식 개방 공유의 초기 취지에서 벗어날 가능성이 있다는 것입니다. 이에 따라, 가능한 상업적 이익 충돌을 피하기 위해 데이터 호스팅의 더 나은 방안은 신뢰할 수 있는 비영리 공공 기관에 데이터를 호스팅하거나 신뢰할 수 있는 기술 기반의 Web3.0 플랫폼에 데이터를 호스팅하는 것입니다.
전자의 아이디어는 유사한 사례가 있습니다. 2001년에 설립된 미국 과학 공공 도서관(Public Library of Science, PLOS)은 비영리 기관으로, 전 세계 과학 저널의 개방 공유를 촉진하는 것을 목적으로 하고 있습니다. 20년 이상 동안 PLOS는 많은 영향력 있는 저널의 개방 공유를 조직하였습니다. 연구자들은 동료의 엄격한 심사를 거쳐 PLOS에서 연구 결과를 온라인으로 공개 출판할 수 있으며, 결과는 제한 없이 무료로 접근할 수 있습니다. 또한 PLOS는 연구 결과와 관련된 기초 데이터를 전용 데이터베이스에 호스팅하여 연구 기사와 함께 게시함으로써, 기사의 데이터가 검증 가능하고 재현 가능하며 재사용 가능하도록 보장합니다. 이러한 조치는 새로운 과학 연구를 촉진하는 데 도움이 됩니다. 전반적으로 PLOS가 구축한 커뮤니케이션 플랫폼은 신뢰할 수 있는 데이터 호스팅 기반 시설로 평가받고 있습니다.
후자의 아이디어는 적극적으로 탐색되고 있습니다. 블록체인 기술은 저작권 확립 및 권리 보호에서 독특한 장점을 가지고 있으며, 특정 기관에 의존하지 않고도 상업적 이익과 공공 서비스 간의 충돌을 효과적으로 회피할 수 있습니다. 현재 크리에이티브 커먼즈는 지식 라이센스 모델과 Web3.0 기술을 통합하여 지식의 자유 개방 공유를 더욱 잘 실현할 수 있는 방법을 적극 연구하고 있습니다.
결론
데이터 호스팅 기관은 모든 데이터 주체의 수탁자로서 데이터 자산을 집중적으로 호스팅하여 데이터의 안전성, 데이터의 통제 가능성 및 효율적 활용을 효과적으로 보장할 수 있습니다. 프론트에서의 주식 거래가 백엔드의 주식 등록 및 보관을 필요로 하는 것처럼, 데이터 호스팅 기관은 대규모 데이터 거래소의 백엔드 기반 시설 역할을 수행하여 대규모 데이터 거래소와 함께 완전한 대규모 데이터 기반 시설 시스템을 구성합니다. 데이터 호스팅 기관은 관련 기관이 구성한 데이터 호스팅 산업 연합일 수 있으며, 데이터 공동 구축 및 공유를 촉진할 수 있습니다; 또는 블록체인 기술을 활용하여 연합 체인 또는 관리된 공공 체인 기반으로 데이터의 체인 상 호스팅, 권리 확립, 거래, 유통 및 권리 분배를 실현할 수 있습니다. 어떤 방식이 더 나은지는 미래의 실천에서 추가적으로 탐색하고 검증해야 할 문제입니다.