최적화된 주석이 정밀 진단을 지원합니다: Codatta의 Roylaty Model을 통해 병리 데이터 세트를 향상시킵니다
《TCGA PRAD 데이터셋의 최적화된 Gleason 등급 주석》은 Codatta와 DPath.ai의 협력 결과로, AI를 위한 병리 데이터의 새로운 기준을 세웠습니다. Codatta 플랫폼을 통해 최고 수준의 병리학 전문가 커뮤니티를 모아 이 데이터셋은 전통적인 슬라이스 수준의 주석을 넘어 ROI 수준의 공간 주석을 도입하여 진단의 세밀함, 정확성 및 투명성을 향상시켰습니다. 최적화된 Gleason 등급, 상세한 주석 이유 및 ROI 기반의 Gleason 패턴 매핑을 통해 이 데이터셋은 AI 모델 개발 및 병리학 연구의 핵심 자원이 되어 고품질 주석 데이터 생성의 주요 과제를 해결했습니다. Codatta의 로열티 모델을 통해 기여자는 자신의 작품에 대한 소유권을 유지할 수 있으며, 인정과 지속적인 가치를 보장받을 수 있습니다. DPath.ai는 협력 솔루션이 병리학 AI의 발전을 어떻게 촉진하는지를 보여주었습니다.
그림 1: TCGA PRAD 데이터셋의 최적화된 Gleason 등급 주석. 이미지 출처: https://huggingface.co/datasets/Codatta/Refined-TCGA-PRAD-Prostate-Cancer-Pathology-Dataset
TCGA PRAD 데이터셋이란 무엇인가?
TCGA PRAD(암 유전체 지도 전립선암) 데이터셋의 최적화된 Gleason 등급 주석은 원래의 슬라이스 수준 주석을 업그레이드하여 ROI 수준의 공간 주석을 포함합니다. Codatta와 DPath.ai가 공동 개발한 이 데이터셋은 병리학자 커뮤니티의 협력으로 생성되었으며, 전 세계의 참여를 지원하고 주석의 소유권을 보장합니다. 이 방법은 진단의 정확성, 세밀함 및 신뢰성을 향상시켜 AI 모델 훈련 및 병리학 연구의 핵심 요소가 됩니다.
435개의 TCGA 전체 슬라이스 이미지를 정리하여 병리학자들은 245개의 개선이 필요한 주석 사례를 식별하고 190개의 사례 주석이 정확하다는 것을 확인했습니다. 이 데이터셋은 슬라이스 수준의 메타데이터와 ROI 수준의 공간 주석을 포함하여 연구자들에게 AI 파이프라인 개발, 인터랙티브 종양 영역 탐색 및 고급 병리학 연구를 위한 귀중한 자원을 제공합니다.
병리학 AI의 역량 강화: Codatta와 DPath.ai의 협력
《TCGA PRAD 데이터셋의 최적화된 Gleason 등급 주석》은 협력적이고 커뮤니티 주도의 데이터 생성의 잠재력을 보여주며, 주석의 정확성과 세밀함을 향상시켜 AI 모델 훈련을 더 신뢰할 수 있게 하고 의학 연구의 발전을 촉진합니다. 그러나 이러한 기여는 분야 전문 지식, 시간 및 노력을 필요로 하므로 숙련된 전문가의 작업을 인정하고 보상하는 지속 가능한 인센티브 구조가 필요합니다.
로열티 모델
Codatta의 로열티 모델은 이를 위한 해결책을 제공합니다. 전통적인 Web2 모델(예: Scale AI)과 비교할 때 데이터 기여 및 획득 효율성을 높였습니다. Scale AI는 일반 사용자의 즉각적인 유동성 선호를 충족하는 데 뛰어나 대규모 데이터를 신속하고 효율적으로 수집할 수 있지만, 분야 전문가가 전문 작업을 수행할 때 높은 비용으로 인해 소규모 참여자는 배제됩니다. Codatta는 조건 및 자산 기반 보상을 제공하여 숙련된 종사자 및 전문가와 일치합니다. 아래의 그림 2에서 볼 수 있듯이, 이러한 인센티브는 고품질 전문 데이터를 제공할 의향이 있는 기여자를 유치하며, 보상이 지연될 수 있지만 잠재적 수익이 더 높아 Codatta를 정확성과 전문성이 필요한 수직 AI 및 고급 애플리케이션의 이상적인 선택으로 만듭니다.
그림 2: 데이터 기여에서의 기술 숙련도와 유동성 선호의 매핑
Scale AI의 높은 초기 비용과 달리, Codatta의 로열티 모델은 온디맨드 지불 시스템을 도입하여 소규모 AI 스타트업의 재정적 장벽을 제거했습니다. 이 방법은 비싼 초기 투자가 필요 없이 핵심 최전선 데이터의 접근을 민주화하여 스타트업이 제품 시장 적합성을 입증하고 규모를 확장할 수 있도록 합니다. 또한 데이터를 탈중앙화된 금융 시장의 유동 자산으로 전환함으로써 Codatta는 기여자가 단기 유동성 요구와 장기 자산 소유권을 균형 있게 유지할 수 있도록 보장합니다. 약정 거래 및 부분 소유권과 같은 기능은 유동성을 더욱 최적화하여 자산 기반 보상이 더 넓은 기여자에게 매력적으로 만듭니다. 이러한 일관성은 협력을 촉진하고 소규모 AI 애플리케이션의 혁신을 이끌며 데이터 생성자와 스타트업을 위한 다양한 투자 생태계를 창출합니다.
DPath.ai: 병리학 AI 데이터 문제 해결을 위한 협력 솔루션
DPath.ai는 전 세계의 병리학자, 연구자 및 AI 모델 개발자를 연결하기 위해 탈중앙화된 플랫폼을 개척하고 있습니다. 우리는 고품질 병리학 데이터의 획득, 기획 및 교환을 담당하여 AI 모델 훈련에 관심이 있는 모든 사람이 참여할 수 있도록 합니다. DPath 플랫폼은 블록체인 기술을 활용하여 데이터 교환의 투명성, 공정성 및 안전성을 보장합니다.
DPath.ai와 같은 플랫폼은 Codatta의 탈중앙화된 데이터 프로토콜을 활용하여 협력적이고 투명하게 주석을 획득할 수 있습니다:
- 작업 정의: 전립선암의 Gleason 등급과 같은 명확한 주석 기준을 설정하여 결과 데이터의 일관성과 신뢰성을 보장합니다.
- 커뮤니티 참여: 전 세계의 숙련된 병리학자가 Codatta 플랫폼을 통해 참여하며, 로열티 모델의 인센티브를 받아 데이터셋의 미래 가치에 연계된 지속적인 보상을 받습니다.
- 품질 및 완전성: 블록체인 기반의 검증 및 다자간 교차 참조를 통해 추적 가능한 고품질 주석을 보장하고, 주석자의 책임감을 높입니다.
- 안전성 및 접근성: 탈중앙화된 방식으로 데이터를 저장하여 데이터 소유권이 관련 개인에게 안전하고 접근 가능하게 유지됩니다.
그림 3: Codatta와 DPath.ai의 협력. 이미지 출처: https://huggingface.co/datasets/Codatta/Refined-TCGA-PRAD-Prostate-Cancer-Pathology-Dataset
특정 분야의 데이터를 협력적으로 획득함으로써 DPath.ai는 정확한 Gleason 등급으로 TCGA PRAD 데이터셋을 풍부하게 할 뿐만 아니라 Codatta 플랫폼이 전문 AI 분야를 위해 최전선 데이터를 생성하는 방법을 보여주었습니다. 이 방법은 지속 가능한 참여를 촉진하고 데이터 획득을 민주화하여 공정하고 효율적인 의료 AI 시스템의 발전을 가속화합니다.
결론
《TCGA PRAD 데이터셋의 최적화된 Gleason 등급 주석》은 Codatta와 DPath.ai의 협력 결과로, 주석 이유가 포함된 ROI 수준의 주석을 통해 병리학 AI 데이터의 진단 정확성과 세밀함을 향상시켰습니다. 전 세계 병리학 전문가의 참여를 통해 이 프로젝트는 고품질 데이터를 보장하며, Codatta의 로열티 모델을 통해 기여자에게 보상을 제공하고 지속적인 가치와 소유권을 보장합니다. 이 방법은 협력을 촉진하고 데이터 유동성을 개선하며 의료 AI의 발전을 가속화하여 탈중앙화되고 커뮤니티 주도의 솔루션의 힘을 보여줍니다.