優化標註助力精準診斷:通過 Codatta 的 Roylaty Model 提升病理數據集

行業速遞
2024-12-23 14:43:27
收藏
《TCGA PRAD 資料集的優化型 Gleason 分級標註》是 Codatta 和 DPath.ai 合作的成果,通過帶有標註理由的 ROI 級標註提升了病理學 AI 資料的診斷準確性和細緻程度。

《TCGA PRAD 數據集的優化版 Gleason 分級標註》是 Codatta 與 DPath.ai 合作的成果,為 AI 準備的病理數據樹立了全新標準。通過 Codatta 平台匯聚一批頂級病理學專家社區,該數據集超越了傳統的切片級標註,引入了 ROI 級空間標註 ,提升了診斷的細緻程度、準確性和透明度 。借助優化的 Gleason 分級、詳細的標註理由以及基於 ROI 的 Gleason 模式映射,該數據集成為 AI 模型開發和病理學研究的關鍵資源,解決了創建高質量標註數據的關鍵挑戰。通過 Codatta 的 Roylaty Model,貢獻者可以保持對其作品的所有權,確保其獲得認可和持續價值,而 DPath.ai 展示了協作解決方案如何推動病理學人工智能的發展。

圖1: TCGA PRAD 數據集的優化版 Gleason 分級標註。圖片來源: https://huggingface.co/datasets/Codatta/Refined-TCGA-PRAD-Prostate-Cancer-Pathology-Dataset

什麼是 TCGA PRAD 數據集?

TCGA PRAD(癌症基因組圖譜前列腺腺癌)數據集的優化型 Gleason 分級標註升級了原始的切片級標註,納入了 ROI 級空間標註 。由 Codatta 和 DPath.ai 共同開發,該數據集由病理學家社區協作創建,支持全球參與並確保標註的所有權。此方法提升了診斷的準確性、細緻程度和可靠性 ,這是 AI 模型訓練和病理學研究的關鍵要素。

通過對 435 個 TCGA 全切片圖像的整理,病理學家識別了 245 個需要改進標註的案例,並確認了 190 個案例標註準確。該數據集包含切片級元數據和 ROI 級空間標註,為研究人員提供了 AI 流水線開發、互動式腫瘤區域探索以及高級病理學研究的寶貴資源。

病理學 AI 的賦能:Codatta 與 DPath.ai 聯手

《TCGA PRAD 數據集的優化型 Gleason 分級標註》展示了協作性、社區驅動的數據創建 的潛力,同時提升了標註的準確性和細緻程度,使 AI 模型訓練更可靠,推動醫學研究的發展。然而,這些貢獻需要領域專業知識、時間和努力 ,因此需要一種可持續的激勵結構來認可並獎勵熟練的專業人士的工作。

Royalty Model

Codatta 的Roylaty Model為此提供了解決方案。與傳統 Web2 模式(如 Scale AI)相比,它提升了數據貢獻和獲取效率。雖然 Scale AI 在滿足普通用戶的即時流動性偏好方面表現出色,能夠快速、高效地收集大規模數據,但在涉及領域專家從事專業任務時,其高昂成本將小型參與者拒之門外。而 Codatta 通過提供條件和基於資產的獎勵,與熟練的從業者和專家保持一致。如下面的圖 2 所示,這些激勵措施吸引願意投入高質量專業數據的貢獻者,儘管回報可能會延遲但潛在收益更高,從而使 Codatta 成為需要精確性和專業性 的垂直 AI 和高級應用的理想選擇。

圖2:在數據貢獻中的技能熟練度與流動性偏好的映射

與 Scale AI 的高昂前期成本不同,Codatta 的Roylaty Model通過引入按需付費系統 ,消除了小型 AI 初創企業的財務障礙。此方法民主化了關鍵前沿數據的獲取,無需昂貴的前期投資,允許初創企業展示其產品市場契合度並擴大規模。此外,通過將數據轉化為去中心化金融市場中的流動資產,Codatta 確保貢獻者能夠平衡短期流動性需求和長期資產所有權。約定交易部分所有權 等功能進一步優化了流動性,使基於資產的獎勵對於更廣泛的貢獻者更具吸引力。這種一致性促進了協作,推動了小眾 AI 應用的創新,並為數據創建者和初創企業創造了多元化的投資生態系統。

DPath.ai:解決病理學 AI 數據挑戰的協作方案

DPath.ai 正在開創一個去中心化平台,旨在連接全球的病理學家、研究人員和 AI 模型開發者。我們負責高質量病理學數據的獲取、策劃和交換 ,讓任何對訓練 AI 模型感興趣的人都能參與其中。DPath 平台利用區塊鏈技術,確保數據交換的透明性、公平性和安全性

像 DPath.ai 這樣的平台可以利用 Codatta 的去中心化數據協議,共同和透明地獲取標註:

  • 任務定義 :明確的標註標準(如前列腺癌的 Gleason 分級),確保結果數據的一致性和可靠性。
  • 社區參與 :全球熟練病理學家通過 Codatta 平台參與,並受到其Roylaty Model的激勵,獲得與數據集未來價值掛鉤的持續獎勵。
  • 質量與完整性 :基於區塊鏈的驗證和多方交叉引用確保了可追溯的高質量標註,同時提高了標註者的責任心。
  • 安全性與可訪問性 :通過去中心化方式存儲數據,數據所有權對相關個人保持安全且可訪問。

圖3:Codatta 與 DPath.ai 的合作。圖片來源: https://huggingface.co/datasets/Codatta/Refined-TCGA-PRAD-Prostate-Cancer-Pathology-Dataset

通過協作方式獲取特定領域的數據,DPath.ai 不僅通過精確的 Gleason 分級豐富了 TCGA PRAD 數據集,還展示了 Codatta 平台如何為專業 AI 領域創建前沿數據。這種方法促進了可持續參與,民主化了數據獲取,加速了公平高效的醫療保健 AI 系統的發展。

結語

《TCGA PRAD 數據集的優化型 Gleason 分級標註》是 Codatta 和 DPath.ai 合作的成果,通過帶有標註理由的 ROI 級標註提升了病理學 AI 數據的診斷準確性和細緻程度。通過全球病理學專家的參與,該項目確保了高質量數據,同時通過 Codatta 的Roylaty Model獎勵貢獻者,提供持續價值和所有權。這種方法還促進了協作,改善了數據流動性,加速了醫療保健 AI 的發展,展現了去中心化、社區驅動解決方案的力量。

鏈捕手ChainCatcher提醒,請廣大讀者理性看待區塊鏈,切實提高風險意識,警惕各類虛擬代幣發行與炒作,站內所有內容僅係市場信息或相關方觀點,不構成任何形式投資建議。如發現站內內容含敏感信息,可點擊“舉報”,我們會及時處理。
banner
ChainCatcher 與創新者共建Web3世界