비탈릭 부테린: 트위터의 새로운 기능 커뮤니티 노트에 대한 생각

비탈릭 부테린

2023-08-17 11:39:44

수집

비록 Community Notes는 "암호 프로젝트"는 아니지만, 그것은 우리가 주류 세계에서 볼 수 있는 "암호 가치관"에 가장 가까운 사례일 수 있습니다.

위챗으로 스캔하기

원문 제목：《Community Notes에 대한 나의 생각은 무엇인가?》

저자：vitalikButerin

편집：심조 TechFlow

지난 2년간, Twitter(X)는 말 그대로 격동의 시기를 겪었습니다. 작년, Elon Musk는 440억 달러에 이 플랫폼을 인수한 후, 회사의 인력 배치, 콘텐츠 검토, 비즈니스 모델 및 웹사이트 문화에 대해 전면적인 개혁을 단행했습니다. 이러한 변화는 특정 정책 결정보다는 Elon Musk의 소프트 파워에 더 기인한 것으로 보입니다. 그러나 이러한 논란의 여지가 있는 조치들 속에서, Twitter에서 새로운 기능이 빠르게 중요해졌고, 각 정치 진영에서 사랑받는 것처럼 보입니다: Community Notes.

Community Notes는 사실 확인 도구로, 때때로 트윗에 배경 주석을 추가합니다. 예를 들어, 위의 Elon Musk의 트윗처럼 사실 확인 및 반허위 정보 도구로 사용됩니다. 처음에는 Birdwatch라는 이름으로 불리며, 2021년 1월에 처음으로 파일럿 프로젝트로 출시되었습니다. 이후 점진적으로 확대되었으며, 가장 빠른 확장 단계는 작년 Elon Musk가 Twitter를 인수한 시점과 겹칩니다. 현재 Twitter에서 많은 주목을 받는 트윗, 특히 논란이 있는 정치적 주제를 포함한 트윗에서 Community Notes가 자주 등장합니다. 제 생각에는, 그리고 여러 정치 진영의 많은 사람들과 대화한 결과, 이러한 Notes는 등장할 때 정보가 풍부하고 가치가 있다고 결론지었습니다.

하지만, 가장 흥미로운 점은 Community Notes가 "암호화 프로젝트"는 아니지만, 우리가 주류 세계에서 볼 수 있는 "암호화 가치관"에 가장 가까운 사례일 수 있다는 점입니다. Community Notes는 일부 중앙에서 선정된 전문가가 작성하거나 기획한 것이 아닙니다. 반대로, 누구나 작성하고 투표할 수 있으며, 어떤 Notes가 표시되거나 표시되지 않는지는 완전히 오픈 소스 알고리즘에 의해 결정됩니다. Twitter 웹사이트에는 알고리즘의 작동 방식에 대한 자세하고 포괄적인 가이드가 있으며, 발행된 Notes와 투표 데이터를 포함한 파일을 다운로드하고, 알고리즘을 로컬에서 실행하여 출력이 Twitter 웹사이트에서 볼 수 있는 내용과 일치하는지 검증할 수 있습니다. 완벽하지는 않지만, 상당히 논란이 있는 상황에서 믿을 수 있는 중립의 이상에 놀라울 정도로 가까워 보이며, 동시에 매우 유용합니다.

Community Notes 알고리즘은 어떻게 작동하나요?

특정 조건을 충족하는 Twitter 계정(기본적으로: 6개월 이상 활동, 위반 기록 없음, 인증된 전화번호 보유)의 누구나 Community Notes에 참여할 수 있습니다. 현재 참가자는 느리게 무작위로 수용되고 있지만, 궁극적인 계획은 자격을 갖춘 누구나 참여할 수 있도록 하는 것입니다. 수용되면, 먼저 기존 Notes에 대한 평가에 참여할 수 있으며, 평가가 충분히 좋으면(어떤 평가가 해당 Notes의 최종 결과와 일치하는지를 통해 측정) 자신의 Notes를 작성할 수 있습니다.

Notes를 작성하면, 해당 Notes는 다른 Community Notes 회원의 평가에 따라 점수를 받습니다. 이러한 평가는 "유용함", "다소 유용함", "유용하지 않음"의 세 가지 수준으로 투표할 수 있지만, 평가는 알고리즘에서 역할을 하는 다른 태그를 포함할 수 있습니다. 이러한 평가에 따라 Notes는 점수를 받습니다. 만약 Notes의 점수가 0.40을 초과하면, 해당 Notes는 표시됩니다. 그렇지 않으면 표시되지 않습니다.

알고리즘의 독특한 점은 점수를 계산하는 방식입니다. 단순한 알고리즘과 달리, 단순한 알고리즘은 사용자 평가의 어떤 총합이나 평균을 계산하여 최종 결과로 사용하는 것을 목표로 하지만, Community Notes 평가 알고리즘은 명확하게 다양한 관점에서 긍정적인 평가를 받은 Notes를 우선시하려고 합니다. 즉, 일반적으로 평가에서 의견이 일치하지 않는 사람들이 특정 Notes에 대해 합의에 도달하면, 해당 Notes는 높은 점수를 받게 됩니다.

작동 방식을 더 깊이 살펴보겠습니다. 우리는 사용자 집합과 Notes 집합이 있습니다. 우리는 M이라는 행렬을 생성할 수 있으며, 여기서 셀 Mij는 i번째 사용자가 j번째 Notes를 어떻게 평가하는지를 나타냅니다.

주어진 Notes에 대해 대부분의 사용자가 해당 Notes에 대한 평가를 하지 않기 때문에, 행렬의 대부분의 항목은 0이 될 것입니다. 그러나 이는 문제가 되지 않습니다. 알고리즘의 목표는 사용자와 Notes의 네 개의 열 모델을 생성하여 각 사용자에게 "우호도"와 "극성"이라는 두 가지 통계를 할당하고, 각 Notes에 대해 "유용성"과 "극성"이라는 두 가지 통계를 할당하는 것입니다. 이 모델은 행렬을 이러한 값의 함수로 예측하려고 시도하며, 다음 공식을 사용합니다:

여기서 저는 Birdwatch 논문에서 사용된 용어와 제가 제공한 용어를 소개하여 변수가 의미하는 바를 더 직관적으로 이해할 수 있도록 하며, 수학적 개념은 포함하지 않습니다:

μ는 사용자들이 일반적으로 주는 평가의 높이를 측정하는 "공공 감정" 매개변수입니다.
iu는 사용자의 "우호도"로, 해당 사용자가 높은 평가를 줄 가능성이 얼마나 되는지를 나타냅니다.
in은 Notes의 "유용성"으로, 해당 Notes가 높은 평가를 받을 가능성이 얼마나 되는지를 나타냅니다. 이것이 우리가 관심 있는 변수입니다.
fu 또는 fn은 사용자 또는 Notes의 "극성"으로, 정치적 극단의 주축에서의 위치를 나타냅니다. 실제로, 부정 극성은 대략 "좌파"를 의미하고, 긍정 극성은 "우파"를 의미하지만, 극단 축은 사용자와 Notes의 데이터를 분석하여 도출된 것이며, 좌파와 우파의 개념은 하드코딩되어 있지 않습니다.

알고리즘은 상당히 기본적인 머신러닝 모델(표준 경량 하강법)을 사용하여 행렬 값을 예측하기 위한 최적의 변수 값을 찾습니다. 특정 Notes에 할당된 유용성은 해당 Notes의 최종 점수입니다. 만약 Notes의 유용성이 최소 +0.4라면, 해당 Notes는 표시됩니다.

여기서 핵심적인 교묘함은 "극성"이 특정 Notes의 특성을 흡수한다는 점입니다. 이러한 특성은 일부 사용자에게는 좋아하고, 다른 사용자에게는 싫어하는 결과를 초래하며, "유용성"은 모든 사용자가 좋아하는 특성만을 측정합니다. 따라서 유용성을 선택하면 부문 간의 인정을 받는 Notes를 식별하고, 한 부문에서 환호받지만 다른 부문에서 반감을 일으키는 Notes는 제외할 수 있습니다.

위의 내용은 알고리즘의 핵심 부분만 설명했습니다. 실제로는 그 위에 추가적인 메커니즘이 많이 추가되어 있습니다. 다행히도, 이들은 공개 문서에 설명되어 있습니다. 이러한 메커니즘에는 다음과 같은 내용이 포함됩니다:

알고리즘은 여러 번 실행되며, 매번 투표에 일부 무작위로 생성된 극단 "가짜 투표"를 추가합니다. 이는 알고리즘이 각 Notes의 실제 출력을 값의 범위로 나타내며, 최종 결과는 해당 범위에서 "하한 신뢰도"를 추출하고 0.32의 임계값과 비교하여 결정된다는 것을 의미합니다.
많은 사용자(특히 Notes의 극성과 유사한 사용자)가 특정 Notes를 "유용하지 않음"으로 평가하고, 동일한 "태그"(예: "논란의 여지가 있는 언어", "출처가 Notes를 지원하지 않음")를 평가 이유로 지정하면, Notes가 게시되기 위해 필요한 유용성 임계값이 0.4에서 0.5로 증가합니다(이는 작아 보이지만 실제로는 매우 중요합니다).
특정 Notes가 수용되면, 해당 Notes의 유용성은 수용에 필요한 임계값 0.01점 이하로 낮아야 합니다.
알고리즘은 여러 모델을 사용하여 더 많은 횟수로 실행되며, 때때로 원래 유용성 점수가 0.3에서 0.4 사이인 Notes를 높일 수 있습니다.

결론적으로, 여러분은 6282줄에 달하는 상당히 복잡한 Python 코드를 얻게 되며, 이는 22개의 파일에 분산되어 있습니다. 그러나 이 모든 것은 공개되어 있으며, 여러분은 Notes와 평가 데이터를 다운로드하여 직접 실행하고, 출력 결과가 Twitter의 실제 상황과 일치하는지 확인할 수 있습니다.

그렇다면 실제로 이것은 어떤 모습인가요?

이 알고리즘과 사람들이 투표에서 평균 점수를 단순히 취하는 방법의 가장 큰 차이점은 제가 "극성" 값이라고 부르는 개념일 수 있습니다. 알고리즘 문서에서는 이를 fu와 fn이라고 부르며, f는 인자를 나타내며, 이 두 용어는 서로 곱해집니다. 더 일반적인 용어 부분은 최종적으로 fu와 fn이 다차원적으로 되기를 희망하기 때문입니다.

극성은 사용자와 Notes에 할당됩니다. 사용자 ID와 기본 Twitter 계정 간의 링크는 의도적으로 비공개로 유지되지만, Notes는 공개됩니다. 실제로, 최소한 영어 데이터 세트의 경우, 알고리즘이 생성한 극성은 좌파와 우파와 매우 밀접하게 관련되어 있습니다.

다음은 극성이 약 -0.8인 Notes의 몇 가지 예입니다:

여기서 제가 특별히 선택한 것은 아닙니다. 이들은 실제로 제가 로컬에서 알고리즘을 실행할 때 생성된 scored_notes.tsv 스프레드시트의 첫 세 줄로, 극성 점수(스프레드시트에서 coreNoteFactor1이라고 함)가 -0.8 미만입니다.

이제 극성이 약 +0.8인 Notes가 있습니다. 사실, 이들 중 많은 수는 포르투갈어로 브라질 정치에 대해 이야기하는 사람들이거나, 테슬라 팬들이 테슬라에 대한 비판에 격렬하게 반박하는 것인데, 그래서 제가 약간 선택하여 이 두 범주에 속하지 않는 Notes를 찾아보겠습니다:

다시 한 번 말씀드리지만, "좌파와 우파의 구분"은 어떤 방식으로도 하드코딩되어 있지 않습니다. 이는 계산을 통해 발견된 것입니다. 이는 이 알고리즘을 다른 문화적 배경에 적용하면, 주요 정치적 분열을 자동으로 감지하고 이러한 분열 간의 다리를 놓을 수 있음을 나타냅니다.

동시에, 가장 높은 유용성을 가진 Notes는 다음과 같은 모습입니다. 이번에는 이 Notes가 실제로 Twitter에 표시되므로, 직접 스크린샷을 찍을 수 있습니다:

또 다른 하나:

두 번째 Notes는 더 직접적으로 고도로 당파적인 정치 주제와 관련이 있지만, 이는 명확하고 고품질이며 정보가 풍부한 Notes이므로 높은 점수를 받았습니다. 전반적으로 이 알고리즘은 효과적인 것으로 보이며, 알고리즘의 출력을 검증하기 위해 코드를 실행하는 것도 실행 가능해 보입니다.

이 알고리즘에 대한 제 생각은 무엇인가요?

이 알고리즘을 분석할 때, 가장 인상 깊었던 것은 그 복잡성입니다. "학술 논문 버전"이 있으며, 이는 경량 하강법을 사용하여 다섯 개의 벡터와 행렬 방정식의 최적 적합을 찾습니다. 그 다음은 실제 버전으로, 복잡한 알고리즘이 수행하는 일련의 작업이 있으며, 그 과정에서 많은 임의의 계수가 포함되어 있습니다.

심지어 학술 논문 버전도 기본적인 복잡성을 숨기고 있습니다. 최적화된 방정식은 4차 다항식입니다(예측 공식에 2차의 fu*fn 항이 포함되어 있으며, 비용 함수는 오차의 제곱을 측정합니다). 임의의 수의 변수에서 2차 방정식을 최적화하는 것은 거의 항상 유일한 해를 가지며, 이는 상당히 기본적인 선형 대수를 사용하여 계산할 수 있지만, 많은 변수에서 4차 방정식을 최적화하는 것은 일반적으로 많은 해를 가지므로, 여러 번의 경량 하강 알고리즘이 서로 다른 답을 도출할 수 있습니다. 미세한 입력 변화는 한 국소 최소값에서 다른 국소 최소값으로의 전환을 초래하여 출력 결과를 크게 변경할 수 있습니다.

이는 제가 개발에 참여한 알고리즘(예: 이차 자금 조달)과의 차이점으로, 경제학자의 알고리즘과 엔지니어의 알고리즘 간의 차이점처럼 느껴집니다. 경제학자의 알고리즘은 최적의 경우 단순성에 중점을 두고, 상대적으로 분석하기 쉬우며, 해결하려는 작업에 대해 최적(또는 최악이 아닌)임을 명확하게 설명하며, 이상적으로는 이를 활용하려고 할 때 누군가가 얼마나 해를 끼칠 수 있는지를 증명할 수 있습니다. 반면, 엔지니어의 알고리즘은 반복적인 시행착오 과정을 통해 도출되며, 엔지니어의 작업 환경에서 무엇이 효과적이고 무엇이 효과적이지 않은지를 확인합니다. 엔지니어의 알고리즘은 실용적이며 작업을 수행할 수 있지만, 경제학자의 알고리즘은 예기치 않은 상황에 직면했을 때 완전히 통제되지 않습니다.

또는, 존경받는 인터넷 철학자 roon(또는 tszzl)이 관련 주제에서 말한 것처럼:

물론, 저는 암호화폐의 "이론적 미학" 측면이 필요하다고 생각합니다. 이는 신뢰가 필요 없는 프로토콜과 보기에는 좋지만, 실제로는 일부 중앙화된 참여자를 신뢰해야 하거나, 심지어 완전히 사기인 것처럼 보이는 프로토콜을 정확하게 구분할 수 있습니다.

딥러닝은 정상적으로 효과적이지만, 다양한 적대적 머신러닝 공격에 대해 불가피한 약점을 가지고 있습니다. 잘 수행될 수 있다면, 기술적 함정과 높은 추상적 단계가 이러한 공격에 맞설 수 있습니다. 따라서 저는 질문이 있습니다: Community Notes 자체를 더 경제학적 알고리즘에 가까운 것으로 변환할 수 있을까요?

이것이 실제로 무엇을 의미하는지 이해하기 위해, 몇 년 전 비슷한 목적을 위해 설계한 알고리즘을 살펴보겠습니다: Pairwise-bounded quadratic funding(새로운 이차 자금 조달 설계).

Pairwise-bounded quadratic funding의 목표는 "일반적인" 이차 자금 조달에서의 결함을 보완하는 것입니다. 즉, 두 참여자가 서로 공모할 경우, 그들은 허위 프로젝트에 대해 매우 높은 금액을 기부하고, 자금을 그들에게 반환하며, 전체 자금 풀을 고갈시키는 대규모 보조금을 받을 수 있습니다. Pairwise-bounded quadratic funding에서는 각 쌍의 참여자에게 제한된 예산 M을 할당합니다. 알고리즘은 모든 가능한 참여자 쌍을 순회하며, 알고리즘이 특정 프로젝트 P에 보조금을 추가하기로 결정하면, 참여자 A와 참여자 B가 모두 이를 지지하기 때문에 이 보조금은 해당 쌍(A, B)에 할당된 예산에서 차감됩니다. 따라서 k명의 참여자가 공모하더라도, 그들이 메커니즘에서 훔칠 수 있는 금액은 최대 k * (k-1) * M입니다.

이 형태의 알고리즘은 Community Notes의 배경에는 적합하지 않습니다. 왜냐하면 각 사용자가 투표하는 수가 매우 적기 때문입니다. 평균적으로, 두 사용자 간의 공동 투표 수는 0입니다. 따라서 각 사용자 쌍을 개별적으로 살펴보는 것만으로는 알고리즘이 사용자의 극성을 이해할 수 없습니다. 머신러닝 모델의 목표는 매우 희소한 원시 데이터에서 "채우기"를 시도하는 것입니다. 이러한 데이터는 이러한 방식으로 직접 분석할 수 없습니다. 그러나 이러한 방법의 도전 과제는 소수의 나쁜 투표에 직면했을 때 결과가 매우 불안정해지지 않도록 추가적인 노력이 필요하다는 것입니다.

Community Notes가 정말로 좌파와 우파를 저항할 수 있을까요?

우리는 Community Notes 알고리즘이 실제로 극단을 저항할 수 있는지 분석할 수 있습니다. 즉, 그것이 순진한 투표 알고리즘보다 더 나은 성과를 내는지 여부입니다. 이러한 투표 알고리즘은 어느 정도 극단을 저항해왔습니다. 예를 들어, 어떤 게시물이 200개의 좋아요와 100개의 싫어요를 받으면, 200개의 좋아요만 있는 게시물보다 성과가 떨어집니다. 하지만 Community Notes는 더 잘할 수 있을까요?

추상적인 알고리즘 관점에서 보면, 말하기 어렵습니다. 평균 점수가 매우 높지만 양극화된 게시물이 왜 강한 극성과 높은 유용성을 얻지 못할까요? 아이디어는 이러한 투표가 서로 충돌할 경우, 극성이 해당 게시물이 많은 투표를 받는 특성을 "흡수"해야 한다는 것입니다. 하지만 실제로 그렇게 되었나요?

이를 확인하기 위해, 저는 스스로 단순화된 구현을 100회 실행했습니다. 평균 결과는 다음과 같습니다:

이 테스트에서 "좋은" Notes는 동일한 정치 진영의 사용자에게 +2의 점수를 받았고, 반대 정치 진영의 사용자에게는 +0의 점수를 받았습니다. "좋지만 더 극단적인 경향이 있는" Notes는 동일한 진영의 사용자에게 +4의 점수를 받았고, 반대 진영의 사용자에게는 -2의 점수를 받았습니다. 평균 점수는 동일하지만, 극성은 다릅니다. 그리고 실제로 "좋은" Notes의 평균 유용성이 "좋지만 더 극단적인 경향이 있는" Notes보다 더 높은 것으로 보입니다.

"경제학자 알고리즘"에 더 가까운 알고리즘은 극단화를 처벌하는 방법에 대한 더 명확한 이야기를 제공할 것입니다.

고위험 상황에서 이 모든 것이 얼마나 유용한가요?

우리는 특정 상황을 관찰함으로써 이 중 일부를 이해할 수 있습니다. 약 한 달 전, Ian Bremmer는 중국 정부 관료에 대한 트윗에 매우 비판적인 Community Note가 추가되었지만, 해당 Notes가 삭제되었다고 불평했습니다.

이는 어려운 작업입니다. 이더리움 커뮤니티 환경에서 메커니즘 설계를 하는 것은 한 가지이며, 그곳에서 가장 큰 불만은 아마도 20000달러가 극단적인 Twitter 인플루언서에게 흘러가는 것일 것입니다. 그러나 수백만 명에게 영향을 미치는 정치 및 지정학적 문제와 관련될 때, 상황은 완전히 다릅니다. 모든 사람은 종종 최악의 동기를 합리적으로 가정합니다. 그러나 만약 메커니즘 설계자가 세계에 중대한 영향을 미치고자 한다면, 이러한 고위험 환경과 상호작용하는 것이 필수적입니다.

Twitter의 경우, Notes가 삭제된 이유로 중앙 집중식 조작이 의심되는 명백한 이유가 있습니다. Elon Musk는 중국에서 많은 상업적 이익을 가지고 있으므로, Elon Musk가 Community Notes 팀에 알고리즘 출력을 조작하도록 강요하고 이 특정 Notes를 삭제했을 가능성이 있습니다.

다행히도, 이 알고리즘은 오픈 소스이며 검증 가능하므로, 우리는 실제로 깊이 파고들 수 있습니다! 이 작업을 해봅시다. 원래 트윗의 URL은 https://twitter.com/MFA_China/status/1676157337109946369입니다. 끝의 숫자 1676157337109946369는 트윗의 ID입니다. 우리는 다운로드 가능한 데이터에서 해당 ID를 검색하고, 위의 Notes가 있는 특정 행을 확인할 수 있습니다:

여기서 우리는 Notes 자체의 ID인 1676391378815709184를 얻었습니다. 그런 다음 알고리즘이 생성한 scorednotes.tsv 및 notestatus_history.tsv 파일에서 해당 ID를 검색합니다. 우리는 다음과 같은 결과를 얻었습니다:

첫 번째 출력의 두 번째 열은 해당 Notes의 현재 점수입니다. 두 번째 출력은 해당 Notes의 이력 기록을 보여줍니다: 현재 상태는 일곱 번째 열(NEEDSMORERATINGS)에 있으며, 이전에 받은 첫 번째 상태는 다섯 번째 열(CURRENTLYRATEDHELPFUL)에서 NEEDSMORERATINGS이 아닙니다. 따라서 우리는 알고리즘이 처음에 해당 Notes를 표시한 후, 점수가 약간 하락하자 이를 삭제했음을 볼 수 있습니다. 중앙 집중식 개입이 개입되지 않은 것으로 보입니다.

우리는 또한 투표 자체를 살펴봄으로써 이 문제를 다른 방식으로 볼 수 있습니다. ratings-00000.tsv 파일을 스캔하여 해당 Notes에 대한 모든 평가를 분리하고, 얼마나 많은 평가가 HELPFUL 및 NOT_HELPFUL인지 확인할 수 있습니다:

그러나 타임스탬프별로 정렬하고 처음 50개의 투표를 살펴보면, 40개의 HELPFUL 투표와 9개의 NOT_HELPFUL 투표가 있음을 알 수 있습니다. 따라서 우리는 동일한 결론에 도달했습니다: Notes의 초기 청중은 Notes에 대해 더 긍정적인 평가를 했고, Notes의 후속 청중은 평가가 더 낮아졌습니다. 따라서 점수는 처음부터 높았고 시간이 지남에 따라 더 낮아졌습니다.

불행히도, Notes가 상태를 변경하는 정확한 상황을 설명하기는 어렵습니다. 이는 단순히 "이전 점수가 0.40 이상이었고, 현재 점수가 0.40 이하이므로 삭제되었다"는 간단한 문제가 아닙니다. 반대로, 많은 NOT_HELPFUL 응답이 비정상 조건 중 하나를 촉발하여 Notes가 임계값 이상을 유지해야 하는 유용성 점수를 증가시켰습니다.

이는 또 다른 좋은 학습 기회로, 신뢰할 수 있는 중립 알고리즘을 진정으로 신뢰할 수 있게 만들기 위해서는 단순함을 유지해야 한다는 교훈을 가르쳐줍니다. Notes가 수용에서 비수용으로 전환될 경우, 왜 그렇게 되었는지를 설명하는 간단하고 명확한 이야기가 있어야 합니다.

물론, 이 투표를 조작하는 완전히 다른 방법이 있습니다: Brigading. 자신이 동의하지 않는 Notes를 본 사람은 높은 참여를 가진 커뮤니티(또는 더 나쁜 경우, 대량의 가짜 계정)를 호출하여 이를 NOT_HELPFUL로 평가할 수 있으며, 아마도 그렇게 많은 투표가 필요하지 않을 것입니다. 이러한 조정 공격에 대한 알고리즘의 취약성을 올바르게 줄이기 위해서는 더 많은 분석과 작업이 필요합니다. 가능한 개선 사항 중 하나는 사용자가 어떤 Notes에 대해서도 투표할 수 없도록 하고, 대신 "당신을 위해" 알고리즘이 추천하는 방식으로 Notes를 무작위로 평가자에게 할당하며, 평가자는 자신에게 할당된 Notes에 대해서만 평가할 수 있도록 하는 것입니다.

Community Notes가 충분히 "용감하지" 않은가요?

저는 Community Notes에 대한 주요 비판이 기본적으로 그것이 충분히 용감하지 않다는 것이라고 생각합니다. 최근 두 개의 기사가 이 점을 언급했습니다. 그 중 하나의 기사를 인용하자면:

이 프로그램은 Community Notes가 공개되기 위해서는 각 정치 진영의 사람들 간의 합의가 필요하다는 심각한 제한을 받고 있습니다.

"이것은 이데올로기적 합의가 필요합니다,"라고 그는 말했습니다. "즉, 좌파와 우파가 모두 이 주석이 해당 트윗에 추가되어야 한다는 데 동의해야 합니다."

그는 본질적으로 "진실에 대한 초이데올로기적 합의에 도달해야 하며, 당파적 갈등이 심화되는 환경에서는 이러한 합의에 도달하는 것이 거의 불가능하다"고 말했습니다.

이는 까다로운 문제이지만, 궁극적으로 저는 열 개의 잘못된 정보 트윗이 자유롭게 퍼지는 것보다 하나의 트윗이 불공정하게 주석이 붙는 것을 더 원하지 않는다고 생각합니다. 우리는 수년간 사실 확인을 목격해왔으며, 이는 용감한 일이며, "사실상 우리는 진실을 알고 있으며, 한쪽이 다른 쪽보다 더 자주 거짓말을 한다는 것을 알고 있다"는 관점에서 볼 수 있습니다. 결과는 무엇일까요?

솔직히 말해서, 사실 확인 개념에 대한 상당한 불신이 존재합니다. 여기에서 한 가지 전략은 비판자들을 무시하고, 사실 확인 전문가가 어떤 투표 시스템보다 사실을 더 잘 이해하고 있다는 것을 기억하며, 계속 나아가는 것입니다. 그러나 이러한 접근 방식을 전적으로 취하는 것은 위험해 보입니다. 최소한 어느 정도 모든 사람이 존중하는 초부문 기관을 구축하는 것은 가치가 있습니다. William Blackstone의 격언과 법원처럼, 저는 이러한 존중을 유지하기 위해서는 시스템이 범하는 오류가 누락이 아니라 적극적인 오류여야 한다고 생각합니다. 따라서 저에게는 적어도 하나의 주요 조직이 이러한 다른 경로를 취하고, 그 드문 초부문 존중을 귀중한 자원으로 간주하는 것이 가치가 있는 것 같습니다.

Community Notes가 다소 보수적인 것은 또 다른 이유가 있습니다. 저는 모든 잘못된 정보 트윗, 심지어 대부분의 잘못된 정보 트윗이 수정 주석을 받아야 한다고 생각하지 않습니다. 잘못된 정보 트윗의 1%도 배경이나 수정 주석을 제공받지 못하더라도, Community Notes는 여전히 교육 도구로서 극히 가치 있는 서비스를 제공합니다. 목표는 모든 것을 수정하는 것이 아닙니다. 오히려 목표는 사람들이 다양한 관점이 존재한다는 것을 상기시키고, 어떤 것들은 고립된 상태에서 설득력 있고 매력적으로 보일 수 있지만 실제로는 상당히 잘못되었음을 알리는 것입니다. 그리고 여러분은, 예, 기본적인 인터넷 검색을 통해 그것이 잘못되었음을 검증할 수 있습니다.

Community Notes는 공공 인식론의 모든 문제를 해결하는 만병통치약이 될 수 없으며, 또한 그렇게 설계된 것도 아닙니다. 그것이 해결하지 못하는 문제에 대해서는 다른 메커니즘이 이를 채울 수 있는 충분한 공간이 있으며, 이는 예측 시장과 같은 새로운 도구이거나, 분야 전문 지식을 가진 전담 직원을 고용하는 전통적인 조직일 수 있습니다.

결론

Community Notes는 단순히 매력적인 소셜 미디어 실험일 뿐만 아니라, 극단을 식별하려고 의도적으로 시도하고, 갈등을 지속하기보다는 교차를 촉진하려는 새로운 메커니즘 설계 유형의 사례입니다.

제가 알고 있는 이 범주에서의 다른 두 가지 예는: (i) Gitcoin Grants에서 사용되는 쌍 이차 자금 조달 메커니즘, 그리고 (ii) Polis, 이는 클러스터링 알고리즘을 사용하여 커뮤니티가 일반적으로 인기 있는 주장을 식별하도록 돕는 논의 도구입니다. 이 메커니즘 설계 분야는 매우 가치가 있으며, 이 분야에서 더 많은 학술 작업이 이루어지기를 바랍니다.

Community Notes가 제공하는 알고리즘 투명성은 완전히 탈중앙화된 소셜 미디어는 아니지만, Community Notes의 작업 방식에 동의하지 않는다면 동일한 내용을 다른 알고리즘으로 볼 수 있는 방법이 없습니다. 그러나 이는 향후 몇 년 내에 초대형 애플리케이션이 도달할 수 있는 가장 가까운 결과이며, 우리는 이미 많은 가치를 제공하고 있음을 볼 수 있습니다. 이는 중앙 집중식 조작을 방지하고, 이러한 조작에 참여하지 않는 플랫폼이 정당한 인정을 받을 수 있도록 합니다.

저는 향후 10년 동안 Community Notes와 유사한 정신의 알고리즘이 발전하고 성장하는 것을 기대합니다.