Sora 13인 팀 해독: 베이징대 동문 포함 3명의 화교, 졸업생 박사가 21세 천재 소년과 함께
作者:신지원
OpenAI는 Sora로 세계를 놀라게 했습니다.
어떤 천재 팀이 이런 걸작을 개발할 수 있을까요?
결과를 보니 OpenAI의 저자 팀은 단 13명, 신입 박사들이 이끌고, 00년대 출생자들이 참여했으며, 팀에는 3명의 화교가 있고, 한 명은 베이징 대학 동문입니다.
팀 브룩스
팀 브룩스는 OpenAI에서 Sora 프로젝트를 공동 이끌었으며, 그의 연구 초점은 현실 세계를 시뮬레이션할 수 있는 대형 생성 모델 개발입니다.
그는 버클리 AI 연구 센터에서 박사 학위를 받았으며, 박사 지도교수는 Alyosha Efros입니다. 박사 과정 중에 그는 InstructPix2Pix라는 기술을 제안했습니다.
OpenAI에 합류하기 전, 그는 구글에서 Pixel 휴대폰 카메라의 AI 기술 개발에 참여했으며, 엔비디아에서 비디오 생성 모델을 연구했습니다.
동시에 그는 DALL·E 3의 주요 연구원입니다.
그의 또 다른 경력은 정말로 놀라움을 자아냅니다------
그의 사진 작품은 "내셔널 지오그래픽", "Nature's Best Photography" 및 "National Wildlife Federation"의 상을 수상했습니다.
그가 촬영한 동물 사진:
그는 뉴욕시 브로드웨이의 비콘 극장에서 공연했으며, 국제 무반주 구술 대회에서 수상한 경험도 있습니다.
네티즌들은 그가 이런 자유를 가지고 있는 것에 부러움을 표했습니다.
마지막으로, 팀 브룩스는 이력서에서 꽤 "베르사이유"하게 말했습니다: "저는 AI에 대한 열정이 넘치며, 다행히도 이 열정은 사진, 영화 및 음악에 대한 사랑과 완벽하게 융합됩니다."
보아하니, 사진을 좋아하지 않는 배우는 OpenAI의 과학자가 될 수 없는 것 같습니다.
빌 피블스
Sora 프로젝트를 공동 이끌고 있는 또 다른 과학자 빌 피블스는 비디오 생성 및 세계 시뮬레이션 기술 개발에 집중하고 있습니다.
이 친구는 팀 브룩스와 비슷한 경력을 가지고 있으며, 역시 버클리 AI 연구 센터에서 박사 학위를 받았고, 지도교수는 Alyosha Efros입니다.
그의 학부는 MIT에서 공부했으며, 지도교수는 Antonio Torralba입니다.
그는 FAIR, Adobe Research 및 엔비디아에서 인턴 경험이 있습니다.
FAIR에서 인턴으로 일하는 동안, 그는 현재 NYU의 화교 교수인 셰사이닝과 함께 논문 "Scalable Diffusion Models with Transformers"를 발표했으며, 이 논문에서 Sora의 기본 구조를 제안했습니다.
버클리를 졸업한 후, 그는 OpenAI에 합류하여 OpenAI 팀을 이끌며 거의 잠을 자지 않고 1년 이상 일한 끝에 Sora가 탄생했습니다.
Connor Holmes
Connor Holmes는 마이크로소프트에서 몇 년간 인턴으로 일한 후, 정직원이 되었고, 지난해 말 OpenAI로 이직하여 Sora와 같은 큰 일을 만났습니다.
그는 추론 및 심층 학습 작업에서 발생하는 시스템 효율성 문제를 해결하는 데 전념하고 있습니다.
LLM, BERT 스타일 인코더, 순환 신경망(RNNs) 및 UNets 등 분야에서 풍부한 경험을 가지고 있습니다.
그는 또한 자신의 LinkedIn에서 취미로 수영을 언급했으며, 수영 구조대에서 아르바이트를 한 경험도 있습니다.
그는 학부부터 대학원까지 콜로라도 광업 대학에서 공부했습니다.
학교 순위는 높지 않지만, 그는 뛰어난 능력으로 OpenAI의 연구원이 되어 Sora, DALL·E 3 등 프로젝트에 참여했습니다.
윌 드퓨
감탄하지 않을 수 없습니다. 아마도 OpenAI와 같은 곳에서만 00년대 출생 연구원이 중요한 프로젝트에서 핵심 역할을 할 수 있을 것입니다.
그의 이력서를 보니, 학부 졸업 후 OpenAI에 연구원으로 합류한 것은 이미 놀라운 성과인 것 같습니다.
하지만 그가 고등학교 시절에 이미 회사를 설립했다는 사실을 알고 나니, 정말로 대단한 인재는 나이와 상관없이 존재한다는 것을 느낍니다.
약 반년 전, 그는 유튜브의 한 프로그램에서 어떻게 이렇게 어린 나이에 많은 주목할 만한 성과를 이룰 수 있었는지 공유했습니다.
유페이 궈
이 화교 연구자는 매우 신비롭습니다. 이력서를 남기지 않았지만, OpenAI의 최근 두 개의 대형 프로젝트에서 모두 이름을 남겼습니다.
GPT-4 기술 보고서:
DALL·E 3 기술 보고서:
리징
리징은 베이징 대학에서 학부를 졸업한 후 MIT에서 물리학 박사 학위를 취득했습니다.
현재 그는 OpenAI에서 연구 작업을 하고 있으며, 연구 분야는 다중 모달 학습 및 생성 모델을 포함하고 있으며, DALL·E 3 개발에 참여한 경험이 있습니다.
DALL·E 3 기술 보고서
그 이전에는 FAIR에서 Yann LeCun과 협력하여 박사 후 연구를 진행했습니다.
데이비드 슈너
이분은 AI 분야의 베테랑입니다. 그는 2012년에 나중에 아마존에 인수된 Graphiq에 합류하여 팀을 이끌며 현재 Alexa의 프로토타입을 만들었습니다.
2016년에 우버로 이직한 후, 3년 뒤 OpenAI에 합류하여 지금까지 일하고 있습니다.
그는 팀에서 학부 졸업으로 OpenAI에 합류할 수 있는 몇 안 되는 인재 중 한 명입니다.
조 테일러
조 테일러의 이전 경력에는 Stripe, Periscope.tv/Twitter, Square 및 자신의 디자인 스튜디오인 Joe Taylor Designer가 포함됩니다.
그는 2004년부터 2010년까지 샌프란시스코 예술 대학(Academy of Art University)에서 뉴미디어/컴퓨터 아트 전공으로 미술학사(BFA) 학위를 받았습니다.
그의 학력과 경력을 보면, 그는 엔지니어라기보다는 예술가에 가까운 것 같습니다.
그는 사용자 인터페이스 디자인, 웹 디자인, 아트 디렉션 등 여러 분야에서 강력한 전문 기술을 보유하고 있습니다.
Sora 팀에 합류하기 전, 그는 ChatGPT 팀에서 일한 경험이 있습니다.
에릭 루만
에릭 루만은 인공지능에 대한 열정이 넘치는 연구 애호가로, 효율적이고 선도적인 인공지능 알고리즘 개발에 집중하고 있습니다.
그의 연구 관심사는 생성 모델링 및 컴퓨터 비전 분야, 특히 확산 모델에 중점을 두고 있습니다.
그의 여러 논문은 확산 모델과 같은 시각 모델과 관련이 있습니다.
트로이 루만
에릭 루만과 이름이 비슷한 이 연구자는 인터넷에 거의 정보가 없습니다. 오직 그의 본명으로 된 X 계정 아래에 Sam Altman의 당시 퇴사 소동과 관련된 리트윗이 하나 있습니다.
클레런스 윙 인 NG
이 저자는 더욱 신비롭습니다. 인터넷에서 관련 정보를 거의 찾을 수 없습니다.
오직 미국 특허 정보에서 그가 아마존에서 일할 당시 관련된 특허 기록이 하나 있습니다.
리키 왕
이 화교 엔지니어는 메타에서 여러 해 일한 경험이 있으며, UC 버클리에서 졸업했습니다.
올해 1월 OpenAI에 합류했습니다.
UC 버클리에서 학부를 졸업했습니다:
아디티야 라메시트
그는 OpenAI의 원로로, DALL·E 2와 DALL·E 3을 이끌었던 경험이 있습니다.
이렇게 DALL·E 3을 주도하고 현재 Sora 팀을 이끄는 대단한 인물이지만, 학부 졸업자에 불과합니다.
아디티야는 뉴욕 대학교에서 학부를 다녔으며, LeCun 연구실에서 몇 가지 프로젝트에 참여했습니다. 졸업 후 바로 OpenAI에 남았습니다.
이렇게 젊은이들이 주도하고 출처를 묻지 않고 결과만 보는 팀이 OpenAI를 2014년 다시 한번 세계를 놀라게 했습니다!