Kai Zou
**카이 조우(Kai Zou)**는 사용자가 대규모 네트워크에서 협업하고, 딥러닝 모델을 훈련하고, AI 애플리케이션을 개발할 수 있도록 컴퓨팅 리소스 공유를 위한 분산 플랫폼인 Netmind.AI의 CEO이자 설립자입니다. [1]
교육
조우는 칭화대학교(Tsinghua University)에서 수학 및 물리학 학사 학위를 받았으며, 2010년에는 연구 조교로 활동했습니다. 이후 조지타운 대학교(Georgetown University)에서 수학 및 통계학 석사 학위를 받았고, 2013년에는 조교로 활동했습니다. [1][2]
경력
조지타운 대학교 졸업 후, 조우는 2014년 3월까지 대학 연구 부총장실에서 정량적 연구 전문가로 근무했습니다. 그 후 연구 및 데이터 수집 회사인 Decision Information Resources (DIR)에서 선임 프로그램 분석가 겸 컨설턴트로 2021년 11월까지 근무했습니다. 이 기간 동안 그는 자연어 처리(NLP), 논리적 추론 및 AGI 연구에 중점을 둔 ProtagoLabs를 설립했습니다. 2021년 9월에는 Netmind.AI를 설립했고, 2023년에는 인공지능(AI), 머신러닝 및 대규모 언어 모델(LLM) 발전에 전념하는 역동적인 비영리 단체인 AGI Odyssey를 설립했습니다. [1][2][3][4]
인터뷰
배경 및 Netmind
2024년 5월 6일, CryptoKoryo는 Netmind.AI와 암호화폐 및 블록체인 분야의 계획에 대해 조우와 인터뷰를 진행했습니다. 인터뷰 시작 시, 그는 AI 및 머신러닝 분야의 배경을 공유했습니다. [5]
“저와 제 팀 대부분은 사실 Web 3보다는 AI Web 2.0 출신입니다. 중국 칭화대학교(Tsinghua University)에서 수학과 물리학을 전공했고, 그 후 조지타운 대학교(Georgetown University)에서 수학 및 통계학 석사 학위를 받았습니다. 조지타운 대학교 졸업 후 2013년부터 데이터 과학자이자 머신러닝 연구원으로 일했습니다. 당시 분류 및 예측 문제를 해결하기 위해 랜덤 포레스트와 신경망을 사용하여 더 많은 통계 및 회귀 모델을 구축하기 시작했습니다. 그게 제 첫 연구였고, 당시 제가 사용한 신경망은 딥러닝 신경망이 아니라 3계층밖에 없었습니다.”
“하지만 2016년부터 딥러닝과 심층 신경망에 대해 더 많이 배우기 시작했습니다. 이미지 탐지에 대한 CNN의 결과에 매료되었습니다. 정확도가 99%가 넘었는데, 인상적이었습니다. 그리고 NLP 문제에 대한 개선 가능성이 매우 많다는 것을 깨달았습니다. 그래서 2016년에 제 AI 회사인 Proto Labs를 설립했습니다. 당시에는 DeepMind와 OpenAI에서 영감을 받은 AI 연구 스튜디오에 가까웠습니다. AGI에 대한 열정 때문에 AI 연구 그룹을 만들었습니다. 매년 최고 학회에 많은 논문을 발표했고, 사내 연구를 통해 미국 기업에 맞춤형 AI 모델을 제공하는 AI 컨설팅 서비스를 시작했습니다.”
그런 다음 그는 팀이 Netmind를 어떻게 만들었는지 설명했습니다. [5]
“2021년부터 제품 중심 회사가 되기로 결정했습니다. N Power Platform은 언어 모델을 훈련하는 과정에서 간단한 아이디어를 떠올렸습니다. 그때 GPU가 너무 비싸다는 것을 깨달았습니다. 게임용 설정으로 데스크톱에서 AI 모델을 실행할 수 있는 것처럼, 제 카드를 왜 사용하지 않을까요? 그래서 이런 생각을 했습니다. 대규모 AI 모델을 훈련하기 위해 저사양 또는 저용량 GPU 카드를 여러 개 결합하면 어떨까요? 그래서 비동기 훈련 구조에 대한 연구를 시작하여 네트워크에서 소형 카드를 결합하려고 노력했습니다. 그런 다음 더 많은 사람들이 유휴 기기를 기여하도록 장려하는 N Power 제품을 설계하기 시작했고, 함께 잠재적으로 대규모 분산 컴퓨터 네트워크를 구축할 수 있었습니다. 그래서 2021년에 런던으로 이주하여 Netmind를 설립했습니다.”
블록체인과 AI의 교차점에 대한 생각을 묻자 조우는 다음과 같이 답했습니다. [5]
“좋은 질문입니다. 하나는 분산된 컴퓨팅 성능이고, 다른 하나는 AI의 완전한 분산화라고 생각합니다. 대기업의 경우 언어 모델은 모든 사람에게 블랙박스와 같습니다. 연구원이나 모든 사람 또는 API에 의존하는 신생 기업은 통제할 수 없습니다. 업데이트 후 성능이 저하될 수 있고, 무슨 일이 일어났는지 알 수 없습니다. 따라서 모든 사람이 액세스할 수 있고, 모든 사람이 작동 방식을 알고, 심지어 모든 사람이 다음 버전에 대해 투표할 수 있는 더 투명하고 분산된 모델이 필요합니다. 그것이 Web 3과 AI의 미래가 될 수 있는 또 다른 요소라고 생각합니다. 또한 미래에 AI 에이전트 사회가 생기고 AGI가 등장하면 에이전트, 인간, AI 간의 거래를 위한 암호화폐가 경제를 촉진하는 데 필요하다고 생각합니다.”
그는 또한 Netmind 토큰(NMT) 토큰 경제 개편에 대해 설명했습니다. [5]
“제가 Web 3 출신이 아니라는 것을 알 수 있습니다. 처음에 NMT 토큰을 100년 동안 설계했는데, 그 이유는 저희 프로젝트가 100년 이상 지속될 것이라고 진정으로 믿기 때문입니다. 이를 통해 장기적으로 모든 것을 분산화하고, 전체 플랫폼을 오픈 소스로 만들어 모든 사람이 액세스할 수 있도록 하고, 개발자가 함께 플랫폼을 구축할 수 있는 전체 생태계 커뮤니티를 구축하는 것을 목표로 합니다. 하지만 2~3개월 전에 출시한 후 갑자기 Web 3 회사가 되었고 모든 Web 3 용어와 합의 메커니즘을 배우기 시작했습니다. 사실 FV에 대해 처음 들었고, 100년 동안 지속되는 것이 말이 안 된다는 것을 깨달았습니다. 물론 채굴자를 위해 더 지속 가능하게 만들고 싶지만, 커뮤니티 기금, 팀 또는 스테이킹의 경우 100년일 필요는 없습니다. 그래서 새로운 경제 모델을 조정하여 모든 것을 100년에서 10년으로 축소했습니다. 10년 후에도 채굴자는 모든 지불금이나 커뮤니티 기금에서 토큰을 채굴할 수 있으므로 지속 가능하며, 다른 비율은 100년일 필요가 없습니다.”
인터뷰 마지막에서 조우는 Web3 AI와 학계에 대한 생각을 공유했습니다. [5]
“모델 훈련 부분이나 대규모 언어 모델 부분의 경우 분산된 대규모 언어 모델을 구축하려는 팀이나 교수가 더 많다고 생각합니다. 실제로 팀들이 나와서 모든 사람이 소유하고 모든 사람이 액세스할 수 있으며 모든 사람이 데이터를 기여할 수 있는 언어 모델을 구축하고 싶다고 말하는 것을 보고 있습니다. 저희도 같은 일을 하고 있습니다. 비동기 훈련 구조는 대규모 언어 모델을 구축하는 데 사용하는 기본 알고리즘입니다. 이에 대한 저의 아이디어는 자가 학습 기능을 갖춘 자동 성장 모델을 만드는 것입니다. 따라서 GPU가 50개 있으면 모델은 50개의 GPU에서 실행됩니다. GPU가 더 많아지면 새로운 GPU에 일부 작업을 분산하고 모델을 훈련합니다. 그런 다음 병합할 수 있으며, 컴퓨팅 네트워크가 성장함에 따라 모델도 성장합니다. 이것은 저희 연구 프로젝트 중 하나이며, N Power 구조에 완벽하게 적합하다고 생각합니다. 장기적으로 GPT-4만큼 좋은 대규모 언어 모델로 성장하여 모든 사람이 액세스할 수 있기를 바랍니다.”