Kai Zou는 사용자가 협업하고, 딥 러닝 모델을 훈련하고, 대규모 네트워크에서 AI 애플리케이션을 개발할 수 있도록 컴퓨팅 리소스를 공유하기 위한 분산 플랫폼인 Netmind.AI의 CEO이자 설립자입니다. [1]
Zou는 칭화대학교에서 수학 및 물리학 학사 학위를 취득했으며 2010년에 연구 조교로 근무했습니다. 이후 조지타운 대학교에서 수학 및 통계학 석사 학위를 취득했으며 2013년에는 교육 조교로도 활동했습니다. [1][2]
조지타운 대학교 졸업 후 Zou는 2014년 3월까지 대학교 연구 부총장의 양적 연구 전문가로 근무했습니다. 그 후 연구 및 데이터 수집 회사인 Decision Information Resources (DIR)의 선임 프로그램 분석가 및 컨설턴트가 되어 2021년 11월까지 근무했습니다. 이 기간 동안 그는 자연어 처리 (NLP), 논리적 추론 및 AGI 연구에 중점을 둔 회사인 ProtagoLabs를 설립했습니다. 2021년 9월 Zou는 Netmind.AI를 설립했으며, 2023년에는 인공 지능 (AI), 머신 러닝 및 대규모 언어 모델 (LLM) 발전에 전념하는 역동적인 비영리 단체인 AGI Odyssey를 설립했습니다. [1][2][3][4]
2024년 5월 6일, CryptoKoryo는 Zou와 Netmind.AI 및 암호화폐 및 블록체인 분야에서의 계획에 대해 인터뷰했습니다. 인터뷰 시작 시 그는 AI 및 머신 러닝 분야에서의 배경을 공유했습니다. [5]
“제 자신과 대부분의 팀은 사실 Web 3가 아닌 AI Web Two 출신입니다. 저는 중국 칭화대학교에서 수학 및 물리학을 전공했고, 그 후 조지타운 대학교에서 수학 및 통계학 석사 학위를 받았습니다. 조지타운 졸업 후 2013년부터 데이터 과학자 및 머신 러닝 연구원으로 일해 왔습니다. 당시 분류 및 예측 문제를 해결하기 위해 랜덤 포레스트 및 신경망을 사용하여 더 많은 통계 및 회귀 모델을 구축하기 시작했습니다. 그것이 실제로 저의 첫 번째 연구였고, 당시 제가 사용했던 신경망은 딥 신경망이 아닌 3개의 레이어만 가지고 있었습니다.”
“하지만 네, 2016년부터 딥 러닝 및 딥 신경망에 대해 더 많이 배우기 시작했습니다. 이미지 감지를 위한 CNN의 결과에 매료되었는데, 정확도가 99%를 넘어 인상적이었습니다. 그리고 NLP 문제에 대한 개선 가능성이 매우 크다는 것을 깨달았습니다. 그래서 2016년에 AI 회사인 Proto Labs를 시작했습니다. 당시에는 DeepMind 및 OpenAI에서 영감을 받은 AI 연구 스튜디오와 같았습니다. AGI에 대한 열정 때문에 AI 연구 그룹을 만들었습니다. 우리는 실제로 매년 최고의 컨퍼런스에서 많은 출판물을 발표하고 있으며, 사내 연구 작업을 통해 미국 회사에 맞춤형 AI 모델을 제공하는 AI 컨설팅 서비스를 시작했습니다.”
그는 팀이 Netmind를 만든 방법에 대해 설명했습니다. [5]
“2021년부터 우리는 제품 중심 회사로 전환하기로 결정했습니다. N Power 플랫폼은 간단한 아이디어에서 비롯되었습니다. 왜냐하면 우리는 언어 모델을 훈련하고 있었기 때문입니다. 그때 저는 GPU가 너무 비싸다는 것을 깨달았습니다. 왜 게임 설정으로 데스크톱에서 AI 모델을 실행할 수 있는데 우리 자신의 카드를 사용하지 않을까요? 그래서 우리는 더 많은 저급 또는 낮은 GPU RAM 카드를 결합하여 대규모 AI 모델을 훈련하는 것은 어떨까라는 아이디어를 떠올렸습니다. 그래서 우리는 작은 카드를 네트워크에서 결합하기 위해 비동기 훈련 구조에 대한 연구를 시작했습니다. 그런 다음 더 많은 사람들이 유휴 기계를 기여하도록 장려하고 함께 잠재적으로 큰 분산 컴퓨터 네트워크를 가질 수 있도록 이 N Power 제품을 설계하기 시작했습니다. 그래서 네, 2021년에 런던으로 이주하여 Netmind를 설립했습니다.”
블록체인과 AI의 교차점에 대한 생각을 묻는 질문에 Zou는 다음과 같이 답했습니다. [5]
“좋은 질문입니다. 한 가지는 분산 컴퓨팅 성능이고, 또 다른 한 가지는 AI의 완전한 분산화라고 생각합니다. 대기업의 경우 언어 모델은 모든 사람에게 블랙 박스와 같습니다. 연구원, 모든 사람 또는 API에 의존하는 스타트업의 경우 제어할 수 없습니다. 업데이트 후 성능이 나빠질 수 있으며 무슨 일이 일어났는지 알 수 없습니다. 따라서 모든 사람이 액세스할 수 있고, 모든 사람이 작동 방식을 알고, 심지어 모든 사람이 다음 버전에 대한 투표를 할 수 있는 더 투명하고 분산된 모델이 필요합니다. 그것이 Web 3와 AI의 미래가 될 수 있는 또 다른 것이라고 생각합니다. 또한 미래에 AI 에이전트 사회가 있고 AGI가 존재하면 에이전트, 인간 및 AI 간의 거래를 용이하게 하기 위해 암호화폐가 필요하다고 생각합니다.”
그는 또한 Netmind Token (NMT) 토큰 경제 개편에 대해 설명했습니다. [5]
“사람들은 제가 Web 3 출신이 아니라는 것을 알 수 있습니다. 처음에는 토큰 NMT를 100년 동안 설계했는데, 이는 우리 프로젝트가 100년 이상 지속될 것이라고 진정으로 믿기 때문입니다. 이를 설계함으로써 장기적으로 모든 것을 분산화하고 전체 플랫폼을 오픈 소스로 만들고 모든 사람이 액세스할 수 있도록 하고 개발자가 함께 플랫폼을 구축할 수 있도록 전체 생태계 커뮤니티를 구축하는 것을 목표로 합니다. 그러나 2~3개월 전에 출시한 후 갑자기 Web 3 회사가 되어 모든 Web 3 용어와 합의 메커니즘을 배우기 시작했습니다. FV에 대해 처음 들었고 100년 동안 지속되는 것이 말이 안 된다는 것을 깨달았습니다. 물론 채굴자에게 더 지속 가능하게 만들고 싶지만 커뮤니티 기금, 팀 또는 스테이킹의 경우 100년이 필요하지 않을 것입니다. 그래서 새로운 경제 모델을 100년에서 10년으로 단축하도록 조정했습니다. 10년 후에도 채굴자는 모든 지불 또는 커뮤니티 기금에서 토큰을 채굴할 수 있으므로 여전히 지속 가능할 것이며 다른 비율은 100년이 될 필요가 없습니다.”
인터뷰가 끝날 무렵 Zou는 Web3 AI 및 학계에 대한 생각을 공유했습니다. [5]
“모델 훈련 부분이나 대규모 언어 모델 부분의 경우 더 많은 팀이나 교수가 분산된 대규모 언어 모델을 구축하기를 원한다고 생각합니다. 실제로 팀이 나와서 모든 사람이 소유하고 모든 사람이 액세스할 수 있는 이 언어 모델을 구축하고 싶다고 말하고 있으며, 모든 사람이 데이터를 기여할 수 있습니다. 그리고 우리는 실제로 같은 일을 하고 있습니다. 비동기 훈련 구조는 대규모 언어 모델을 구축하는 데 사용하는 기본 알고리즘입니다. 이에 대한 저의 아이디어는 자체 학습 기능이 있는 자동 성장 모델을 만드는 것입니다. 따라서 GPU가 50개 있으면 모델이 50개의 GPU에서 실행됩니다. 더 많은 GPU를 확보하면 일부 작업을 새 GPU에 분산하고 모델을 훈련합니다. 그 후 함께 병합할 수 있으며 컴퓨팅 네트워크가 성장함에 따라 모델이 성장합니다. 이것은 우리의 연구 프로젝트 중 하나이며 N Power 구조에 완벽하게 적합하다고 생각합니다. 장기적으로 GPT-4만큼 좋은 정말 큰 언어 모델로 성장하고 모든 사람이 액세스할 수 있기를 바랍니다.”