Zengyi Qin은 AI 네이티브 애플리케이션을 구현하기 위해 블록체인 기술을 활용하는 분산 플랫폼인 MyShell의 공동 창립자이자 AI 연구 책임자입니다. 그는 또한 칭화대학교 컴퓨터 과학 박사 과정에 있으며, 멀티모달 머신 러닝 및 생성적 인공 지능을 연구하고 있습니다. [1] [4] [6]
Zengyi Qin은 2018년 베이항대학교에서 자동화 과학 및 전기 공학 학사 학위를 취득했습니다. 이후 칭화대학교 컴퓨터 과학 기술 학과에 입학하여 Yuxin Peng 교수의 지도하에 박사 과정을 밟았습니다. 박사 과정 동안 매사추세츠 공과대학교(MIT)에서 Antonio Torralba 교수와 Phillip Isola 교수와 함께 컴퓨터 비전 및 표현 학습을 연구하는 방문 학생으로 활동했습니다. 또한 Microsoft Asia의 Visual Computing Group에서 연구 인턴으로 근무하며 Baining Guo 박사 지도하에 대규모 비전-언어 모델에 기여했습니다. [1] [4]
Zengyi Qin의 경력은 Horizon Robotics에서의 인턴십 동안 임베디드 시스템 및 실시간 인식에 중점을 두면서 시작되었습니다. 이 초기 경험은 분산 시스템 및 블록체인 기술에 대한 그의 후속 연구의 토대를 마련했습니다.
그 후 Microsoft Asia의 Visual Computing Group에 연구 인턴으로 합류하여 비전-언어 사전 훈련 기술을 연구했습니다. 이 역할에서의 그의 기여는 텍스트, 이미지 및 기타 데이터 유형을 통합하는 멀티모달 AI 시스템 개발을 발전시켰습니다. 이 연구는 AI 개발의 투명성과 커뮤니티 중심 혁신을 보장하기 위한 수단으로 블록체인을 포함한 분산 기술에 대한 그의 후속 탐구의 기반이 되었습니다.
2023년, Qin은 AI와 블록체인 기술을 결합하여 크리에이터가 AI 네이티브 애플리케이션을 구축할 수 있도록 지원하는 분산 플랫폼인 MyShell을 공동 창립했습니다. MyShell에서 그는 사용자를 지원하고 분산 거버넌스를 촉진하도록 설계된 오픈 소스 기반 모델 및 도구 개발을 감독합니다. MyShell에서의 그의 작업은 접근 가능하고 투명한 AI 생태계를 만들고자 하는 그의 헌신을 반영합니다.
Qin의 학술 연구는 멀티모달 데이터를 응집력 있는 AI 프레임워크로 통합하는 데 중점을 둡니다. CVPR, NeurIPS 및 ICCV와 같은 컨퍼런스에서 발표된 그의 논문은 교차 모달 검색, 생성 모델 효율성 및 인간 중심 AI 훈련과 같은 주제를 다룹니다. 그는 비전 및 언어 모델을 통합하여 AI 애플리케이션 프로토타입을 제작하는 LLaVA(Large Language-and-Vision Assistant) 및 MiniGPT-4와 같은 오픈 소스 프로젝트에 기여했습니다.
Zengyi Qin은 오픈 소스 AI 및 분산 플랫폼을 옹호하며 AI 개발에서 투명성과 커뮤니티 참여의 중요성을 강조합니다. 그는 AI 기술 배포에서 윤리적 고려 사항과 사용자 권한 부여를 우선시하는 이니셔티브에 대한 지지를 표명했습니다.
Google Scholar에 따르면 Qin의 연구는 1,000회 이상 인용되었습니다. 그는 여러 AI 컨퍼런스 및 저널의 심사위원으로 활동하며 멀티모달 시스템 연구 발전에 기여하고 있습니다. GitHub의 오픈 소스 프로젝트는 전 세계 개발자들이 활용하고 있습니다. [1] [2] [3] [4] [5] [6]
2024년 9월 YouTube 채널 Naveen K와의 인터뷰에서 Zengyi Qin은 오픈 소스 AI, 분산 시스템 및 사회에서 인공 지능의 진화하는 역할에 대한 자신의 관점을 자세히 설명했습니다. Future of AI 시리즈의 일부로 Qin은 오픈 소스 모델을 협업적 발전의 중요한 동인으로 규정하여 연구원과 개발자가 기초 작업을 재창조하는 대신 공유된 발전을 기반으로 구축할 수 있도록 했습니다. 그는 이미지 생성을 위한 Stable Diffusion 및 오디오 합성을 위한 MyShell의 Open Voice와 같은 프로젝트를 오픈 소스 기술이 상업적 실행 가능성을 달성한 예로 인용하면서 고급 도구에 대한 접근성을 민주화하는 데 있어 그들의 역할을 강조했습니다.
Qin은 또한 인공 일반 지능(AGI)의 개념을 다루면서 복잡하고 반복적인 작업을 자동화하고 산업 전반에 걸쳐 생산성을 향상시키기 위한 장기적인 열망으로 설명했습니다. 그러나 그는 대부분의 AI 시스템이 여전히 전문화되어 있으며 유용성을 극대화하려면 특정 도메인 전문 지식과 통합해야 한다고 언급하면서 현재의 한계를 인정했습니다. AI 개발 과제를 논의하면서 그는 계산 규모나 아키텍처 복잡성보다 고품질 데이터의 중요성을 강조하면서 편향과 비효율성을 완화하기 위해 세심한 데이터 큐레이션을 옹호했습니다.
새로운 연구자들을 위한 조언으로 Qin은 기초 모델 개발에서 대기업과 직접 경쟁하기보다는 교육 또는 환경 과학 분야의 AI와 같은 학제 간 응용 분야에 집중할 것을 권장했습니다. 그는 특정 분야 내의 틈새 혁신이 자원 불균형을 피하면서 혁신적인 영향을 미칠 수 있다고 주장했습니다.
대화 전반에 걸쳐 Qin은 분산 프레임워크, 특히 AI 생태계에서 투명성과 커뮤니티 거버넌스를 보장하기 위한 MyShell의 블록체인 기술 통합에 대한 지지를 되풀이했습니다. 그는 이러한 플랫폼을 중앙 집중식 통제에 대한 균형추로 자리매김하여 개방형 협업과 사용자 주체성을 우선시함으로써 윤리적 혁신을 촉진했습니다.
인터뷰는 Qin의 오픈 소스 원칙과의 일치를 강화하여 이를 기술적 전략뿐만 아니라 AI의 사회적 이점을 민주화하는 메커니즘으로 규정했습니다. 그의 발언은 학문적 엄격함과 접근 가능하고 공정한 기술 발전에 대한 헌신 사이의 균형을 맞추는 실용적인 낙관론을 강조했습니다. [7]