Jiahui Yu는 AI 연구원이자 Meta의 Superintelligence Labs의 구성원이며, 이 팀은 기초 모델 개발과 인공 초지능 발전에 주력하고 있습니다. 이전에는 OpenAI에서 연구 책임자로 근무했습니다. [1]
Yu는 중국 과학 기술 대학에서 컴퓨터 과학 학사 학위를 받았습니다. 이후 일리노이 대학교 어바나-샴페인에서 박사 학위를 취득했습니다. [1]
Yu는 2015년 5월부터 2015년 12월까지 Microsoft Research Asia에서 인턴으로 연구 경력을 시작하여 대규모 딥러닝 훈련 시스템을 연구했습니다. 2016년 초에는 Megvii (Face++)에 연구 인턴으로 합류하여 객체 감지에 집중하고 UnitBox 개발에 기여했습니다. 그런 다음 2017년 5월부터 12월까지 Adobe Research에서 생성적 적대 신경망 및 이미지 인페인팅 (DeepFill v1 및 v2 포함)을 연구하며 인턴으로 근무했습니다. 2016년 6월부터 2018년 5월까지는 Jump Trading LLC에서 연구 컨설턴트로 근무하며 고주파 금융 데이터를 활용하여 가격 예측 모델 및 거래 전략을 개발했습니다.
2018년 Yu는 1월부터 8월까지 Snap Research에서 연구 궤적을 이어가며 Slimmable Networks를 포함한 효율적인 딥러닝 모델을 개발했습니다. 이후 2018년 8월부터 12월까지 Baidu Research에서 인턴으로 근무하며 AutoML 및 AutoDL 2.0 및 EasyDL과 같은 효율적인 신경망 프로젝트에 기여했습니다. 2019년 초에는 1월부터 5월까지 Nvidia Research에서 인턴으로 근무하며 시각적 콘텐츠 생성을 위한 대규모 생성 모델에 집중했습니다. 이후 2019년 5월부터 9월까지 Google Brain에서 연구 인턴으로 근무하며 AutoML 및 BigNAS를 포함한 신경망 효율성을 연구했습니다.
Yu는 2020년 2월 Google에 연구 과학자로 합류하여 Alphabet 제품 전반에 사용되는 스트리밍 자동 음성 인식 및 차세대 멀티모달 임베딩 개발에 기여했습니다. 이후 2021년 5월부터 2022년 10월까지 수석 연구 과학자로 승진하여 멀티모달 이해 및 생성에 집중했습니다. 2022년 11월부터 2023년 9월까지는 Google DeepMind에서 스태프 연구 과학자로 근무하며 Gemini Multimodal 프로젝트를 공동으로 이끌고 PaLM-2 아키텍처 개발에 기여했습니다.
2023년 10월 Yu는 OpenAI에 Perception 팀의 연구 책임자로 합류하여 현재 인식 기반 AI 연구와 관련된 분야에서 노력을 이끌고 있습니다. 2025년 7월, 그는 Meta의 기초 모델 개발, AI 연구 발전, 인공 초지능 구축에 주력하는 통합 부서인 Meta Superintelligence Team에 합류했습니다. [2] [6]
Superintelligence Labs (MSL)는 Meta 내의 부서로, 2024년 6월에 회사의 인공 지능 이니셔티브, 특히 인공 일반 지능 (AGI) 추구를 통합하고 가속화하기 위해 출범했습니다. Alexandr Wang과 Nat Friedman이 이끄는 MSL은 기초 모델, 응용 AI 제품 및 FAIR의 핵심 연구를 수행하는 팀을 통합합니다. 이 부서는 OpenAI, Anthropic 및 DeepMind에서 연구원을 고용하는 대규모 인재 확보 캠페인과 함께 구성되었으며 Meta의 Scale AI에 대한 143억 달러 투자를 따릅니다. MSL은 Meta의 Llama 모델 시리즈 및 차세대 AI 시스템 개발을 감독하며 장기적인 발전과 Meta의 소비자 플랫폼 전반에 걸친 통합에 중점을 둡니다. [2] [3]
과거 "Meet a Google Researcher" 에피소드에서 호스트 Drew Calcagno는 Google의 텍스트-이미지 모델인 Parti에 대해 연구 과학자 Yonghui Wu 및 Yu와 인터뷰했습니다. 그들은 자기 회귀 모델인 Parti가 이미지 생성 프로세스를 기계 번역처럼 취급하여 텍스트 프롬프트에서 고품질 이미지를 생성하는 방법에 대해 논의했습니다. 연구원들은 모델이 상세한 설명을 기반으로 복잡한 시각 자료를 생성하는 능력과 확산 접근 방식을 사용하는 Google의 다른 모델인 Imagen과의 차이점을 강조했습니다. 그들은 디버깅 세션 중 획기적인 순간과 모델을 확장하면서 상당한 개선을 목격한 흥분을 포함하여 Parti 개발 경험을 공유했습니다. 두 연구원 모두 비디오 및 음악과 같은 다양한 양식의 통합을 포함하여 미래 발전에 대한 기대를 표명하면서 이러한 기술을 접근 가능하게 만드는 데 있어 책임감 있는 AI 관행의 중요성을 강조했습니다. [4]