Yu Zhang

Wiki Powered byIconIQ
Yu Zhang

IQ AI를 발표했습니다.

확인해보세요

Yu Zhang

**유 장(Yu Zhang)**은 기계 학습, 백엔드 시스템 및 인공 지능을 전문으로 하는 소프트웨어 엔지니어이자 연구원으로, 특히 음성 처리 기술에 중점을 두고 있습니다. 현재 메타의 초지능(Superintelligence) 팀에서 소프트웨어 엔지니어로 일하고 있으며, 이전에는 OpenAI와 DeepMind에서 연구 및 엔지니어링 직책을 역임했습니다.

교육

유 장(Yu Zhang)은 매사추세츠 공과대학교(MIT)에서 컴퓨터 과학 및 인공 지능 연구소(CSAIL)의 대학원생이었습니다. CSAIL 내에서 그는 음성 언어 시스템 그룹(Spoken Language Systems Group)의 일원으로 연구를 수행했으며, 제임스 글래스(James Glass) 박사의 지도를 받았습니다. 그의 학문적 연구는 기계 학습 모델을 음성 및 언어 처리의 과제에 적용하는 데 중점을 두었습니다. MIT 재학 중인 2009년 가을에는 통계 학습(Statistical Learning) 강의의 조교로도 활동했습니다. [1]

경력

장(Zhang)은 MIT CSAIL에서 학계 연구로 경력을 시작했으며, 그의 연구는 주로 음성 인식, 화자 인증 및 언어 식별을 위한 기계 학습 응용 프로그램에 중점을 두었습니다. 그는 다국어 음성 인식 기능, 특히 저자원 언어에 대한 발전을 목표로 하는 연구 계획인 IARPA Babel 프로그램에 적극적으로 참여했습니다. 이 기간 동안 그의 연구는 심층 신경망(DNN) 및 순환 신경망(RNN)과 같은 고급 심층 학습 아키텍처를 사용하여 음성 처리의 복잡한 문제를 해결하는 것을 탐구했습니다. 구체적으로, 그의 연구는 원거리 음성 인식을 위한 장단기 메모리(LSTM), 향상된 음향 모델링을 위한 심층 신경망 병목 특징 추출, 그리고 오디오 신호의 화자 및 환경 변동성을 정규화하기 위한 i-벡터 기반 접근 방식과 같은 기술을 조사했습니다. [1]

학계에서의 임기를 마친 후, 장(Zhang)은 여러 주요 인공 지능 기관에서 역할을 맡으면서 기술 산업으로 전환했습니다. 그는 DeepMind에서 수석 연구원으로, 그리고 나중에 OpenAI에서 기술 직원(MTS)으로 근무했습니다. 이러한 직책에서 그의 연구는 대규모 기계 학습 모델과 인프라를 지원하는 데 필수적인 백엔드 시스템의 개발 및 구현으로 전환되었습니다. 2025년 7월, 약 10년의 전문 경험을 바탕으로 장(Zhang)은 메타에 소프트웨어 엔지니어로 합류했습니다. 그는 AI 업계의 저명한 연구원과 엔지니어들로 구성된 그룹인 회사의 새롭게 구성된 초지능(Superintelligence) 팀의 일원이 되어 인공 지능의 기초 연구를 발전시키는 임무를 맡았습니다. [2]

주요 연구 및 출판물

장(Zhang)은 그의 경력 전반에 걸쳐 국제 음향, 음성 및 신호 처리 컨퍼런스(ICASSP) 및 Interspeech를 포함한 주요 기계 학습 및 신호 처리 컨퍼런스에서 발표된 수많은 연구 논문을 공동 집필했습니다. 그의 출판물은 음성 인식, 특징 추출 및 음향 모델 훈련에 대한 그의 연구를 반영합니다.

그의 출판물 중 일부는 다음과 같습니다.

  • "Highway Long Short-Term Memory RNNs for Distant Speech Recognition" (2015): 이 논문은 순환 신경망의 변형인 Highway LSTM 네트워크의 적용을 조사하여 오디오가 원거리에서 캡처될 때 음성 인식 시스템의 정확도를 향상시켰습니다.
  • "Prediction-adaptation-correction Recurrent Neural Networks for Low-resource Language Speech Recognition" (2015): 이 연구는 제한된 훈련 데이터를 가진 언어의 음성 인식 성능을 향상시키도록 설계된 특수 RNN 아키텍처를 소개했습니다.
  • "Language ID-based Training of Multilingual Stacked Bottleneck Features" (2014): 이 연구는 심층 신경망에서 스택된 병목 특징의 추출을 알리는 언어 식별을 사용하여 다국어 음향 모델을 훈련하는 방법을 탐구했습니다.
  • "Extracting deep neural network bottleneck features using low-rank matrix factorization" (2014): 이 출판물은 저차원 행렬 분해를 적용하여 심층 신경망에서 정보가 풍부한 압축된 병목 특징을 추출하는 효율적인 방법을 제안했습니다.
  • "Joint Learning of Phonetic Units and Word Pronunciations for ASR" (2013): 이 논문은 음성 인식(ASR) 시스템의 성능을 향상시키기 위해 음성 단위와 해당 단어 발음을 동시에 학습하는 방법에 중점을 두었습니다.
  • "A new i-vector approach and its application to irrelevant variability normalization based acoustic model training" (2011): 이 연구는 음향 모델 훈련에서 화자 특성 및 채널 노이즈와 같은 변동성을 정규화하기 위해 오디오 세그먼트의 저차원 표현인 i-벡터를 사용하는 새로운 접근 방식을 소개했습니다.
  • "An evidence framework for Bayesian learning of continuous-density hidden Markov models" (2009): 이 초기 연구는 음성 인식에 사용되는 기본적인 통계적 모델인 은닉 마르코프 모델(HMM)의 매개변수를 학습하기 위한 베이지안 프레임워크를 제시했습니다.

이 기간 동안 그의 출판물 전체 목록은 새로운 기계 학습 기술을 통해 음성 처리 발전에 대한 그의 공헌을 강조합니다. [1]

참고 문헌.

카테고리순위이벤트용어집