Haotian Tang

Wiki Powered byIconIQ
Haotian Tang

我们刚刚发布了 IQ AI.

查看详情

Haotian Tang

唐昊天是一位专攻系统和机器学习(SysML)的计算机科学家。他的工作重点是高效深度学习,特别是针对3D感知和大规模基础模型。他的职业生涯包括在麻省理工学院(MIT)的学术研究以及在包括Waymo、英伟达、谷歌DeepMind和在内的公司的行业职位。[1] [2]

教育

唐昊天就读于上海交通大学(SJTU),并于2020年毕业,获得计算机科学与技术工程学士学位。从上海交通大学毕业后,唐昊天进入麻省理工学院(MIT)深造。他于2022年获得电气工程与计算机科学硕士学位,目前是同一部门的博士候选人,预计将于2025年毕业。在麻省理工学院,他是韩松教授领导的韩实验室的成员。[1] [3]

职业生涯

唐昊天的职业生涯始于2017年在声网(Agora.io)担任软件工程实习生。2019年,在上海交通大学学习期间,他在腾讯进行了研究实习,从事计算机视觉和机器学习方面的工作,并在该大学的计算机科学系担任研究助理。2019年至2020年,他在麻省理工学院韩松教授的指导下,远程担任研究实习生,专注于高效的3D深度学习。[1]

2020年,唐昊天开始在麻省理工学院攻读博士学位,他的研究中心是系统和机器学习。在此期间,他的工作促成了多篇关于3D神经网络、稀疏数据的硬件效率以及用于自主系统的多传感器融合等主题的出版物。在进行学术研究的同时,唐昊天还完成了多个行业实习。2022年,他在OmniML实习,该公司后来被英伟达收购。2023年,他在Waymo担任研究实习生,从事多模态行为预测方面的工作。随后,他在2024年在英伟达实习,他的工作重点是开发高效的视觉生成模型。[1]

2025年初,唐昊天加入谷歌DeepMind,担任研究科学家,为世界模拟项目的大规模预训练做出贡献。同年晚些时候,他加入Meta,担任团队的研究科学家,从事多模态基础模型方面的工作。[1]

研究与出版物

唐昊天的研究解决了深度学习系统中的效率和性能挑战。他的工作涵盖了大型语言模型(LLM)的算法和系统协同设计、用于自动驾驶的3D点云处理以及多传感器融合。[1]

高效的大型语言模型

唐昊天的大部分研究致力于使大型语言模型在推理和微调方面更加高效。

  • AWQ(Activation-aware Weight Quantization,激活感知权重量化):唐昊天是AWQ项目的系统联合负责人,该项目为LLM引入了一种硬件友好的低比特仅权重量化方法。该方法基于以下观察:保护一小部分显著权重可以显著减少量化误差,而无需反向传播或数据重建。这项工作获得了MLSys 2024的最佳论文奖。[1]
  • QServe:作为系统设计负责人,唐昊天为QServe做出了贡献,QServe是一种专为高效的基于云的LLM服务而设计的推理引擎。QServe利用W4A8KV4量化方案(4位权重、8位激活、4位KV缓存)来加速推理。该系统结合了计算感知权重重排序和融合注意力等技术,以减少反量化开销和内存带宽,据报道,这使得成本较低的GPU能够与更高端硬件的吞吐量相匹配。[1]
  • LongLoRA:该项目提出了一种高效的方法,用于微调LLM以处理长上下文大小。该方法在微调期间使用移位的稀疏注意力机制来降低计算成本,该成本通常随上下文长度呈二次方增长。该方法允许模型扩展到更长的上下文窗口,而计算资源有限。[1]

3D深度学习和点云

唐昊天还广泛致力于优化用于稀疏和不规则3D点云数据的深度学习模型,这对于自动驾驶和增强现实等应用至关重要。

  • TorchSparse和TorchSparse++:唐昊天是TorchSparse及其继任者TorchSparse++的主要作者。这些是高性能GPU库,旨在加速点云处理中常见的稀疏卷积运算。这些框架引入了一个内核生成器和一个自动调谐器,以优化训练和推理的数据流,与MinkowskiEngine和SpConv等现有库相比,实现了显著的加速。[1]
  • BEVFusion:这项工作引入了一个用于多任务、多传感器融合的框架,该框架将来自不同传感器(如摄像头和激光雷达)的特征统一到共享的鸟瞰图(BEV)表示中。通过在这种统一空间中保留几何和语义信息,BEVFusion提高了3D对象检测和地图分割任务的性能,同时降低了计算成本。[1]
  • SPVNAS和PVCNN:在他早期的工作中,唐昊天合著了关于新型3D神经网络原语的论文。Point-Voxel CNN(PVCNN)结合了基于点的表示的内存效率和基于体素的卷积的计算局部性。在此基础上,开发了稀疏点-体素卷积(SPVConv)和3D神经架构搜索(SPVNAS),以自动发现用于3D场景理解的高效且准确的网络架构,从而在SemanticKITTI等基准测试中实现了高性能。[1]

参考文献

首页分类排名事件词汇表