杨植麟
杨植麟,男,博士学位,毕业于清华大学和卡耐基·梅隆大学。他是北京月之暗面科技有限公司(Moonshot AI)的创始人,并主导开发了Moonshot大型模型以及基于该模型的Kimi智能助手。
2015年,杨植麟进入卡耐基·梅隆大学(CMU)语言技术研究所(LTI)攻读博士学位。2017年和2018年,杨植麟连续入选机器学习和NLP领域一流会议和期刊的第一作者全球排行榜。2020年2月,杨植麟参加“智源论坛 Live | 青年科学家线上报告会”。2023年4月17日,杨植麟作为创始人之一创办了AI科技公司北京月之暗面科技有限公司并持股78.97%。2024年2月20日,杨植麟创办的AI创业公司月之暗面完成了一轮超过10亿美元的融资。
杨植麟在学术和职业生涯中屡获殊荣。2018年,他成为英伟达学者。紧接着在2019年,他荣获了西贝尔学者(Siebel Scholars)的称号。在2020年11月,他入围了“2020福布斯中国30岁以下精英榜”。
人物经历
早年经历
杨植麟在清华大学计算机系知识工程实验室(KEG)师从唐杰教授。2015年,杨植麟进入卡耐基·梅隆大学(CMU)语言技术研究所(LTI),跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士学位。毕业后,杨植麟曾效力于谷歌大脑研究院和Meta(Facebook)人工智能研究院。
工作经历
2017年和2018年,杨植麟连续入选机器学习和NLP领域一流会议和期刊的第一作者全球排行榜。2019年,杨植麟获得卡耐基·梅隆大学计算机专业博士学位。2020年2月,杨植麟参加“智源论坛 Live | 青年科学家线上报告会”,做了题为《Latest Advances of Neural Language Models》的主题演讲。
2023年4月17日,杨植麟作为创始人之一创办了AI科技公司北京月之暗面科技有限公司并持股78.97%。11月29日,杨植麟表示,规模化是通向AGI的核心,而随着模型不断迭代,长文本会逐渐取代微调,成为定制模型的关键技术。但通过滑动窗口、降采样、小模型等技术捷径实现上下文窗口延长,都是“技术捷径”。2024年2月20日,杨植麟创办的AI创业公司月之暗面完成了一轮超过10亿美元的融资,投资方包括红杉中国、小红书、美团、阿里巴巴集团等,老股东也跟投。这标志着月之暗面自2023年获得超过2亿美元融资以来的重要里程碑。公司估值已达约25亿美元,成为国内大模型领域的领先企业之一。有媒体称,这也是自ChatGPT掀起全球浪潮以来,国内AI大模型公司获得的单轮最大金额融资。
学术研究成就
研究方向
参考资料
主要成就
杨植麟作为第一作者与卡耐基·梅隆大学、Google Brain 团队联合推出NLP 领域热门的国际前沿预训练 XLNet 模型,在 20 个标准任务上超过了曾经保持最优性能记录的 Google BERT 模型,并在18个标准任务上取得历史最好结果,入选NeurIPS 2019 Oral。作为共同第一作者提出 Transformer-XL 模型并在多项主流序列建模数据集上取得历史最好结果。Google 学术引用超 2400 次。
大模型领域的贡献
杨植麟和团队主导和参与了国内外的非常多经典大模型的开发,包括Google Bard,google Gemini、盘古和悟道一系列的大模型。同时,发明了历史上第一个全面超越了RNN的Transformer语言模型。此外,杨植麟和团队的很多作为第一作者和核心贡献者发明了的技术,被许多主流的产品多采用,比如,LLaMA使用了杨植麟和团队开发的的Positional encoding技术,Stable Diffusion网络架构里面的两个核心的架构,里面的Group Organization也是由杨植麟和团队开发的。
论文发表
参考资料
获得荣誉
相关活动
WAIC 2023是一个聚焦大模型和生成式人工智能的重要会议,吸引了全球顶尖学者和行业领军人物共同探讨人工智能的未来发展方向。在这个会议上,Moonshot AI创始人、清华大学助理教授杨植麟分享了他的创新理念和成果转化的经验。这些讨论展示了人工智能在不同领域中的巨大潜力,为现代化进程提供了战略助力。
参考资料
杨植麟.上海期智研究院.2024-02-19
国内大模型实现“长文本”突破.北京日报.2024-02-17
唯一的90后,循环智能联合创始人杨植麟入选“智源青年科学家”.中国日报中文网经济.2024-02-21
天眼查.天眼查.2024-02-19
2020福布斯 中国30岁以下精英榜.福布斯.2020-11-09
Sina Visitor System.新浪微博.2024-02-21
月之暗面获国内AI大模型公司单轮最大金额超10亿美元融资.中国证券网.2024-02-20
Past Graduate Fellows.Past Graduate Fellows.2024-02-19
SCS.获奖网站.2024-02-19
月之暗面杨植麟:大模型进入长文本时代,无损压缩才是有效的规模化 | WISE2023商业之王大会.腾讯网.2024-02-21
澎湃新闻.百家号.2024-02-19