login
算法工程师段楠履历调查
2025/06/12·StepFun can make mistakes, check important info.
算法工程师 段楠 履历调查

为了更好地完成"算法工程师段楠履历调查"任务,我需要了解以下几点信息:

  1. 您需要调查的段楠是否有特定的公司背景或行业领域?(例如:是否是某特定公司/机构的算法工程师,或专注于AI、计算机视觉、自然语言处理等特定方向)

  2. 您希望履历调查包含哪些方面的信息?(可选:教育背景、工作经历、技术专长、项目成果、学术发表、专利等)

  3. 此次调查的目的是什么?(例如:人才招聘评估、行业竞争分析、学术合作等)

随便

好的,我将为您调查算法工程师段楠的履历信息。

我会尽量收集关于段楠的以下信息:

  • 教育背景
  • 工作经历
  • 技术专长领域
  • 主要项目经验
  • 可能的学术成果或专利
  • 其他相关专业成就

请稍等,我将为您整理一份关于算法工程师段楠的履历调查报告。

Deep Research

问题拆解

  1. 由于缺乏特定指向(如公司、行业领域),首要任务是广泛搜集名为“段楠”且职业身份为“算法工程师”的个体信息,并尝试区分和识别。
  2. 履历调查需覆盖的关键信息维度包括:教育背景、工作经历(公司、职位、时间)、技术专长(如机器学习、深度学习、计算机视觉、自然语言处理等)、主要项目成果、以及可能的学术发表或专利。

行动计划

  1. 初步信息检索与筛选:通过网络搜索引擎,使用“段楠 算法工程师”、“段楠 AI”、“段楠 机器学习”等关键词组合进行广泛搜索,初步识别和筛选出与“算法工程师段楠”相关的公开信息。

    • 信息源:主流搜索引擎(如Google、百度等)。
  2. 教育背景与学术成果探查:针对初步筛选出的潜在目标,深入查找其教育经历(毕业院校、专业、学历等)以及可能存在的学术论文、研究成果或学术活动参与情况。

    • 信息源:学术搜索引擎(如Google Scholar、CNKI、Semantic Scholar)、专业社交平台(如LinkedIn)、相关大学或研究机构官方网站。
  3. 职业履历与工作经验挖掘:收集目标人物的职业发展路径,包括曾任职或现任职的公司、担任的具体职位、工作时间段以及主要工作职责和成就。

    • 信息源:专业社交平台(如LinkedIn)、企业官方网站(如团队介绍、新闻公告)、行业招聘网站(历史招聘信息)、财经或科技新闻报道。
  4. 技术专长与项目案例分析:分析目标人物在算法领域的技术栈、擅长的具体方向(如计算机视觉、自然语言处理、推荐系统等),并搜集其主导或参与的重要项目案例及其成果。

    • 信息源:技术社区(如GitHub、CSDN、知乎专栏)、个人技术博客、行业会议演讲资料、专利数据库(如国家知识产权局网站、Google Patents)。
  5. 综合信息整合与交叉验证:汇总来自不同渠道的信息,进行比对分析,剔除矛盾或不确切的内容,力求信息的准确性和完整性,构建相对清晰的人物画像。

  6. 报告框架构建与内容填充准备:基于已核实的信息,搭建履历报告的逻辑框架,并准备将收集到的文字、数据等素材填充到相应模块,为后续图文并茂的报告生成做准备。

首先,让我通过网络搜索获取关于算法工程师段楠的基本信息。

搜索

Search

段楠 算法工程师 履历 背景
Moka 招聘管理系统
Moka 招聘管理系统
段楠 博士带领研究团队构建以语言和视频为中心的多模态基础模型。研究方向自然语言处理和多模态基础模型。多次担任NLP/AI学术会议程序主席和高级领域主席,发表学术论文100余篇,Google Scholar引用20000余次,H-index 70+,持有专利20余项。他获得NeurIPS Best Paper Runner-Up Award(2024),CVPR Best Demo Award(2022)。张祥雨 博士 阶跃星辰首席科学家,西安交通大学兼职教授。研究方向包括多模态大模型、深度...
凤凰网
凤凰网
嘉宾|段楠,阶跃星辰 Tech Fellow 责编丨张红月 这场由 AI 驱动的视觉内容革新浪潮中,阶跃星辰的 Tech Fellow、前微软亚洲研究院资深研究员段楠,正站在探索的前沿。其团队在今年 2 月和 3 月开源两个重要的视频生成模型—30B 参数的文生视频模型 Step-Video-T2V,以及基于此训练的 30B 参数图生视频模型 Step-Video-TI2V,在 AI 视频生成领域引起了广泛关注。段楠清醒地指出,尽管当前的视频生成技术(如...
中国计算机学会
中国计算机学会
主题报告五视频:预训练模型最新进展及其在跨任务、跨语言和跨模态场景下的应用 主题简介:近年来,预训练模型(例如ELMo、GPT、BERT和XLNet等)的快速发展大幅提升了诸多NLP任务的整体水平,同时也使得很多应用场景进入到实际落地阶段。本次报告将从三方面介绍预训练研究的最新进展:(1)跨任务,介绍预训练模型如何从单语数据中学习自然语言的通用表示,并将其用于不同任务中;(2)跨语言,介绍预训练模型如何从单语数据和双语数据中学习同一语义在不同语言中的对应知识,并将其用于不同语言中;(3)跨模态,介绍预训练模...
知乎
知乎
(机器学习-算法工程师简历)如何撰写一份既能展现自己专业技能,又能突显个人特色的简历? 以下是 锤子简历 整理的机器学习-算法工程师简历范例,同时 锤子简历 网还提供精美简历模板以及简历在线制作
知乎
知乎
(机器学习-算法工程师简历)如何撰写一份既能展现自己专业技能,又能突显个人特色的简历? 以下是 锤子简历 整理的机器学习-算法工程师简历范例,同时 锤子简历 网还提供精美简历模板以及简历在线制作
百度百科
百度百科
百度百科是一部内容开放、自由的网络百科全书,旨在创造一个涵盖所有领域知识,服务所有互联网用户的中文知识性百科全书。在这里你可以参与词条编辑,分享贡献你的知识。
agispace.feishu.cn
agispace.feishu.cn
段楠博士:曾是微软亚洲研究院首席研究员等,官网已查不到其资料。与阶跃星辰创始人合作 44 篇论文,总引用量 17.7k,近期研究涉及微软视频生成项目,已加入阶跃星辰任视频生成模型负责人。​ 3. 任少卿博士:来自中科大&MSRA; 联合班,论文总引用量 0.36M,与孙剑教授合作 31 篇。单篇论文引用超 22 万,入选 2023 年未来科学大奖。曾任自动驾驶 Momenta 联创、蔚来自动驾驶 VP,正在办理离职,大概率加入阶跃星辰。​ ​ 作者:特工少女 ​ 公众号:特工宇宙 ​ 原文链...
新浪
新浪
阶跃星辰出现了一些人事变化。根据界面报道,阶跃星辰Tech Fellow段楠离职,任京东探索研究院视觉与多模态实验室负责人。公开信息显示,段楠最初在阶跃星辰对外
https://static-favicon.basemind.com/01JV1WGEN6529KQSRG0FWRX7JF
https://static-favicon.basemind.com/01JV1P3AT2GHKAXG6M82ZRTMEQ
https://static-favicon.basemind.com/01JV1WGEN6529KQSRG0FWRX7JF
View all 16 sources

根据搜索结果,我将为您提供关于算法工程师段楠的详细履历调查报告。

搜索

Search

段楠 微软亚洲研究院 阶跃星辰 京东
mparticle.uc.cn
mparticle.uc.cn
此前,他曾任阶跃星辰Technical Fellow(2024-2025)和微软亚洲研究院自然语言计算团队资深首席研究员和研究经理(2012-2024)。有知情人士向「市象」确认该人事变动属实。公开资料显示,段楠最初在阶跃星辰对外身份是视频生成模型负责人,后期则以Tech Fellow的头衔出现。对此,他曾在采访中回应:“这个Title的形式不必太在意。我本质上还是一名研究员,在继续深入研究自己感兴趣的领域,只是换了个工作平台。此前据Z...
mparticle.uc.cn
mparticle.uc.cn
作为微软亚洲研究院-天津大学的首名联合培养博士,在微软亚研期间,段楠带领团队与微软内部多个产品部门进行长期深入的产研结合合作,所开发技术成功转化到必应搜索、广告、新闻、微软小娜、Azure云服务等产品,为全球用户提供多样化AI服务。凭借构建多语言多模态预训练基础模型,探索基于基础模型的复杂任务推理和任务完成机制,推动通用型人工智能技术的发展,段楠也成为DeepTech 2022年“中国智能计算科技创新人物”入选者之一。此前据Z Fina...
凤凰网
凤凰网
这场由 AI 驱动的视觉内容革新浪潮中,阶跃星辰的 Tech Fellow、前微软亚洲研究院资深研究员段楠,正站在探索的前沿。其团队在今年 2 月和 3 月开源两个重要的视频生成模型—30B 参数的文生视频模型 Step-Video-T2V,以及基于此训练的 30B 参数图生视频模型 Step-Video-TI2V,在 AI 视频生成领域引起了广泛关注。段楠清醒地指出,尽管当前的视频生成技术(如 Diffusion 模型)已能产出惊艳的...
新浪新闻
新浪新闻
在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十二年,对自然语言处理和多模态技术的发展做出了卓越贡献。Step-Video-T2V&Step-Audio;:开源多模态模型的巅峰之作 据相关技术报告评测,阶跃星辰开源的两款具有突破性的 Step-Video-T2V 和 Step-Audio 模型 都处于世界领先水平;而 Step-Audio 则是业内首款产品...
百度百科
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。
Moka 招聘管理系统
Moka 招聘管理系统
段楠 博士带领研究团队构建以语言和视频为中心的多模态基础模型。研究方向自然语言处理和多模态基础模型。多次担任NLP/AI学术会议程序主席和高级领域主席,发表学术论文100余篇,Google Scholar引用20000余次,H-index 70+,持有专利20余项。他获得NeurIPS Best Paper Runner-Up Award(2024),CVPR Best Demo Award(2022)。张祥雨 博士 阶跃星辰首席科学家...
网易
网易
微软亚洲研究院自然语言计算组资深首席研究员段楠表示。他的主要研究方向为多语言多 模态 预训练基础模型、多模态生成式人工智能、代码智能和机器推理等。多年来,他带领团队与微软内部多个产品部门进行长期深入的产研结合合作,所开发技术成功转化到必应搜索/广告/新闻、微软小娜、Visual Studio/VSCode、Azure 云服务等产品,为全球用户提供多样化 AI 服务。段楠
搜狐网
搜狐网
微软亚洲研究院自然语言计算组资深首席研究员段楠表示。他的主要研究方向为多语言多模态预训练基础模型、多模态生成式人工智能、代码智能和机器推理等。多年来,他带领团队与微软内部多个产品部门进行长期深入的产研结合合作,所开发技术成功转化到必应搜索/广告/新闻、微软小娜、Visual Studio/VSCode、Azure 云服务等产品,为全球用户提供多样化 AI 服务。段楠...
https://static-favicon.basemind.com/01JV5682RBD05YMZV6BVZNEF3A
https://static-favicon.basemind.com/01JV1N8442T27Q5H10843ZZBH9
https://static-favicon.basemind.com/01JVC4K8P1DV37DR8Q5M1K4J3K
View all 14 sources

让我继续搜索更多关于段楠的学术背景和职业经历的信息。

搜索

Search

段楠 微软亚洲研究院 NUWA 学术成就
河北经贸大学
12月8日下午,信息技术学院邀请微软亚洲研究院资深首席研究员段楠博士在A教204为学院师生带来了题为“从生成式AI到组合式AI智能体”的精彩学术报告。报告由系主任忽丽莎副教授主持,学院近100名师生参加。段楠教授在生成式大模型构建方面拥有丰富的研究经验和卓越的学术成就。段教授分别从大语言模型、多模态大语言模型、多模态生成式AI和AI智能体四个方面介绍生成式大模型的发展趋势。在大语言模...
知乎
知乎
基于对研究方向的热爱和实习期间优异的工作表现,段楠成为了微软亚洲研究院-天津大学的首名联合培养博士,以统计机器翻译为主要研究方向。 彼时,与计算机视 ...
百度百科
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。
腾讯
腾讯
近日,微软亚洲研究院推出了NUWA-XL超长视频生成模型,采用创新的Diffusion over Diffusion架构,通过「从粗到细」的生成过程,可以并行生成高质量的超长视频,为多模态大模型提供了新的解题思路。论文地址:https://arxiv.org/abs/2303.12346 NUWA-XL「从粗到细」的生成方法具有三个优势: 分层结构使模型能够直接在长视频上进行训练,从而消除了训练和推理之间的差距。模型包含多个局部扩散模型,自然支持并行推理...
网易
网易
文本、图像和轨迹分别对应视频的三个基本控制方面:语义、空间和时间。随着 ChatGPT、GPT-4、LLaMa 等模型的问世,人们越来越关注生成式模型的发展。相比于日渐成熟的文本生成和图像生成,视频、语音等模态的 AI 生成还面临着较大的挑战。现有可控视频生成工作主要存在两个问题:首先,大多数现有工作基于文本、图像或轨迹来控制视频的生成,无法实现视频的细粒度控制;其次,轨迹控制研究仍处于...段楠,微软亚洲研究院资深首席研究员,自然语言计算团队研究经理,中国科学技术大学、...
pingwest.com
pingwest.com
品玩3月28日讯,据 Arxiv 页面显示,微软亚洲研究院的段楠博士团队近日发表论文,介绍了一种名为TaskMatrix.AI 的新型 AI 生态系统。TaskMatrix.AI 将基础大模型与数以百万计的应用程序编程接口(APIs)连接起来完成任务。其核心思想是利用现有的基础大模型作为类似大脑的中央系统,结合其他 AI 模型和系统的 APIs 作为各种子任务解决者,以完成数学和物理领域的多样化任务。
microsoft.com
microsoft.com
微软亚洲研究院高级研究员段楠表示,“NÜWA 是第一个多模态预训练模型。我们希望 NÜWA 可以实现真实世界的视频生成,但在训练过程中模型会产生大量的‘中间变量’,消耗巨大的显存、计算等资源。因此,NÜWA 团队与系统组的同事们联手协作,为 NÜWA 在系统架构上设置了多种并行机制,如张量并行、管道并行和数据并行,使得我们的跨模态训练成为可能。NÜWA 覆盖了11个...
m.bilibili.com
m.bilibili.com
内容介绍 过去三年中,基于自监督学习和Transformer的底层数据表示和任务建模方法在语言、语音和视觉等不同领域不断收敛和趋同,这使得多模态研究成为人工智能领域的一个最新前沿。本报告将重点介绍语言-视觉相关的多模态理解和生成任务。通过代表性工作,总结目前多模态研究取得的一些进展和面临的主要挑战,其中包括在轻量化方面的一些探索。嘉宾介绍 段楠,微软亚洲研究院自然语言计算组高级研究经理,中国科学技术大学兼职博导,天津大...
https://static-favicon.basemind.com/01JVBSD4GFYV4DTKGTQHV1QXVH
https://static-favicon.basemind.com/01JV1WGEN6529KQSRG0FWRX7JF
https://static-favicon.basemind.com/01JV1WBNSJ8TW99JZQ7JJ36SP0
View all 16 sources

我将继续搜索段楠的学术成就和职业经历的更多细节。

搜索

Search

段楠 XGLUE CodeXGLUE 专利 学术成就
百度百科
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。 中文名段楠国 籍中国 ## 人物经历 微软亚洲
中国计算机学会
研究兴趣包括自然语言生成,智能问答和长文本建模。在国际学术期刊和会议(ACL, EMNLP, IJCAI, AAAI, CIKM, COLING等)上发表论文30余篇。获批美国专利6项。
知乎
知乎
段楠博士,微软亚洲研究院高级研究员,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师,主要从事自然语言 ...
中国计算机学会
长期从事自然语言处理相关研究和应用,已发表CCF A/B类论文20余篇,获授权发明专利20余项并获中国专利优秀奖1项,相关成果已在百度的搜索、推荐、小度、百家号、输入法等业务 ...

已掌握的信息

  1. 核心身份与当前任职: 段楠博士是一位在人工智能领域,特别是自然语言处理和多模态基础模型方面有深厚积累的算法工程师和研究科学家。他目前(自2025年6月起)担任京东探索研究院的视觉与多模态实验室负责人。
  2. 职业发展路径: 他的职业生涯主要包括在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理(2012年至2024年),之后短暂加入AI创业公司阶跃星辰担任Tech Fellow,负责以语言和视频为中心的多模态基础模型研究(2024年至2025年)。
  3. 研究方向与专长: 段楠博士的研究领域广泛,主要集中在自然语言处理(NLP)、多模态基础模型(特别是视觉与语言的结合,如视频生成)、代码智能(Code AI)、机器推理以及大规模预训练模型。
  4. 主要学术及项目成就:
    • 在微软亚洲研究院期间,他主导或核心参与了多个有影响力的项目,包括多语言预训练模型Unicoder、多模态预训练模型Unicoder-VL、全球首个多语言多模态预训练模型M3P,以及在代码智能领域的CodeBERT、GraphCodeBERT、UniXcoder等。他领导团队研发了业界知名的视觉内容生成模型“女娲”(NÜWA)系列(包括NÜWA-Infinity、NÜWA-XL、DragNUWA),在文本到图像/视频生成、可控视频生成等方面取得了显著成果。其研究成果已广泛应用于微软的搜索引擎、广告、新闻、智能助手及云服务等产品中。
    • 在阶跃星辰期间,他带领团队构建了以语言和视频为中心的多模态基础模型,并开源了如Step-Video-T2V等视频生成模型。
    • 学术发表方面,段楠博士已发表超过100篇学术论文,其Google Scholar引用次数超过20000次,H-index达到70+。他还发布了XGLUE、CodeXGLUE等有影响力的开源学术数据集,并著有《智能问答》一书。
    • 他获得了包括NeurIPS Best Paper Runner-Up Award (2024) 和 CVPR Best Demo Award (2022) 在内的学术奖项,并持有20余项专利。
  5. 学术兼职与社区贡献: 段楠博士曾担任中国科学技术大学、西安交通大学的兼职博导及天津大学的兼职教授。他积极参与学术社区服务,多次担任ACL、EMNLP、NAACL、NLPCC等顶级人工智能及自然语言处理会议的程序主席、高级领域主席或领域主席。

下一步行动计划

  1. 深入挖掘教育背景与早期经历: 进一步查找并确认段楠博士详细的教育背景信息,包括其博士毕业院校、专业、博士论文研究方向,以及更早期的学术或实习经历,这将有助于构建更完整的人物成长轨迹。
    • 信息源:Google Scholar个人主页、LinkedIn个人资料、相关大学的校友录或历史存档新闻、早期合作发表的论文作者信息。
  2. 系统梳理专利信息: 搜集段楠博士持有的20余项专利的具体列表,包括专利名称、申请号/授权号、申请日期、授权日期及主要发明内容摘要,以更清晰地展示其技术创新和转化成果。
    • 信息源:国家知识产权局(CNIPA)、美国专利商标局(USPTO)、欧洲专利局(EPO)、Google Patents等在线专利数据库。
  3. 整理代表性学术论文与引用分析: 在已有的论文数量和引用数据基础上,整理出其最具代表性的5-10篇学术论文列表(包括发表期刊/会议、发表年份),并对其中几篇核心论文的研究内容和学术贡献进行简要解读。分析其论文被引用的情况,以体现其学术影响力。
    • 信息源:Google Scholar、DBLP、Semantic Scholar、ACM Digital Library、IEEE Xplore等学术文献数据库。
  4. 补充关键项目细节与行业影响: 针对其主导的NÜWA系列、CodeXGLUE、Step-Video-T2V等重点项目,进一步搜集项目的技术架构、创新点、开源情况、业界反响及实际应用案例等详细信息,以评估其在业界的实际贡献和影响力。
    • 信息源:项目官方网站/GitHub页面、相关技术博客、行业媒体深度报道、相关产品发布会资料。
  5. 搜集个人公开演讲与访谈资料: 查找段楠博士在学术会议、行业峰会上的公开演讲视频或PPT,以及接受媒体或机构的访谈记录,从中提炼其对技术趋势的见解、研究心得和未来展望。
    • 信息源:YouTube、Bilibili等视频平台,CSDN、InfoQ等技术社区,以及相关会议的官方网站。
  6. 构建全面的履历报告框架并填充内容: 基于已搜集和待搜集的信息,设计一份结构清晰的履历报告框架,包含个人概况、教育背景、职业经历、研究方向与技术专长、主要项目成果、学术成就(论文、专利、奖项)、学术兼职与社区服务、行业影响力(公开演讲、媒体评价)等模块,并逐步将核实后的信息填充完整,确保报告的全面性、准确性和逻辑性。
  7. 准备图文素材以增强报告可读性: 搜集与段楠博士相关的公开照片(确保版权合规)、其参与项目或成果的示意图、相关机构的Logo等视觉材料,用于丰富报告内容,提升阅读体验。
    • 信息源:公开的新闻报道配图、学术报告PPT截图、项目官网图片。
搜索

Search

段楠 博士 天津大学 微软亚洲研究院 教育背景
百度百科
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。
网易
网易
在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十二年,对自然语言处理和多模态技术的发展做出了卓越贡献。Step-Video-T2V&Step-Audio;:开源多模态模型的巅峰之作 据相关技术报告评测,阶跃星辰开源的两款具有突破性的 Step-Video-T2V 和 Step-Audio 模型都处于世界领先水平;而 Step-Audio 则是业内首款产品级的开源语音交互模型。Step-Vid...
中国计算机学会
2017年11月2日,微软亚洲研究院副院长、国际计算语言学学会(ACL)候任主席周明教授和微软亚洲研究院段楠研究员应邀在天津大学北洋园校区郑东图书馆报告厅做了一场题为《自然语言处理前沿技术》学术报告。
腾讯
腾讯
对话|唐小引,CSDN&《新程序员》执行总编 嘉宾|段楠,阶跃星辰 Tech Fellow 责编丨张红月 出品|AI 科技大本营(ID:rgznai100)这场由 AI 驱动的视觉内容革新浪潮中,阶跃星辰的 Tech Fellow、前微软亚洲研究院资深研究员段楠,正站在探索的前沿。其团队在今年 2 月和 3 月开源两个重要的视频生成模型—30B 参数的文生视频模型 Step-Video-T2V,以及基于此训练的 30B 参数图生视频模型...
m.bilibili.com
m.bilibili.com
内容介绍 过去三年中,基于自监督学习和Transformer的底层数据表示和任务建模方法在语言、语音和视觉等不同领域不断收敛和趋同,这使得多模态研究成为人工智能领域的一个最新前沿。本报告将重点介绍语言-视觉相关的多模态理解和生成任务。通过代表性工作,总结目前多模态研究取得的一些进展和面临的主要挑战,其中包括在轻量化方面的一些探索。嘉宾介绍 段楠,微软亚洲研究院自然语言计算组高级研究经理,中国科学技术大学
哔哩哔哩
哔哩哔哩
作者介绍:段楠,微软亚洲研究院自然语言计算组高级研究经理,中国科学技术大学兼职博导,天津大学兼职教授,主要从事自然语言处理、编程语言处理、多模态人工智能、机器推理等研究,多次担任NLP/AI/ML相关国际会议评测主席、高级领域主席和领域主席,发表学术论文100余篇。本文根据段楠老师在「澜舟NLP分享会」上的演讲整理。文内梳理了视觉语言预训练近期工作,并分享了微软亚洲研究院
mparticle.uc.cn
mparticle.uc.cn
作为微软亚洲研究院-天津大学的首名联合培养博士,在微软亚研期间,段楠带领团队与微软内部多个产品部门进行长期深入的产研结合合作,所开发技术成功转化到必应搜索、广告、新闻、微软小娜、Azure云服务等产品,为全球用户提供多样化AI服务。凭借构建多语言多模态预训练基础模型,探索基于基础模型的复杂任务推理和任务完成机制,推动通用型人工智能技术的发展,段楠也成为DeepTech 2022年“中国智能计算科技创新...
河北经贸大学
河北经贸大学综合新闻网12月8日下午,信息技术学院邀请微软亚洲研究院资深首席研究员段楠博士在A教204为学院师生带来了题为“从生成式AI到组合式AI智能体”的精彩学术报告。报告由系主任忽丽莎副教授主持,学院近100名师生参加。段楠教授在生成式大模型构建方面拥有丰富的研究经验和卓越的学术成就。段教授分别从大语言模型、多模态大语言模型、多模态生成式AI和AI智能体四个方面介绍生成式大模型的发展趋势。在大语...
https://static-favicon.basemind.com/01JV1WGEN6529KQSRG0FWRX7JF
https://static-favicon.basemind.com/01J7HH8TYPAWKCJTC5STHQZF96
https://static-favicon.basemind.com/01JV1P3AT2GHKAXG6M82ZRTMEQ
View all 15 sources

我将继续搜索段楠的专利和主要论文信息。

搜索

Search

段楠 NUWA 女娲 视频生成 论文 引用
腾讯
腾讯
微软亚洲研究院提出的超长视频生成模型 NUWA-XL 可以根据文字自动生成高质量动画作品。让我们先来看一看这段由 NUWA-XL 生成的动画片吧!早在多年前,微软亚洲研究院就开始了包括图像和视频在内的视觉生成方面的研究,并于2021年推出了多模态生成模型 NUWA。NUWA 可以通过自然语言指令实现文本、图像、视频之间的生成、转换和编辑,为视觉内容创作提供灵感。论文地址:https://arxiv.o...
腾讯
腾讯
GitHub 地址:https://github.com/microsoft/NUWA 模型概览 该研究提出了一个通用的 3D transformer—编码器-解码器框架(如下图所示),同时涵盖了语言、图像和视频,可用于多种视觉合成任务。该框架由以文本或视觉草图作为输入的自适应编码器和由 8 个视觉合成任务共享的解码器组成。女娲」整体架构图。该框架还包含一种 3D Nearby Attention(3DNA)机制,以考虑空间和时间上的局部特征。3DNA ...
机器之心
机器之心
近来,视觉合成任务备受关注。几天前英伟达的 GauGAN 刚刚上新了 2.0 版本,现在一个新视觉合成模型 Nüwa(女娲)也火了。 相比于 GauGAN,「女娲」的生成模式更加多样,不仅有文本涂鸦
网易
网易
文本、图像和轨迹分别对应视频的三个基本控制方面:语义、空间和时间。随着 ChatGPT、GPT-4、LLaMa 等模型的问世,人们越来越关注生成式模型的发展。...主要研究工作包括多模态生成模型NUWA(女娲)系列(NUWA,NUWA-LIP,NUWA-Infinity,NUWA-3D,NUWA-XL)、多模态理解模型Bridge Tower(桥塔)系列(KD-VLP,Bridge-Tower)以及多模态对话系统(Vi...
腾讯
腾讯
论文地址:https://arxiv.org/abs/2303.12346 NUWA-XL「从粗到细」的生成方法具有三个优势: 分层结构使模型能够直接在长视频上进行训练,从而消除了训练和推理之间的差距。模型包含多个局部扩散模型,自然支持并行推理,可以显著提高生成长视频时的推理速度。例如在相同的硬件设置下,当生成1024帧时,NUWA-XL 使平均推理时间从7.55分钟减少到26秒,速...
智源社区
智源社区
视觉合成任务备受关注。现在一个新视觉合成模型 Nüwa(女娲)也火了。女娲」的生成模式更加多样,不仅有文本涂鸦生成图像,还能从文本生成视频。高效和大规模的预训练被逐渐应用于视觉合成任务,例如 DALL-E(图像)、GODIVA(视频)。但仍然存在一些局限性—它们分别处理图像和视频,专注于生成其中一种,这限制了模型从图像和视频数据中...
CSDN技术社区
CSDN技术社区
这次,MSRA 和北大联合团队提出的统一多模态预训练模型—NÜWA(女娲),则可以为各种视觉合成任务生成新的或编辑现有的图像和视频数据。论文地址:https://arxiv.org/pdf/2111.12417.pdf GitHub 地址:https://github.com/microsoft/NUWA 为了在不同场景下同时覆盖语言、图像和视频,团队设计了一个三维变换器编码器-解码...
CSDN技术社区
CSDN技术社区
这次,MSRA和北大联合团队提出的统一多模态预训练模型—NÜWA(女娲),则可以为各种视觉合成任务生成新的或编辑现有的图像和视频数据。论文地址:https://arxiv.org/pdf/2111.12417.pdf GitHub地址:https://github.com/microsoft/NUWA 为了在不同场景下同时覆盖语言、图像和视频,团队设计了一个三维变换器编码器-解码器框...
https://static-favicon.basemind.com/01JV1WGEN6529KQSRG0FWRX7JF
https://static-favicon.basemind.com/01J7HH8TYPAWKCJTC5STHQZF96
https://static-favicon.basemind.com/01JV58G69JH8EKB58AQJCGE1CM
View all 16 sources

让我继续搜索段楠的代表性论文和专利信息。

搜索

Search

段楠 CodeBERT GraphCodeBERT UniXcoder 代码智能 专利
网易
网易
段楠与团队带着对语义分析挑战的问题,直接开展了后续一系列代码智能的研究,包括:业界首个代码预训练模型 CodeBERT[6]及其后续版本 GraphCodeBERT[7]和 UniXcoder[8],构建代码智能领域基准测试集 CodeXGLUE[9]等。后续 OpenAI 的 CodeX、ChatGPT 和 GPT-4 更是直接验证了代码预训练对构建 LLM 的重...
微博
微博
段楠实现的主要成果包括:主导研发了多语言预训练语言模型 Unicoder,实现单一预训练语言模型对 100 种人类语言的覆盖;多模态预训练模型 Unicoder-VL,以及全球首个多语言多模态预训练模型 M3P;代码预训练模型 CodeBERT 及其后续版本 GraphCodeBERT 和 UniXcoder,构建代码智能领域基准测试集 CodeXGLUE,引领预训练技术在软件工程领域的快速发展等。截...
博客
博客
GraphCodeBERT则是将图神经网络与BERT结合,对代码结构进行建模的模型。它利用图结构来表示代码中的函数调用关系、变量依赖等信息,并通过图变换学习代码实体间的复杂关系。这种模型在分析复杂的代码库和大型软件项目时尤其有用,可以有效地识别出那些需要重点关注的安全漏洞。微调(fine-tuning)是机器学习中的一个概念,指的是在预训练模型的基础上,使用少量特定任务的数据进行训练,以适应新的任务。...
知乎
知乎
codebert系列是多模态transformer里的一个非常有意思的应用。codebert诞生之初主要致力于自然语言代码搜索和代码文档生成。 我们提出了一种用于编程语言(PL)和自然语言(NL)
CSDN技术社区
CSDN技术社区
CodeBERT 的主要目标是改进代码搜索、代码文档生成等下游任务的性能。项目快速启动 安装依赖 首先,确保你已经安装了 torch 和 transformers 库。你可以通过以下命令进行安装: pip install torch pip install transformers 加载和使用模型 以下是一个简单的示例,展示如何加载和使用 CodeBERT 模型: import torch from transformers impor...
CSDN技术社区
CSDN技术社区
《GraphCodeBERT:Pre-training Code Representations with Data Flow》ICLR 2021(TH-CPL A会,公认顶会,但未上 CCF 榜)作者部分与 CodeBERT 重叠,主要来自 MSRA Intern 和 MSRA 研究员,学生来自国内多个顶尖高校。资源:code|pdf 相关资源:tree-sitter Abstract 之前的模型(eg.CodeBERT
知乎
知乎
截止目前,他已发表学术论文100余篇,Google Scholar 被引用次数超过10000次,持有专利20余项。凭借构建多语言多模态预训练基础模型,探索基于基础模型的复杂 ...
stepfun.com
stepfun.com
在代码智能领域,段楠博士主导研发了CodeBERT、GraphCodeBERT、UniXcoder等预训练模型,并构建了CodeXGLUE基准测试集。这些工作引领了预训练技术在软件工程领域的快速发展,为 ...
https://static-favicon.basemind.com/01JV1VRBZS52MZWDJ5HVWR1Y4T
https://static-favicon.basemind.com/01JV392YV6ZY5GEDZB6WSDMTCC
View all 11 sources

让我搜索一下段楠的教育背景信息。

搜索

Search

段楠 天津大学 博士 教育背景 统计机器翻译
道客巴巴
道客巴巴
内容提示:天津大学博士学位论文统计机器翻译中的一致性解码方法研究姓名:段楠申请学位级别:博士专业:计算机科学与技术;计算机应用技术指导教师:周盟;李沐2011-12 摘要近二十年来,机器翻译(m a ch in e tra n sla tio n,M T)研究迅猛发展。相比于传统的基于规则(ru le—ba sed)和基于实例(ex a m p le-ba sed)的机器翻译方法,统计机器翻译...
豆丁
豆丁
段楠(1981-),男,博士生,主要 研究方向为机器翻译;侯越先(1972-),男,副教授,主要研究方向为机器学习、人工智能。统计机器翻译中的非连续短语模板抽取及其应用 孙越恒段楠侯越先(天津大学计算机科学与技术学院天津300072)摘要目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的 ...
哔哩哔哩
哔哩哔哩
作者介绍:段楠,微软亚洲研究院自然语言计算组高级研究经理,中国科学技术大学兼职博导,天津大学兼职教授,主要从事自然语言处理、编程语言处理、多模态人工智能、机器推理等研究,多次担任NLP/AI/ML相关国际会议评测主席、高级领域主席和领域主席,发表学术论文100余篇。本文根据段楠老师在「澜舟NLP分享会」上的演讲整理。文内梳理了视觉语言预训练近期工作,并分享了微软亚洲研究院在视觉语言预训练模型和视觉合成方面的研究。
天津大学智能与计算学部
天津大学智能与计算学部
段楠博士,现任微软亚洲研究院高级研究员/研究经理,天津大学兼职教授;CCF学术工委会委员、自然语言处理专委会委员,EMNLP/CCF-ADL/CIPS-ATT Tutorial讲者。主要从事智能问答、语义分析、多语言多模态预训练、代码智能和机器推理等研究。CCF杰出讲演者,曾获CCF-NLPCC青年科学家奖。发布XGLUE、CodeXGLUE、NLPCC-KBQA/DBQA/MSParS等开源学术数据集,以及学术论文90余篇,出版专著《智能问答》,持有专...
ml-summit.org
阶跃星辰Tech Fellow 段楠博士,阶跃星辰Tech Fellow,带领研究团队构建以语言和视频为中心的多模态基础模型。此前,他曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理(2012年至2024年)。段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。他主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。演讲主题 视频生成基础模型进展、挑战和未来 本报告将围绕Step-Vid...
掌桥科研
掌桥科研
目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的意义变化或缺失.以非连续介词短语为例,提供了一种短语模板抽取算法.
腾讯
腾讯
段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。他主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。在 4 月 18-19 日举行的 2025 全球机器学习技术大会(ML-Summit)上,段楠就“视频生成基础模型的进展、挑战与未来”发表了主题演讲,并在会后接受了 CSDN 的深度直播专访。段楠预测道,具备更深层次理解能力的视觉领域基础模型(可能带来视觉...
道客巴巴
道客巴巴
内容提示:天津大学硕士学位论文非连续短语模板抽取及短语合并在统计机器翻译中的应用姓名:段楠申请学位级别:硕士专业:计算机应用技术指导教师:何丕廉;李沐20070601 文档星级:   天津大学硕士学位论文非连续短语模板抽取及短语合并在统计机器翻译中的应用姓名:段楠申请学位级别:硕士专业:计算机应用技术指导教师:何丕廉;李沐20070601
https://static-favicon.basemind.com/01J7HH8TYPAWKCJTC5STHQZF96
https://static-favicon.basemind.com/01JV1WGEN6529KQSRG0FWRX7JF
https://static-favicon.basemind.com/01JV1XG767SXMGZBHWBA53KZR9
View all 16 sources

已掌握的信息

目前,我们已经对算法工程师段楠博士的履历有了较为清晰的了解。他现任京东探索研究院视觉与多模态实验室负责人(自2025年6月起)。此前,他于2024年至2025年在阶跃星辰担任Tech Fellow,负责语言和视频为中心的多模态基础模型研究;在2012年至2024年间,他在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理。

教育背景方面,段楠博士是天津大学与微软亚洲研究院联合培养的首名博士,研究方向为统计机器翻译,其博士论文为《统计机器翻译中的一致性解码方法研究》(约2011年)。他可能也拥有天津大学的硕士学位。

他的核心研究领域包括自然语言处理、多模态基础模型(尤其是视觉与语言,如视频生成)、代码智能和机器推理。在微软期间,他主导或核心参与了NÜWA(女娲)系列视觉内容生成模型、CodeBERT系列代码智能模型、Unicoder多语言模型等重要项目。在阶跃星辰期间,他推动了Step-Video-T2V等视频模型的开源。

学术成就方面,段楠博士已发表百余篇论文,Google Scholar引用超2万次,H-index达70+,持有20余项专利,并出版专著《智能问答》。他曾获CVPR最佳演示奖(2022)、NeurIPS最佳论文提名奖(2024)及多项国内荣誉,并积极参与学术社区服务,担任多个顶级会议的程序主席或领域主席。同时,他也是中国科学技术大学、西安交通大学的兼职博导和天津大学的兼职教授。

下一步行动计划

为了进一步完善段楠博士的履历调查报告,接下来的行动计划将聚焦于以下几个方面,延续并深化已有的调查方向:

  1. 完善教育背景细节: 进一步核实并补充段楠博士的硕士及本科学历信息(包括毕业院校、专业及时间),以构建更完整的教育履历。
    • 信息源:Google Scholar个人主页(nanduan.github.io)、LinkedIn(若有公开信息)、其早期论文中的作者简介、相关大学的公开资料。
  2. 系统化整理学术成果:
    • 代表性论文: 筛选并整理段楠博士最具影响力的5-10篇学术论文列表(包括NÜWA系列、CodeBERT系列、Unicoder等),注明发表的顶级会议/期刊及年份,并简要评述其核心贡献和学术影响力。
    • 专利信息: 搜集并整理其持有的专利列表,包括专利名称、申请/授权号、日期及关键内容摘要。
    • 信息源:Google Scholar、DBLP、Semantic Scholar、IEEE Xplore、ACM Digital Library、国家知识产权局(CNIPA)、Google Patents等。
  3. 深化关键项目分析: 针对其主导的NÜWA系列、CodeBERT系列、Step-Video-T2V等核心项目,收集更多关于技术架构、创新点、开源贡献、业界评价及实际应用成效的详细资料。
    • 信息源:项目官方网站/GitHub页面、相关技术白皮书、行业媒体的深度分析文章、相关产品发布信息。
  4. 搜集更多公开活动资料: 查找段楠博士在学术会议、行业论坛上的公开演讲、技术分享(如视频、PPT)以及重要的媒体专访,以获取其对行业趋势的见解和个人思考。
    • 信息源:相关会议官网、YouTube、Bilibili、CSDN、InfoQ等专业技术社区和媒体平台。
  5. 核实并补充荣誉奖项: 确认各项荣誉(如NeurIPS奖项的具体年份和论文)的准确信息和官方来源。
    • 信息源:相关会议的官方获奖名单、颁奖机构的公开信息。
搜索

Search

段楠 nanduan.github.io 教育背景 本科
aminer.cn
aminer.cn
段楠,Senior Principal Researcher,Microsoft,. 个人简介 主要从事自然语言处理、多模态智能、代码智能、机器推理等研究,多次担任NLP/AI学术会议程序主席和领域主席,发表学术论文100余篇,Google Scholar引用10000余次,持有专利20余项。他被评为中国计算机协会(CCF)杰出会员、CCF-NLPCC青年科学家(2019年)、DeepTech中国智能计算科技创新人物(2022年)。DSV:Exploiting Dynamic Sparsi...
百度百科
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。
网易
网易
段楠表示:“通过从语义、空间和时间这三个角度提供约束信息,DragNUWA 极大地增强了视频生成模型的可控性。动图|DragNUWA的两种轨迹控制方式。拖拽背景可以生成各种镜头效果(左),拖拽物体可以生成人物复杂轨迹(右)(来源:arXiv) 多模态生成式人工智能不仅具备巨大的商业价值,还是构建通用型人工智能不可或缺的重要组成部分。当前的人工智能系统主要利用大语言模型进行规划和推理,但人类在做决策时不仅仅会思考一段文字,还会去想象相关的视觉场景。因此,段楠
ml-summit.org
阶跃星辰Tech Fellow 段楠博士,阶跃星辰Tech Fellow,带领研究团队构建以语言和视频为中心的多模态基础模型。此前,他曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理(2012年至2024年)。段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。他主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。演讲主题 视频生成基础模型进展、挑战和未来 本报告将围绕Step-Video系列开源模型,介绍视频生成基础模型的最新进展,包括文生视频和图生视频...
中国计算机学会
中国计算机学会
本次报告将从三方面介绍预训练研究的最新进展:(1)跨任务,介绍预训练模型如何从单语数据中学习自然语言的通用表示,并将其用于不同任务中;(2)跨语言,介绍预训练模型如何从单语数据和双语数据中学习同一语义在不同语言中的对应知识,并将其用于不同语言中;(3)跨模态,介绍预训练模型如何从跨模态数据中学习同一语义在不同模态数据中的对应知识,并将其用于跨模态任务中。最后,将和大家一起探讨该方向在实际落地中存在的一些问题,及可能的解决方案。个人简介:段楠博士,微软亚洲研究院自然语言计算组高级研究员,从事...
中国计算机学会
中国计算机学会
段楠博士以“生成式人工智能,进展、挑战与未来”为题,他首先介绍了生成式人工智能模型,大语言模型如何走向 ChatGPT,介绍了包括语言生成模型 in-context learning、代码生成模型 Codex/GitHub Copilot、对话生成模型 ChatGPT、视觉生成模型 DALL E/Stable Diffusion,介绍了大模型现有的一些不足以及其团队的改进,此外也介绍了微软的相关方面工作包括图像生成方面的 NUWA 模型,不仅可以生成任意大小的图像还可以生...
今日头条
今日头条
瞿泽林,本科毕业于上海政法学院,硕士毕业于美国南加州大学,现在是一名律师。赵南希,本科毕业于浙江大学,研究生毕业于美国康奈尔大学,现在在红圈所当律师。何旻哲,本科毕业于中山大学,硕士毕业于清华大学。《offer3》实习生现状 冯琛,本科毕业于浙江中医药大学,硕士毕业于浙江大学,现在在浙江大学攻读博士学位。张洽,本科毕业于杭州师范大学,硕士毕业于浙江大学,目前正在浙江大学攻读博士学位。李不言,本硕博都就读于中南大学湘雅医...
stepfun.com
stepfun.com
好的,我将为您调研"阶跃星辰的段楠在AI大模型行业内的专业水平"这一问题,重点关注段楠个人在行业内的专业能力和地位。我会从专业背景、技术贡献、行业影响力等方面进行分析 ...
https://static-favicon.basemind.com/01JV2KB37APT5FAMB99C4MFDFA
https://static-favicon.basemind.com/01JV1ZXZ12QRXRWK6V23DQJN8X
View all 11 sources

我将继续搜索段楠的论文和专利信息。

搜索

Search

段楠 NUWA 女娲 论文 引用量 CVPR Best Demo Award
网易
网易
16句描述,生成11分钟动画!女娲」系列新成员:超长视频生成模型NUWA-XL,动画,xl,女娲,短视频,nuwa
eepw.com.cn
eepw.com.cn
源代码:https:// github.com/microsoft/NUWA 一、前言 今天分享的论文,主要提出了一个统一的多模态预训练模型,称为NÜWA,可以为各种视觉合成任务生成新的或操纵现有的视觉数据(即图像和视频)。针对不同场景同时覆盖语言、图像和视频,设计了3D Transformer编码器-*框架,不仅可以将视频作为3D数据处理,还可以分别将文本和图像作为1D和2D数据进行适配。还提出了3D Nearby Attention(3DNA)机制来考虑视觉数据的性质...
网易
网易
本文共一作殷晟明、吴晨飞,通讯作者段楠。论文地址:https://arxiv.org/abs/2308.08089 以拖动(drag)的方式给出运动轨迹,DragNUWA 就能让图像中的物体对象按照该轨迹移动位置,并且可以直接生成连贯的视频。例如,输入一幅静态的两个滑滑板的小男孩图片,经过以下8种不同的拖拽轨迹,DragNUWA就可以生成不同的滑滑板的视频: 除此之外,DragNUWA还可以「变换」静态景物图像的相机位置和角度,比如镜头的上下左右移动、放大或者缩小: 方法...
今日头条
今日头条
段楠 微软亚洲研究院 3 基于视觉信息编解码的深度学习类脑机制研究 何晖光 中国科学院自动化研究所 4 大规模多模态预训练的最新研究进展 卢志武 中国人民大学 5 基于人类行为的服务机器人导航算法设计 蒯曙光 华东师范大学 6 深入理解跨模态特征关联与融合—多模态预训练的研究与应用 张新松 字节跳动 论坛主席 文继荣 CCF常务理事 中国人民大学 信息学院院长/教授 现任高瓴人工智能学院执行院长和信息学院院长,大数据管理与分析方法研究北京市重点实验室主任。文继荣担任北京智源人工智能研究院首...
搜狐网
搜狐网
阶跃星辰作为“六小强”之一,凭借其在人才、技术和市场方面的综合优势,吸引了包括张祥雨、俞刚和段楠在内的多位重量级AI专家。这些专家的到来,不仅增强了阶跃星辰的技术实力,也为大模型的发展带来了新的视角和创新思路。大模型的未来与挑战 张祥雨的加入,标志着AI大模型领域又一次人才的汇聚,预示着更多可能性的诞生。对于阶跃星辰而言,这不仅仅是人才的引进,更是推动其在AI大模型领域实现更大突破的关键一步。随着AI技术的不断进步,如何平衡技术创新与伦理考量,如何应对数据安全与隐私保护的挑战,将成为未来A...
腾讯
腾讯
其核心技术近期在《科学》合作期刊 Intelligent Computing 上发表的论文 TaskMatrix.AI:Completing Tasks by Connecting Foundation Models with Millions of APIs 中正式亮相,作者为 微软亚洲研究院 的 段楠博士团队: (详见链接:https://spj.science.org/doi/10.34133/icomputing.0063) TaskMatrix.AI将基础大模型...
葫芦芯城
其核心技术近期在《科学》合作期刊 Intelligent Computing 上发表的论文 TaskMatrix.AI:Completing Tasks by Connecting Foundation Models with Millions of APIs 中正式亮相,作者为微软亚洲研究院的段楠博士团队: (详见链接:) TaskMatrix.AI 将基础大模型与数以百万计的应用程序编程接口(APIs)连接起来完成任务。其核心思想是利用现有的基础大模型作为类似大脑的中...

让我继续搜索段楠的代表性论文和引用信息。

搜索

Search

段楠 CodeBERT GraphCodeBERT UniXcoder 引用量 专利
微博
微博
段楠实现的主要成果包括:主导研发了多语言预训练语言模型 Unicoder,实现单一预训练语言模型对 100 种人类语言的覆盖;多模态预训练模型 Unicoder-VL,以及全球首个多语言多模态预训练模型 M3P;代码预训练模型 CodeBERT 及其后续版本 GraphCodeBERT 和 UniXcoder,构建代码智能领域基准测试集 CodeXGLUE,引领预训练技术在软件工程领域的快速发展等。截止目前,他已发表学术论文 100 余...
博客
博客
GraphCodeBERT则是将图神经网络与BERT结合,对代码结构进行建模的模型。它利用图结构来表示代码中的函数调用关系、变量依赖等信息,并通过图变换学习代码实体间的复杂关系。这种模型在分析复杂的代码库和大型软件项目时尤其有用,可以有效地识别出那些需要重点关注的安全漏洞。微调(fine-tuning)是机器学习中的一个概念,指的是在预训练模型的基础上,使用少量特定任务的数据进行训练,以适应新的任务。微调可以让模型在保持原有知识的基础上,快速学习到新任务的特点。在漏洞检测...
CSDN技术社区
CSDN技术社区
项目地址:https://gitcode.com/gh_mirrors/co/CodeBERT 项目介绍 CodeBERT 是由微软开发的一个预训练模型,专门用于编程语言和自然语言的处理。它是基于多编程语言的模型,预训练在自然语言和编程语言(NL-PL)对上,支持六种编程语言:Python、Java、JavaScript、PHP、Ruby 和 Go。CodeBERT 的主要目标是改进代码搜索、代码文档生成等下游任务的性能。项目快速启动 安装依赖 首先,确...
搜狐网
搜狐网
CuBERT,即 Code Understanding BERT,和后面提到的 CodeBERT 可被归为同一个时期的工作,虽是首个提出 Code 预训练模型的工作,但和 CodeBERT 相比,其影响力较小(在写这篇文章的时候 CuBERT 引用还没过百),具体原因个人认为是它仅对 Python 语言进行建模(CodeBERT 同时对 6 种编程语言建模),且它的下游任务和
CSDN技术社区
CSDN技术社区
《GraphCodeBERT:Pre-training Code Representations with Data Flow》ICLR 2021(TH-CPL A会,公认顶会,但未上 CCF 榜)作者部分与 CodeBERT 重叠,主要来自 MSRA Intern 和 MSRA 研究员,学生来自国内多个顶尖高校。资源:code|pdf 相关资源:tree-sitter Abstract 之前的模型(eg.CodeBERT
cnblogs.com
cnblogs.com
故:对引用求地址,就是对目标变量求地址。ra 与&a; 相等。(6)不能建立数组的引用。因为数组是一个由若干个元素所组成的集合,所以无法建立一个数组的别名。引用应用 1、引用作为参数 引用的一个重要作用就是作为函数的参数。以前的 C 语言中函数参数传递是值传递,如果有大块数据作为参数传递的时候,采用的方案往往是指针,因为这样可以避免将整块数据全部压栈,可以提高程序的效率。但是现在(C++ 中)又增加了一种同样有效率的选择...
m.bilibili.com
m.bilibili.com
1.引用(reference)1.1 基础使用 引用就是某个变量或常量的别名,对引用进行操作与操作原变量或常量完全相同。1.2 特性l 可以改变引用变量的值,但是不能再次成为其他变量的引用。l 声明引用时,必须初始化。l 声明引用时,初始化的值不能为NULL。l 声明引用时,初始化的值可以是纯数值,但是此时引用需要使用const修饰,表示常...
stepfun.com
stepfun.com
... 引用次数超过10000 次,持有专利20 余项。凭借构建多语言多模态预训练基础 ... 段楠CodeBERT GraphCodeBERT UniXcoder 代码智能微软亚洲研究院. 网易. 段楠与团队 ...
https://static-favicon.basemind.com/01JV1VRBZS52MZWDJ5HVWR1Y4T
View all 10 sources

基于我收集到的信息,现在我将为您提供一份关于算法工程师段楠的详细履历调查报告。

算法工程师段楠履历调查报告

1. 个人概况

段楠博士是人工智能领域的杰出专家,特别在自然语言处理、多模态基础模型、代码智能和机器推理等方向有深厚造诣。他目前担任京东探索研究院视觉与多模态实验室负责人,领导团队研发视觉和多模态基础模型GitHub Pages。段楠博士拥有丰富的学术和工业界经验,已发表学术论文100余篇,Google Scholar引用量超过20,000次,H-index达70+Moka 招聘管理系统,持有专利20余项microsoft.com,是中国计算机协会(CCF)杰出会员、CCF-NLPCC青年科学家(2019年)和DeepTech中国智能计算科技创新人物(2022年)获得者GitHub Pages

2. 教育背景

  • 博士学位:天津大学,计算机科学与技术/计算机应用技术专业,博士论文《统计机器翻译中的一致性解码方法研究》(2011年)道客巴巴。段楠是微软亚洲研究院-天津大学的首名联合培养博士,主要研究方向为统计机器翻译stepfun.commicrosoft.com

  • 硕士学位:天津大学,计算机应用技术专业,硕士论文《非连续短语模板抽取及短语合并在统计机器翻译中的应用》(2007年)道客巴巴

3. 职业经历

3.1 京东探索研究院 (2025年6月至今)

  • 职位:视觉与多模态实验室负责人
  • 职责:带领研究团队研发视觉和多模态基础模型GitHub Pagesmparticle.uc.cn

3.2 阶跃星辰 (2024年-2025年6月)

  • 职位:Tech Fellow
  • 职责:带领研究团队构建以语言和视频为中心的多模态基础模型mparticle.uc.cn
  • 主要成就
    • 推出Step-Video-T2V文生视频大模型,参数量达300亿,可生成长达8-10秒的540P高质量视频网易
    • 开源Step-Audio语音交互大模型,是业内首个产品级的开源语音交互模型网易

3.3 微软亚洲研究院 (2012年-2024年)

  • 职位:资深首席研究员、自然语言计算团队研究经理腾讯
  • 职责:领导自然语言处理、多模态智能、代码智能和机器推理等研究方向河北经贸大学
  • 主要成就
    • 主导研发多语言预训练语言模型Unicoder,实现单一预训练语言模型对100种人类语言的覆盖网易
    • 开发多模态预训练模型Unicoder-VL及全球首个多语言多模态预训练模型M3P网易
    • 领导团队开发代码预训练模型CodeBERT及其后续版本GraphCodeBERT和UniXcoder网易
    • 构建代码智能领域基准测试集CodeXGLUE网易
    • 主导实现业界首个开放域视觉内容生成预训练模型NUWA(女娲)及其系列模型网易
    • 将研究成果成功转化到必应搜索/广告/新闻、微软小娜、Visual Studio/VSCode、Azure云服务等产品网易

4. 研究成就与贡献

4.1 多模态基础模型研究

段楠博士在多模态基础模型领域有突出贡献,特别是在视觉内容生成方面:

4.1.1 NUWA(女娲)系列模型

  • NUWA:业界首个开放域视觉内容生成预训练模型,可通过自然语言指令实现文本、图像、视频之间的生成、转换和编辑腾讯腾讯
  • NUWA-Infinity:无限视觉生成模型,支持任意大小的高清图片或长时间视频生成网易腾讯
  • NUWA-XL:超长视频生成模型,采用创新的Diffusion over Diffusion架构,可用16句简单描述生成11分钟动画片腾讯腾讯
  • DragNUWA:可控视频生成模型,通过拖拽方式给出运动轨迹,让图像中的物体按照轨迹移动并生成连贯视频网易网易

4.1.2 Step系列模型

在阶跃星辰期间,段楠领导团队开发了:

  • Step-Video-T2V:全球领先的视频生成模型,参数量高达300亿,支持文生视频、图生视频等多种任务网易
  • Step-Audio:全球首个可直接应用于工业级的开源语音交互模型网易

4.2 代码智能研究

段楠博士在代码智能领域的贡献同样显著:

4.2.1 代码预训练模型系列

  • CodeBERT:专门用于编程语言和自然语言处理的预训练模型,支持六种编程语言:Python、Java、JavaScript、PHP、Ruby和GoCSDN技术社区
  • GraphCodeBERT:考虑了代码的数据流结构,特别适用于代码搜索、克隆检测、代码精炼和代码翻译等任务CSDN技术社区CSDN技术社区
  • UniXcoder:专注于代码理解和生成任务,能更好地处理长代码序列CSDN技术社区

4.2.2 基准测试集

  • CodeXGLUE:代码智能领域基准测试集,为代码智能研究提供了标准评估平台网易

4.3 自然语言处理研究

段楠博士在自然语言处理领域有深厚积累:

4.3.1 多语言预训练模型

  • Unicoder:实现单一预训练语言模型对100种人类语言的覆盖网易
  • M3P:全球首个多语言多模态预训练模型网易

4.3.2 机器翻译

  • 在统计机器翻译领域有深入研究,特别是在一致性解码方法和非连续短语模板抽取方面道客巴巴道客巴巴

4.4 最新研究方向

段楠博士近期研究方向包括:

  • TaskMatrix.AI:一种新型AI生态系统,将基础大模型与数以百万计的应用程序编程接口(APIs)连接起来完成任务腾讯
  • 视频生成基础模型:研究视频生成模型的进展、挑战和未来发展方向腾讯

5. 学术影响力

5.1 论文发表与引用

  • 已发表学术论文100余篇,涵盖自然语言处理、多模态智能、代码智能和机器推理等领域河北经贸大学
  • Google Scholar引用量超过20,000次,H-index达70+Moka 招聘管理系统
  • 多篇论文发表在ACL、EMNLP、NAACL、CVPR、ICCV、NeurIPS、ICLR等顶级会议上GitHub Pages

5.2 学术奖项与荣誉

5.3 学术服务

  • 多次担任ACL、EMNLP、NAACL、NLPCC等国际会议的程序主席、高级领域主席和领域主席百度百科
  • CCF高级会员和杰出讲演者百度百科

5.4 学术著作

  • 著有《智能问答》(高等教育出版社,2018)百度百科

6. 专利成果

段楠博士持有20余项专利microsoft.com,这些专利涵盖了自然语言处理、多模态智能、代码智能等多个领域,为人工智能技术的产业应用提供了重要支持。

7. 学术兼职

  • 中国科学技术大学兼职博导腾讯
  • 西安交通大学兼职博导腾讯
  • 天津大学兼职教授腾讯

8. 技术观点与前瞻

段楠博士对AI技术发展有独到见解:

  • 认为当前视频生成技术(如Diffusion模型)已能产出惊艳的视觉片段,但可能正触及其能力的"天花板"腾讯
  • 预测具备更深层次理解能力的视觉领域基础模型可能在未来1-2年内出现腾讯
  • 提出未来的视频生成模型需要具备深度视觉理解能力,而非仅仅像素生成,这需要学习范式的转变腾讯
  • 认为自回归与扩散模型的融合可能成为未来视频生成模型的趋势腾讯
  • 强调数据仍是基石与瓶颈,高质量、大规模、多样化的自然数据对构建强大的基础模型至关重要腾讯

9. 职业发展轨迹分析

资料来源: 道客巴巴道客巴巴百度百科mparticle.uc.cn

10. 研究影响力分析

资料来源: 网易GitHub Pagesstepfun.com

11. 总结评价

段楠博士是人工智能领域,特别是自然语言处理、多模态基础模型和代码智能方向的杰出专家。他拥有扎实的学术背景和丰富的工业界经验,在微软亚洲研究院工作12年期间,带领团队开发了多个具有重要影响力的预训练模型和基准测试集,并成功将研究成果转化为产品应用。

他在阶跃星辰期间继续深耕多模态基础模型研究,推出了Step-Video-T2V等开源模型,为视频生成技术的发展做出了重要贡献。目前,他在京东探索研究院担任视觉与多模态实验室负责人,继续推动视觉和多模态基础模型的研发。

段楠博士不仅在学术上有卓越成就,发表了100余篇高质量论文,获得了多项国际学术奖项,还积极参与学术社区服务,担任多个顶级会议的程序主席和领域主席。他对AI技术发展的前瞻性思考,特别是对视频生成技术未来发展方向的见解,体现了他作为领域专家的深刻洞察力。

综合来看,段楠博士是一位集学术研究、技术创新和产业应用于一身的全方位AI专家,其研究成果和技术贡献对推动人工智能,特别是多模态AI技术的发展具有重要意义。

Source(136)
Moka 招聘管理系统
段楠 博士带领研究团队构建以语言和视频为中心的多模态基础模型。研究方向自然语言处理和多模态基础模型。多次担任NLP/AI学术会议程序主席和高级领域主席,发表学术论文100余篇,Google Scholar引用20000余次,H-index 70+,持有专利20余项。他获得NeurIPS Best Paper Runner-Up Award(2024),CVPR Best Demo Award(2022)。张祥雨 博士 阶跃星辰首席科学家,西安交通大学兼职教授。研究方向包括多模态大模型、深度...
凤凰网
嘉宾|段楠,阶跃星辰 Tech Fellow 责编丨张红月 这场由 AI 驱动的视觉内容革新浪潮中,阶跃星辰的 Tech Fellow、前微软亚洲研究院资深研究员段楠,正站在探索的前沿。其团队在今年 2 月和 3 月开源两个重要的视频生成模型—30B 参数的文生视频模型 Step-Video-T2V,以及基于此训练的 30B 参数图生视频模型 Step-Video-TI2V,在 AI 视频生成领域引起了广泛关注。段楠清醒地指出,尽管当前的视频生成技术(如...
中国计算机学会
主题报告五视频:预训练模型最新进展及其在跨任务、跨语言和跨模态场景下的应用 主题简介:近年来,预训练模型(例如ELMo、GPT、BERT和XLNet等)的快速发展大幅提升了诸多NLP任务的整体水平,同时也使得很多应用场景进入到实际落地阶段。本次报告将从三方面介绍预训练研究的最新进展:(1)跨任务,介绍预训练模型如何从单语数据中学习自然语言的通用表示,并将其用于不同任务中;(2)跨语言,介绍预训练模型如何从单语数据和双语数据中学习同一语义在不同语言中的对应知识,并将其用于不同语言中;(3)跨模态,介绍预训练模...
知乎
(机器学习-算法工程师简历)如何撰写一份既能展现自己专业技能,又能突显个人特色的简历? 以下是 锤子简历 整理的机器学习-算法工程师简历范例,同时 锤子简历 网还提供精美简历模板以及简历在线制作
知乎
(机器学习-算法工程师简历)如何撰写一份既能展现自己专业技能,又能突显个人特色的简历? 以下是 锤子简历 整理的机器学习-算法工程师简历范例,同时 锤子简历 网还提供精美简历模板以及简历在线制作
百度百科
百度百科是一部内容开放、自由的网络百科全书,旨在创造一个涵盖所有领域知识,服务所有互联网用户的中文知识性百科全书。在这里你可以参与词条编辑,分享贡献你的知识。
agispace.feishu.cn
段楠博士:曾是微软亚洲研究院首席研究员等,官网已查不到其资料。与阶跃星辰创始人合作 44 篇论文,总引用量 17.7k,近期研究涉及微软视频生成项目,已加入阶跃星辰任视频生成模型负责人。​ 3. 任少卿博士:来自中科大&MSRA; 联合班,论文总引用量 0.36M,与孙剑教授合作 31 篇。单篇论文引用超 22 万,入选 2023 年未来科学大奖。曾任自动驾驶 Momenta 联创、蔚来自动驾驶 VP,正在办理离职,大概率加入阶跃星辰。​ ​ 作者:特工少女 ​ 公众号:特工宇宙 ​ 原文链...
新浪
阶跃星辰出现了一些人事变化。根据界面报道,阶跃星辰Tech Fellow段楠离职,任京东探索研究院视觉与多模态实验室负责人。公开信息显示,段楠最初在阶跃星辰对外
stepfun.com
嘉宾简介:段楠,博士,微软亚洲研究院资深首席研究员,自然语言计算团队研究经理,中国科学技术大学、西安交通大学兼职博导,天津大学兼职教授,主要从事自然语言处理、多模态智 ...
中国科学技术大学信息科学技术学院
段楠博士,微软亚洲研究院自然语言计算组高级研究员/研究经理,天津 大学兼职教授,主要从事自然语言处理、机器推理、以及针对语言/视觉/ 代码的大规模预训 ...
stepfun.com
... 背景和职业履历。重点关注其在AI大模型领域的专业经验和成果。 深入 ... 段楠等。这些人才的加入,使得阶跃星辰在AI 大模型的研发和产品开发方面 ...
中国科学技术大学信息科学技术学院
段楠博士,微软亚洲研究院自然语言计算组高级研究员/研究经理,天津 大学兼职教授,主要从事自然语言处理、机器推理、以及针对语言/视觉/ 代码的大规模预训练等研究,多次担任 ...
中国计算机学会
段楠, 微软亚州研究院, 跨语言/跨模态预训练模型. 33, 冯志勇, 天津大学 ... 滴滴出行的首席算法工程师, 出行行业中的语音技术应用分析人工智能时代的 ...
中国科学院大学
2018-07~现在, 中国科学院成都文献情报中心, 研究馆员 2014-07~2018-06,中国科学院成都文献情报中心网络与信息系统部, 主任 2006-07~2018-06,中国科学院成都文献情报 ...
上海交通大学
毕业后进入阿里巴巴集团从事算法工程师工作. 保研时了解到导师的研究方向与我的兴趣非常匹配,便选择来到了密院继续. 深造。虽然本科毕设项目写成了科研论文,也有幸被 ...
南方科技大学
个人简介. 孙兆华,博士、研究教授,2011年于中国科学院南海海洋研究所获得物理海洋学(海洋技术方向)博士学位,2022年入职南方科技大学海洋科学与工程系。
mparticle.uc.cn
此前,他曾任阶跃星辰Technical Fellow(2024-2025)和微软亚洲研究院自然语言计算团队资深首席研究员和研究经理(2012-2024)。有知情人士向「市象」确认该人事变动属实。公开资料显示,段楠最初在阶跃星辰对外身份是视频生成模型负责人,后期则以Tech Fellow的头衔出现。对此,他曾在采访中回应:“这个Title的形式不必太在意。我本质上还是一名研究员,在继续深入研究自己感兴趣的领域,只是换了个工作平台。此前据Z...
mparticle.uc.cn
作为微软亚洲研究院-天津大学的首名联合培养博士,在微软亚研期间,段楠带领团队与微软内部多个产品部门进行长期深入的产研结合合作,所开发技术成功转化到必应搜索、广告、新闻、微软小娜、Azure云服务等产品,为全球用户提供多样化AI服务。凭借构建多语言多模态预训练基础模型,探索基于基础模型的复杂任务推理和任务完成机制,推动通用型人工智能技术的发展,段楠也成为DeepTech 2022年“中国智能计算科技创新人物”入选者之一。此前据Z Fina...
凤凰网
这场由 AI 驱动的视觉内容革新浪潮中,阶跃星辰的 Tech Fellow、前微软亚洲研究院资深研究员段楠,正站在探索的前沿。其团队在今年 2 月和 3 月开源两个重要的视频生成模型—30B 参数的文生视频模型 Step-Video-T2V,以及基于此训练的 30B 参数图生视频模型 Step-Video-TI2V,在 AI 视频生成领域引起了广泛关注。段楠清醒地指出,尽管当前的视频生成技术(如 Diffusion 模型)已能产出惊艳的...
新浪新闻
在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十二年,对自然语言处理和多模态技术的发展做出了卓越贡献。Step-Video-T2V&Step-Audio;:开源多模态模型的巅峰之作 据相关技术报告评测,阶跃星辰开源的两款具有突破性的 Step-Video-T2V 和 Step-Audio 模型 都处于世界领先水平;而 Step-Audio 则是业内首款产品...
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。
Moka 招聘管理系统
段楠 博士带领研究团队构建以语言和视频为中心的多模态基础模型。研究方向自然语言处理和多模态基础模型。多次担任NLP/AI学术会议程序主席和高级领域主席,发表学术论文100余篇,Google Scholar引用20000余次,H-index 70+,持有专利20余项。他获得NeurIPS Best Paper Runner-Up Award(2024),CVPR Best Demo Award(2022)。张祥雨 博士 阶跃星辰首席科学家...
网易
微软亚洲研究院自然语言计算组资深首席研究员段楠表示。他的主要研究方向为多语言多 模态 预训练基础模型、多模态生成式人工智能、代码智能和机器推理等。多年来,他带领团队与微软内部多个产品部门进行长期深入的产研结合合作,所开发技术成功转化到必应搜索/广告/新闻、微软小娜、Visual Studio/VSCode、Azure 云服务等产品,为全球用户提供多样化 AI 服务。段楠
搜狐网
微软亚洲研究院自然语言计算组资深首席研究员段楠表示。他的主要研究方向为多语言多模态预训练基础模型、多模态生成式人工智能、代码智能和机器推理等。多年来,他带领团队与微软内部多个产品部门进行长期深入的产研结合合作,所开发技术成功转化到必应搜索/广告/新闻、微软小娜、Visual Studio/VSCode、Azure 云服务等产品,为全球用户提供多样化 AI 服务。段楠...
风闻
「市象」获悉,段楠已在其GitHub主页悄然更新履历:现任京东探索研究院视觉与多模态实验室负责人,带领研究团队研发视觉和多模态基础模型。此前,他曾任阶跃 ...
网易
北京时间6月12日消息,据《市象》报道,AI六小龙之一的阶跃星辰Technical Fellow段楠已经加入京东探索研究院,担任视觉与多模态实验室负责人。
tmtpost.com
阶跃星辰出现了一些人事变化。 根据界面报道,阶跃星辰Tech Fellow段楠离职,任京东探索研究院视觉与多模态实验室负责人。公开信息显示,段楠最初在阶跃星辰 ...
GitHub Pages
段楠博士,现任京东探索研究院视觉与多模态实验室负责人,带领研究团队研发视觉和多模态基础模型。此前,他曾任阶跃星辰Technical Fellow(2024-2025)和微软亚洲研究院 ...
新浪财经
来自阶跃星辰Tech Fellow 段楠,生数科技CTO 鲍凡,百川智能多模态负责人孙豪泽,LLaMA Factory 核心开发者冯张驰等技术领军者,围绕视频生成基础模型 ...
飞书
该公司不仅拥有颇受认可的市场地位,还拥有一支由顶尖AI 人才组成的团队,包括张祥雨、俞刚和段楠等。这些人才的加入,使得阶跃星辰在AI 大模型的研发和产品开发方面 ...
河北经贸大学
12月8日下午,信息技术学院邀请微软亚洲研究院资深首席研究员段楠博士在A教204为学院师生带来了题为“从生成式AI到组合式AI智能体”的精彩学术报告。报告由系主任忽丽莎副教授主持,学院近100名师生参加。段楠教授在生成式大模型构建方面拥有丰富的研究经验和卓越的学术成就。段教授分别从大语言模型、多模态大语言模型、多模态生成式AI和AI智能体四个方面介绍生成式大模型的发展趋势。在大语言模...
知乎
基于对研究方向的热爱和实习期间优异的工作表现,段楠成为了微软亚洲研究院-天津大学的首名联合培养博士,以统计机器翻译为主要研究方向。 彼时,与计算机视 ...
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。
腾讯
近日,微软亚洲研究院推出了NUWA-XL超长视频生成模型,采用创新的Diffusion over Diffusion架构,通过「从粗到细」的生成过程,可以并行生成高质量的超长视频,为多模态大模型提供了新的解题思路。论文地址:https://arxiv.org/abs/2303.12346 NUWA-XL「从粗到细」的生成方法具有三个优势: 分层结构使模型能够直接在长视频上进行训练,从而消除了训练和推理之间的差距。模型包含多个局部扩散模型,自然支持并行推理...
网易
文本、图像和轨迹分别对应视频的三个基本控制方面:语义、空间和时间。随着 ChatGPT、GPT-4、LLaMa 等模型的问世,人们越来越关注生成式模型的发展。相比于日渐成熟的文本生成和图像生成,视频、语音等模态的 AI 生成还面临着较大的挑战。现有可控视频生成工作主要存在两个问题:首先,大多数现有工作基于文本、图像或轨迹来控制视频的生成,无法实现视频的细粒度控制;其次,轨迹控制研究仍处于...段楠,微软亚洲研究院资深首席研究员,自然语言计算团队研究经理,中国科学技术大学、...
pingwest.com
品玩3月28日讯,据 Arxiv 页面显示,微软亚洲研究院的段楠博士团队近日发表论文,介绍了一种名为TaskMatrix.AI 的新型 AI 生态系统。TaskMatrix.AI 将基础大模型与数以百万计的应用程序编程接口(APIs)连接起来完成任务。其核心思想是利用现有的基础大模型作为类似大脑的中央系统,结合其他 AI 模型和系统的 APIs 作为各种子任务解决者,以完成数学和物理领域的多样化任务。
microsoft.com
微软亚洲研究院高级研究员段楠表示,“NÜWA 是第一个多模态预训练模型。我们希望 NÜWA 可以实现真实世界的视频生成,但在训练过程中模型会产生大量的‘中间变量’,消耗巨大的显存、计算等资源。因此,NÜWA 团队与系统组的同事们联手协作,为 NÜWA 在系统架构上设置了多种并行机制,如张量并行、管道并行和数据并行,使得我们的跨模态训练成为可能。NÜWA 覆盖了11个...
m.bilibili.com
内容介绍 过去三年中,基于自监督学习和Transformer的底层数据表示和任务建模方法在语言、语音和视觉等不同领域不断收敛和趋同,这使得多模态研究成为人工智能领域的一个最新前沿。本报告将重点介绍语言-视觉相关的多模态理解和生成任务。通过代表性工作,总结目前多模态研究取得的一些进展和面临的主要挑战,其中包括在轻量化方面的一些探索。嘉宾介绍 段楠,微软亚洲研究院自然语言计算组高级研究经理,中国科学技术大学兼职博导,天津大...
scholat.com
微软亚洲研究院研究员段楠说,“NUWA-Infinity从底层形成了一套全局自回归的生成机制,不仅可以对图片进行延展式的生成,也可以应用于视频预测创作,而这也是我们接下来要攻克的研究课题。通过全局自回归建模视觉块之间的依赖关系和局部自回归建模视觉词之间的依赖关系,让NUWA-Infinity能够生成全局一致且局部细节丰富的高质量图像和视频。同时提出任意方向控制器(Arbitrary Direction Controll...
stepfun.com
他在微软亚洲研究院有长达十二年(2012年至2024年)的工作经历,担任资深首席研究员及自然语言计算团队研究经理,直到2024年加入阶跃星辰担任Tech Fellow,领导团队构建以语言和 ...
飞书
... 微软亚洲研究院工作,待了十余年。 段博士近期的研究主要在微软视频生成项目Nüwa,以及NUWA 系列模型家族项目担任研究组长和导师。根据相关线索和推论、段楠博士已与 ...
microsoft.com
2012 年,段楠在博士毕业后正式加入了微软亚洲研究院,研. 究方向以问答和自然语言理解为主。段楠与团队早期在多语言模. 型方面进行系列研究,并开发了微软内部首个多语言预 ...
microsoft.com
微软亚洲研究院高级研究员段楠表示,“NÜWA 是第一个多模态预训练模型。 我们希望NÜWA 可以实现真实世界的视频生成,但在训练过程中模型会产生大量的'中间变 ...
知乎
简介:段楠博士,微软亚洲研究院高级研究经理,中国科学技术大学兼职博导 ... 摘要:本报告将介绍微软亚洲研究院在视觉内容生成方面的最新研究成果:NUWA。
CSDN博客
... 研究来促进NLP 预训练模型在多模态处理和常识知识获取等前沿领域的进步,”段楠表示。 论文:GODIVA: Generating Open-DomaIn Videos from nAtural ...
腾讯云
段楠博士,微软亚洲研究院资深首席研究员,自然语言计算团队研究经理,中国科学技术大学、西安交通大学兼职博导,天津大学兼职教授,主要从事自然语言 ...
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。 中文名段楠国 籍中国 ## 人物经历 微软亚洲
中国计算机学会
研究兴趣包括自然语言生成,智能问答和长文本建模。在国际学术期刊和会议(ACL, EMNLP, IJCAI, AAAI, CIKM, COLING等)上发表论文30余篇。获批美国专利6项。
知乎
段楠博士,微软亚洲研究院高级研究员,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师,主要从事自然语言 ...
中国计算机学会
长期从事自然语言处理相关研究和应用,已发表CCF A/B类论文20余篇,获授权发明专利20余项并获中国专利优秀奖1项,相关成果已在百度的搜索、推荐、小度、百家号、输入法等业务 ...
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。
网易
在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十二年,对自然语言处理和多模态技术的发展做出了卓越贡献。Step-Video-T2V&Step-Audio;:开源多模态模型的巅峰之作 据相关技术报告评测,阶跃星辰开源的两款具有突破性的 Step-Video-T2V 和 Step-Audio 模型都处于世界领先水平;而 Step-Audio 则是业内首款产品级的开源语音交互模型。Step-Vid...
中国计算机学会
2017年11月2日,微软亚洲研究院副院长、国际计算语言学学会(ACL)候任主席周明教授和微软亚洲研究院段楠研究员应邀在天津大学北洋园校区郑东图书馆报告厅做了一场题为《自然语言处理前沿技术》学术报告。
腾讯
对话|唐小引,CSDN&《新程序员》执行总编 嘉宾|段楠,阶跃星辰 Tech Fellow 责编丨张红月 出品|AI 科技大本营(ID:rgznai100)这场由 AI 驱动的视觉内容革新浪潮中,阶跃星辰的 Tech Fellow、前微软亚洲研究院资深研究员段楠,正站在探索的前沿。其团队在今年 2 月和 3 月开源两个重要的视频生成模型—30B 参数的文生视频模型 Step-Video-T2V,以及基于此训练的 30B 参数图生视频模型...
m.bilibili.com
内容介绍 过去三年中,基于自监督学习和Transformer的底层数据表示和任务建模方法在语言、语音和视觉等不同领域不断收敛和趋同,这使得多模态研究成为人工智能领域的一个最新前沿。本报告将重点介绍语言-视觉相关的多模态理解和生成任务。通过代表性工作,总结目前多模态研究取得的一些进展和面临的主要挑战,其中包括在轻量化方面的一些探索。嘉宾介绍 段楠,微软亚洲研究院自然语言计算组高级研究经理,中国科学技术大学
哔哩哔哩
作者介绍:段楠,微软亚洲研究院自然语言计算组高级研究经理,中国科学技术大学兼职博导,天津大学兼职教授,主要从事自然语言处理、编程语言处理、多模态人工智能、机器推理等研究,多次担任NLP/AI/ML相关国际会议评测主席、高级领域主席和领域主席,发表学术论文100余篇。本文根据段楠老师在「澜舟NLP分享会」上的演讲整理。文内梳理了视觉语言预训练近期工作,并分享了微软亚洲研究院
mparticle.uc.cn
作为微软亚洲研究院-天津大学的首名联合培养博士,在微软亚研期间,段楠带领团队与微软内部多个产品部门进行长期深入的产研结合合作,所开发技术成功转化到必应搜索、广告、新闻、微软小娜、Azure云服务等产品,为全球用户提供多样化AI服务。凭借构建多语言多模态预训练基础模型,探索基于基础模型的复杂任务推理和任务完成机制,推动通用型人工智能技术的发展,段楠也成为DeepTech 2022年“中国智能计算科技创新...
河北经贸大学
河北经贸大学综合新闻网12月8日下午,信息技术学院邀请微软亚洲研究院资深首席研究员段楠博士在A教204为学院师生带来了题为“从生成式AI到组合式AI智能体”的精彩学术报告。报告由系主任忽丽莎副教授主持,学院近100名师生参加。段楠教授在生成式大模型构建方面拥有丰富的研究经验和卓越的学术成就。段教授分别从大语言模型、多模态大语言模型、多模态生成式AI和AI智能体四个方面介绍生成式大模型的发展趋势。在大语...
stepfun.com
段楠博士拥有深厚的学术背景,是微软亚洲研究院-天津大学的首名联合培养博士,主要研究方向为统计机器翻译。他在微软亚洲研究院有长达十二年(2012年至2024年)的工作经历,担任 ...
知乎
2012年,段楠在博士毕业后正式加入了微软亚洲研究院,研究方向以问答和自然语言理解为主。 段楠与团队早期在多语言模型方面进行系列研究,并开发了微软内部 ...
中国科学技术大学信息科学技术学院
段楠博士,微软亚洲研究院自然语言计算组高级研究员/研究经理,天津 大学兼职教授,主要从事自然语言处理、机器推理、以及针对语言/视觉/ 代码的大规模预训 ...
中国计算机学会
此前,他曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理。段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。他主要 ...
中国科学技术大学信息科学技术学院
段楠博士,微软亚洲研究院自然语言计算组高级研究员/研究经理,天津 大学兼职教授,主要从事自然语言处理、机器推理、以及针对语言/视觉/ 代码的大规模预训练等研究,多次担任 ...
microsoft.com
2012 年,段楠在博士毕业后正式加入了微软亚洲研究院,研. 究方向以问答和自然语言理解为主。段楠与团队早期在多语言模. 型方面进行系列研究,并开发了微软内部首个多语言预 ...
知乎
段楠博士,微软亚洲研究院自然语言计算组高级研究员,天津大学兼职教授,主要从事自然语言处理、机器推理、以及针对语言/视觉/代码的大规模预训练等研究,多次 ...
腾讯
微软亚洲研究院提出的超长视频生成模型 NUWA-XL 可以根据文字自动生成高质量动画作品。让我们先来看一看这段由 NUWA-XL 生成的动画片吧!早在多年前,微软亚洲研究院就开始了包括图像和视频在内的视觉生成方面的研究,并于2021年推出了多模态生成模型 NUWA。NUWA 可以通过自然语言指令实现文本、图像、视频之间的生成、转换和编辑,为视觉内容创作提供灵感。论文地址:https://arxiv.o...
腾讯
GitHub 地址:https://github.com/microsoft/NUWA 模型概览 该研究提出了一个通用的 3D transformer—编码器-解码器框架(如下图所示),同时涵盖了语言、图像和视频,可用于多种视觉合成任务。该框架由以文本或视觉草图作为输入的自适应编码器和由 8 个视觉合成任务共享的解码器组成。女娲」整体架构图。该框架还包含一种 3D Nearby Attention(3DNA)机制,以考虑空间和时间上的局部特征。3DNA ...
机器之心
近来,视觉合成任务备受关注。几天前英伟达的 GauGAN 刚刚上新了 2.0 版本,现在一个新视觉合成模型 Nüwa(女娲)也火了。 相比于 GauGAN,「女娲」的生成模式更加多样,不仅有文本涂鸦
网易
文本、图像和轨迹分别对应视频的三个基本控制方面:语义、空间和时间。随着 ChatGPT、GPT-4、LLaMa 等模型的问世,人们越来越关注生成式模型的发展。...主要研究工作包括多模态生成模型NUWA(女娲)系列(NUWA,NUWA-LIP,NUWA-Infinity,NUWA-3D,NUWA-XL)、多模态理解模型Bridge Tower(桥塔)系列(KD-VLP,Bridge-Tower)以及多模态对话系统(Vi...
腾讯
论文地址:https://arxiv.org/abs/2303.12346 NUWA-XL「从粗到细」的生成方法具有三个优势: 分层结构使模型能够直接在长视频上进行训练,从而消除了训练和推理之间的差距。模型包含多个局部扩散模型,自然支持并行推理,可以显著提高生成长视频时的推理速度。例如在相同的硬件设置下,当生成1024帧时,NUWA-XL 使平均推理时间从7.55分钟减少到26秒,速...
智源社区
视觉合成任务备受关注。现在一个新视觉合成模型 Nüwa(女娲)也火了。女娲」的生成模式更加多样,不仅有文本涂鸦生成图像,还能从文本生成视频。高效和大规模的预训练被逐渐应用于视觉合成任务,例如 DALL-E(图像)、GODIVA(视频)。但仍然存在一些局限性—它们分别处理图像和视频,专注于生成其中一种,这限制了模型从图像和视频数据中...
CSDN技术社区
这次,MSRA 和北大联合团队提出的统一多模态预训练模型—NÜWA(女娲),则可以为各种视觉合成任务生成新的或编辑现有的图像和视频数据。论文地址:https://arxiv.org/pdf/2111.12417.pdf GitHub 地址:https://github.com/microsoft/NUWA 为了在不同场景下同时覆盖语言、图像和视频,团队设计了一个三维变换器编码器-解码...
CSDN技术社区
这次,MSRA和北大联合团队提出的统一多模态预训练模型—NÜWA(女娲),则可以为各种视觉合成任务生成新的或编辑现有的图像和视频数据。论文地址:https://arxiv.org/pdf/2111.12417.pdf GitHub地址:https://github.com/microsoft/NUWA 为了在不同场景下同时覆盖语言、图像和视频,团队设计了一个三维变换器编码器-解码器框...
stepfun.com
在视觉内容生成方面,段楠博士主导实现了业界首个开放域视觉内容生成预训练模型NUWA(女娲)及其系列模型(NUWA-Infinity, NUWA-XL, DragNUWA)。这些模型能够实现文本、图像、 ...
知乎
他和团队主导实现了业界首个开放域视觉内容生成预训练模型NUWA(女娲)[1]及其后续版本NUWA-Infinity(任意分辨率图像和视频生成)[2]、NUWA-XL(超长视频生成) ...
机器之心
DragNUWA 是一种端到端的视频生成模型,它无缝集成了三个基本控件—— 文本、图像和轨迹,提供强大且用户友好的可控性,从语义、空间和时间角度对视频内容进行 ...
kuxai.com
16句描述,生成11分钟动画!「女娲」系列新成员:超长视频生成模型NUWA-XL · 论文地址:https://arxiv.org/abs/2111.12417 · 论文地址:https://arxiv.org/abs/ ...
microsoft.com
生成11 分钟动画片,充分展示了该模型对超长视频生成的能力。 最近,段楠与团队提出了新型视频生成模型DragNUWA,. 从可控性角度提出视频生成新方案。实际上,从相对 ...
知乎
只要用拖动的方式给出运动轨迹,DragNUWA就能让图像中的物体对象按照该轨迹移动位置并生成连贯的视频。 DragNUWA能同时控制摄像机和多个对象的移动以及复杂 ...
智源社区
微软开发了一种名为DragNUWA的视频生成模型,可以通过手绘轨迹驱动图像动态化,实现复杂运动及场景控制。只需用拖动的方式给出运动轨迹,DragNUWA就能让 ...
腾讯云
微软推出视频生成模型DragNUWA,支持手绘轨迹驱动图像动态化,实现复杂运动及场景控制。该模型能精细控制摄像机与多对象移动,解决现有视频生成技术局限, ...
网易
段楠与团队带着对语义分析挑战的问题,直接开展了后续一系列代码智能的研究,包括:业界首个代码预训练模型 CodeBERT[6]及其后续版本 GraphCodeBERT[7]和 UniXcoder[8],构建代码智能领域基准测试集 CodeXGLUE[9]等。后续 OpenAI 的 CodeX、ChatGPT 和 GPT-4 更是直接验证了代码预训练对构建 LLM 的重...
微博
段楠实现的主要成果包括:主导研发了多语言预训练语言模型 Unicoder,实现单一预训练语言模型对 100 种人类语言的覆盖;多模态预训练模型 Unicoder-VL,以及全球首个多语言多模态预训练模型 M3P;代码预训练模型 CodeBERT 及其后续版本 GraphCodeBERT 和 UniXcoder,构建代码智能领域基准测试集 CodeXGLUE,引领预训练技术在软件工程领域的快速发展等。截...
博客
GraphCodeBERT则是将图神经网络与BERT结合,对代码结构进行建模的模型。它利用图结构来表示代码中的函数调用关系、变量依赖等信息,并通过图变换学习代码实体间的复杂关系。这种模型在分析复杂的代码库和大型软件项目时尤其有用,可以有效地识别出那些需要重点关注的安全漏洞。微调(fine-tuning)是机器学习中的一个概念,指的是在预训练模型的基础上,使用少量特定任务的数据进行训练,以适应新的任务。...
知乎
codebert系列是多模态transformer里的一个非常有意思的应用。codebert诞生之初主要致力于自然语言代码搜索和代码文档生成。 我们提出了一种用于编程语言(PL)和自然语言(NL)
CSDN技术社区
CodeBERT 的主要目标是改进代码搜索、代码文档生成等下游任务的性能。项目快速启动 安装依赖 首先,确保你已经安装了 torch 和 transformers 库。你可以通过以下命令进行安装: pip install torch pip install transformers 加载和使用模型 以下是一个简单的示例,展示如何加载和使用 CodeBERT 模型: import torch from transformers impor...
CSDN技术社区
《GraphCodeBERT:Pre-training Code Representations with Data Flow》ICLR 2021(TH-CPL A会,公认顶会,但未上 CCF 榜)作者部分与 CodeBERT 重叠,主要来自 MSRA Intern 和 MSRA 研究员,学生来自国内多个顶尖高校。资源:code|pdf 相关资源:tree-sitter Abstract 之前的模型(eg.CodeBERT
知乎
截止目前,他已发表学术论文100余篇,Google Scholar 被引用次数超过10000次,持有专利20余项。凭借构建多语言多模态预训练基础模型,探索基于基础模型的复杂 ...
stepfun.com
在代码智能领域,段楠博士主导研发了CodeBERT、GraphCodeBERT、UniXcoder等预训练模型,并构建了CodeXGLUE基准测试集。这些工作引领了预训练技术在软件工程领域的快速发展,为 ...
GitHub Pages
段博士是自然语言处理(NLP)、代码智能、多语言多模态基础模型和AI智能体领域的 ... pre-training: CodeBERT (EMNLP, 2020), GraphCodeBERT (ICLR, 2021) ...
microsoft.com
GraphCodeBERT 和UniXcoder,构建代码智能领域基准测试集. CodeXGLUE,引领预训练 ... 和任务完成机制,推动通用型人工智能技术的发展,段楠成为. DeepTech 2022 年 ...
金融界
金融界2025年6月10日消息,国家知识产权局信息显示,东莞市科翼智能设备有限公司取得一项名为“标签分拣装置和标签生产设备”的专利,授权公告号CN222956937U,申请日期为2024年06月。
道客巴巴
内容提示:天津大学博士学位论文统计机器翻译中的一致性解码方法研究姓名:段楠申请学位级别:博士专业:计算机科学与技术;计算机应用技术指导教师:周盟;李沐2011-12 摘要近二十年来,机器翻译(m a ch in e tra n sla tio n,M T)研究迅猛发展。相比于传统的基于规则(ru le—ba sed)和基于实例(ex a m p le-ba sed)的机器翻译方法,统计机器翻译...
豆丁
段楠(1981-),男,博士生,主要 研究方向为机器翻译;侯越先(1972-),男,副教授,主要研究方向为机器学习、人工智能。统计机器翻译中的非连续短语模板抽取及其应用 孙越恒段楠侯越先(天津大学计算机科学与技术学院天津300072)摘要目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的 ...
哔哩哔哩
作者介绍:段楠,微软亚洲研究院自然语言计算组高级研究经理,中国科学技术大学兼职博导,天津大学兼职教授,主要从事自然语言处理、编程语言处理、多模态人工智能、机器推理等研究,多次担任NLP/AI/ML相关国际会议评测主席、高级领域主席和领域主席,发表学术论文100余篇。本文根据段楠老师在「澜舟NLP分享会」上的演讲整理。文内梳理了视觉语言预训练近期工作,并分享了微软亚洲研究院在视觉语言预训练模型和视觉合成方面的研究。
天津大学智能与计算学部
段楠博士,现任微软亚洲研究院高级研究员/研究经理,天津大学兼职教授;CCF学术工委会委员、自然语言处理专委会委员,EMNLP/CCF-ADL/CIPS-ATT Tutorial讲者。主要从事智能问答、语义分析、多语言多模态预训练、代码智能和机器推理等研究。CCF杰出讲演者,曾获CCF-NLPCC青年科学家奖。发布XGLUE、CodeXGLUE、NLPCC-KBQA/DBQA/MSParS等开源学术数据集,以及学术论文90余篇,出版专著《智能问答》,持有专...
ml-summit.org
阶跃星辰Tech Fellow 段楠博士,阶跃星辰Tech Fellow,带领研究团队构建以语言和视频为中心的多模态基础模型。此前,他曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理(2012年至2024年)。段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。他主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。演讲主题 视频生成基础模型进展、挑战和未来 本报告将围绕Step-Vid...
掌桥科研
目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的意义变化或缺失.以非连续介词短语为例,提供了一种短语模板抽取算法.
腾讯
段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。他主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。在 4 月 18-19 日举行的 2025 全球机器学习技术大会(ML-Summit)上,段楠就“视频生成基础模型的进展、挑战与未来”发表了主题演讲,并在会后接受了 CSDN 的深度直播专访。段楠预测道,具备更深层次理解能力的视觉领域基础模型(可能带来视觉...
道客巴巴
内容提示:天津大学硕士学位论文非连续短语模板抽取及短语合并在统计机器翻译中的应用姓名:段楠申请学位级别:硕士专业:计算机应用技术指导教师:何丕廉;李沐20070601 文档星级:   天津大学硕士学位论文非连续短语模板抽取及短语合并在统计机器翻译中的应用姓名:段楠申请学位级别:硕士专业:计算机应用技术指导教师:何丕廉;李沐20070601
知乎
基于对研究方向的热爱和实习期间优异的工作表现,段楠成为了微软亚洲研究院-天津大学的首名联合培养博士,以统计机器翻译为主要研究方向。彼时,与计算机视觉 ...
stepfun.com
段楠博士拥有深厚的学术背景,是微软亚洲研究院-天津大学的首名联合培养博士,主要研究方向为统计机器翻译。他在微软亚洲研究院有长达十二年(2012年至2024年)的工作经历,担任 ...
天津大学智能与计算学部
作为知名高校和世界一流研究院共同创办的联合课程,该课程培养了一大批自然语言处理的优秀人才,其中段楠博士曾是天津大学和MSRA联合培养的博士生,现在为 ...
天津大学
... 博士学位申请材料,并以无记名投票方式进行了表. 决,决定授予王鑫等4 人理学博士学位,授予张凯林等42 人工. 学博士学位,授予陶军明1 人教育学博士学位,授予王迪等4 人. 管理 ...
海南大学
天津大学2019年博士研究生招生专业目录. 206. 建筑学院. 081300 建筑学. 党睿. 02. 绿色建筑. 独立指导. 206. 建筑学院. 081300 建筑学. 冯刚. 01. 大学校园规划与教育建筑 ...
moe.gov.cn
面向手语机器翻译的大规模连续中国通用手语语料库构. 建研究. 规划基金项目 ... “双减”政策背景下义务教育学段课外体育服务体系构. 建与治理研究. 规划基金项目.
microsoft.com
博士研究生。 基于对研究方向的热爱和实习期间优异的工作表现,段楠成. 为了微软亚洲研究院-天津大学的首名联合培养博士,以统计机. 器翻译为主要研究方向。彼时,与 ...
飞书
第二位大拿,段楠博士,此前身份是微软亚洲研究院首席研究员,自然语言计算团队研究经理、中科大兼职博导、天津大学客座教授。但截止发稿时位置,在微软研究员查询的 ...
aminer.cn
段楠,Senior Principal Researcher,Microsoft,. 个人简介 主要从事自然语言处理、多模态智能、代码智能、机器推理等研究,多次担任NLP/AI学术会议程序主席和领域主席,发表学术论文100余篇,Google Scholar引用10000余次,持有专利20余项。他被评为中国计算机协会(CCF)杰出会员、CCF-NLPCC青年科学家(2019年)、DeepTech中国智能计算科技创新人物(2022年)。DSV:Exploiting Dynamic Sparsi...
百度百科
段楠,博士,微软亚洲研究院高级研究员/研究经理,天津大学兼职教授,微软亚洲研究院-中国科学技术大学/中山大学/北京航空航天大学联合培养博士生导师。
网易
段楠表示:“通过从语义、空间和时间这三个角度提供约束信息,DragNUWA 极大地增强了视频生成模型的可控性。动图|DragNUWA的两种轨迹控制方式。拖拽背景可以生成各种镜头效果(左),拖拽物体可以生成人物复杂轨迹(右)(来源:arXiv) 多模态生成式人工智能不仅具备巨大的商业价值,还是构建通用型人工智能不可或缺的重要组成部分。当前的人工智能系统主要利用大语言模型进行规划和推理,但人类在做决策时不仅仅会思考一段文字,还会去想象相关的视觉场景。因此,段楠
ml-summit.org
阶跃星辰Tech Fellow 段楠博士,阶跃星辰Tech Fellow,带领研究团队构建以语言和视频为中心的多模态基础模型。此前,他曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理(2012年至2024年)。段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。他主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。演讲主题 视频生成基础模型进展、挑战和未来 本报告将围绕Step-Video系列开源模型,介绍视频生成基础模型的最新进展,包括文生视频和图生视频...
中国计算机学会
本次报告将从三方面介绍预训练研究的最新进展:(1)跨任务,介绍预训练模型如何从单语数据中学习自然语言的通用表示,并将其用于不同任务中;(2)跨语言,介绍预训练模型如何从单语数据和双语数据中学习同一语义在不同语言中的对应知识,并将其用于不同语言中;(3)跨模态,介绍预训练模型如何从跨模态数据中学习同一语义在不同模态数据中的对应知识,并将其用于跨模态任务中。最后,将和大家一起探讨该方向在实际落地中存在的一些问题,及可能的解决方案。个人简介:段楠博士,微软亚洲研究院自然语言计算组高级研究员,从事...
中国计算机学会
段楠博士以“生成式人工智能,进展、挑战与未来”为题,他首先介绍了生成式人工智能模型,大语言模型如何走向 ChatGPT,介绍了包括语言生成模型 in-context learning、代码生成模型 Codex/GitHub Copilot、对话生成模型 ChatGPT、视觉生成模型 DALL E/Stable Diffusion,介绍了大模型现有的一些不足以及其团队的改进,此外也介绍了微软的相关方面工作包括图像生成方面的 NUWA 模型,不仅可以生成任意大小的图像还可以生...
今日头条
瞿泽林,本科毕业于上海政法学院,硕士毕业于美国南加州大学,现在是一名律师。赵南希,本科毕业于浙江大学,研究生毕业于美国康奈尔大学,现在在红圈所当律师。何旻哲,本科毕业于中山大学,硕士毕业于清华大学。《offer3》实习生现状 冯琛,本科毕业于浙江中医药大学,硕士毕业于浙江大学,现在在浙江大学攻读博士学位。张洽,本科毕业于杭州师范大学,硕士毕业于浙江大学,目前正在浙江大学攻读博士学位。李不言,本硕博都就读于中南大学湘雅医...
stepfun.com
好的,我将为您调研"阶跃星辰的段楠在AI大模型行业内的专业水平"这一问题,重点关注段楠个人在行业内的专业能力和地位。我会从专业背景、技术贡献、行业影响力等方面进行分析 ...
GitHub Pages
段楠,周明. 高等教育出版社,2018. 《人工智能导论 - 第11章:自然语言处理》. 周明,段楠,刘树杰,吴俣. 中国科学技术出版社,2018. 《统计机器翻译中的一致性解码 ...
huggingface.co
... 南段+南江+南沙+南洋+南海+南湖+南湾+南溪+南澳+南瓜+南疆+南站+南端+南粤+南线+南美+南航+南苑+南行+南街+南诏+南越+南路+南边+南通+南郊+南部+南门+南阳+南非+南面+ ...
github.com
... 南段韶山9G 还要:1÷(1/15+1/10)-2=4天|`| 尧尧爹lgb 1-(1/15+1/10)*2=(1/15+1/10)x\r\n解得x=4|`| 菊花农村台 总功效=1/15+1/10=1/6\r\n两人同时工作所需时间=1/(1/6 ...
网易
16句描述,生成11分钟动画!女娲」系列新成员:超长视频生成模型NUWA-XL,动画,xl,女娲,短视频,nuwa
eepw.com.cn
源代码:https:// github.com/microsoft/NUWA 一、前言 今天分享的论文,主要提出了一个统一的多模态预训练模型,称为NÜWA,可以为各种视觉合成任务生成新的或操纵现有的视觉数据(即图像和视频)。针对不同场景同时覆盖语言、图像和视频,设计了3D Transformer编码器-*框架,不仅可以将视频作为3D数据处理,还可以分别将文本和图像作为1D和2D数据进行适配。还提出了3D Nearby Attention(3DNA)机制来考虑视觉数据的性质...
网易
本文共一作殷晟明、吴晨飞,通讯作者段楠。论文地址:https://arxiv.org/abs/2308.08089 以拖动(drag)的方式给出运动轨迹,DragNUWA 就能让图像中的物体对象按照该轨迹移动位置,并且可以直接生成连贯的视频。例如,输入一幅静态的两个滑滑板的小男孩图片,经过以下8种不同的拖拽轨迹,DragNUWA就可以生成不同的滑滑板的视频: 除此之外,DragNUWA还可以「变换」静态景物图像的相机位置和角度,比如镜头的上下左右移动、放大或者缩小: 方法...
今日头条
段楠 微软亚洲研究院 3 基于视觉信息编解码的深度学习类脑机制研究 何晖光 中国科学院自动化研究所 4 大规模多模态预训练的最新研究进展 卢志武 中国人民大学 5 基于人类行为的服务机器人导航算法设计 蒯曙光 华东师范大学 6 深入理解跨模态特征关联与融合—多模态预训练的研究与应用 张新松 字节跳动 论坛主席 文继荣 CCF常务理事 中国人民大学 信息学院院长/教授 现任高瓴人工智能学院执行院长和信息学院院长,大数据管理与分析方法研究北京市重点实验室主任。文继荣担任北京智源人工智能研究院首...
搜狐网
阶跃星辰作为“六小强”之一,凭借其在人才、技术和市场方面的综合优势,吸引了包括张祥雨、俞刚和段楠在内的多位重量级AI专家。这些专家的到来,不仅增强了阶跃星辰的技术实力,也为大模型的发展带来了新的视角和创新思路。大模型的未来与挑战 张祥雨的加入,标志着AI大模型领域又一次人才的汇聚,预示着更多可能性的诞生。对于阶跃星辰而言,这不仅仅是人才的引进,更是推动其在AI大模型领域实现更大突破的关键一步。随着AI技术的不断进步,如何平衡技术创新与伦理考量,如何应对数据安全与隐私保护的挑战,将成为未来A...
腾讯
其核心技术近期在《科学》合作期刊 Intelligent Computing 上发表的论文 TaskMatrix.AI:Completing Tasks by Connecting Foundation Models with Millions of APIs 中正式亮相,作者为 微软亚洲研究院 的 段楠博士团队: (详见链接:https://spj.science.org/doi/10.34133/icomputing.0063) TaskMatrix.AI将基础大模型...
葫芦芯城
其核心技术近期在《科学》合作期刊 Intelligent Computing 上发表的论文 TaskMatrix.AI:Completing Tasks by Connecting Foundation Models with Millions of APIs 中正式亮相,作者为微软亚洲研究院的段楠博士团队: (详见链接:) TaskMatrix.AI 将基础大模型与数以百万计的应用程序编程接口(APIs)连接起来完成任务。其核心思想是利用现有的基础大模型作为类似大脑的中...
微博
段楠实现的主要成果包括:主导研发了多语言预训练语言模型 Unicoder,实现单一预训练语言模型对 100 种人类语言的覆盖;多模态预训练模型 Unicoder-VL,以及全球首个多语言多模态预训练模型 M3P;代码预训练模型 CodeBERT 及其后续版本 GraphCodeBERT 和 UniXcoder,构建代码智能领域基准测试集 CodeXGLUE,引领预训练技术在软件工程领域的快速发展等。截止目前,他已发表学术论文 100 余...
博客
GraphCodeBERT则是将图神经网络与BERT结合,对代码结构进行建模的模型。它利用图结构来表示代码中的函数调用关系、变量依赖等信息,并通过图变换学习代码实体间的复杂关系。这种模型在分析复杂的代码库和大型软件项目时尤其有用,可以有效地识别出那些需要重点关注的安全漏洞。微调(fine-tuning)是机器学习中的一个概念,指的是在预训练模型的基础上,使用少量特定任务的数据进行训练,以适应新的任务。微调可以让模型在保持原有知识的基础上,快速学习到新任务的特点。在漏洞检测...
CSDN技术社区
项目地址:https://gitcode.com/gh_mirrors/co/CodeBERT 项目介绍 CodeBERT 是由微软开发的一个预训练模型,专门用于编程语言和自然语言的处理。它是基于多编程语言的模型,预训练在自然语言和编程语言(NL-PL)对上,支持六种编程语言:Python、Java、JavaScript、PHP、Ruby 和 Go。CodeBERT 的主要目标是改进代码搜索、代码文档生成等下游任务的性能。项目快速启动 安装依赖 首先,确...
搜狐网
CuBERT,即 Code Understanding BERT,和后面提到的 CodeBERT 可被归为同一个时期的工作,虽是首个提出 Code 预训练模型的工作,但和 CodeBERT 相比,其影响力较小(在写这篇文章的时候 CuBERT 引用还没过百),具体原因个人认为是它仅对 Python 语言进行建模(CodeBERT 同时对 6 种编程语言建模),且它的下游任务和
CSDN技术社区
《GraphCodeBERT:Pre-training Code Representations with Data Flow》ICLR 2021(TH-CPL A会,公认顶会,但未上 CCF 榜)作者部分与 CodeBERT 重叠,主要来自 MSRA Intern 和 MSRA 研究员,学生来自国内多个顶尖高校。资源:code|pdf 相关资源:tree-sitter Abstract 之前的模型(eg.CodeBERT
cnblogs.com
故:对引用求地址,就是对目标变量求地址。ra 与&a; 相等。(6)不能建立数组的引用。因为数组是一个由若干个元素所组成的集合,所以无法建立一个数组的别名。引用应用 1、引用作为参数 引用的一个重要作用就是作为函数的参数。以前的 C 语言中函数参数传递是值传递,如果有大块数据作为参数传递的时候,采用的方案往往是指针,因为这样可以避免将整块数据全部压栈,可以提高程序的效率。但是现在(C++ 中)又增加了一种同样有效率的选择...
m.bilibili.com
1.引用(reference)1.1 基础使用 引用就是某个变量或常量的别名,对引用进行操作与操作原变量或常量完全相同。1.2 特性l 可以改变引用变量的值,但是不能再次成为其他变量的引用。l 声明引用时,必须初始化。l 声明引用时,初始化的值不能为NULL。l 声明引用时,初始化的值可以是纯数值,但是此时引用需要使用const修饰,表示常...
stepfun.com
... 引用次数超过10000 次,持有专利20 余项。凭借构建多语言多模态预训练基础 ... 段楠CodeBERT GraphCodeBERT UniXcoder 代码智能微软亚洲研究院. 网易. 段楠与团队 ...
mittrchina.com
截止目前,他已发表学术论文100 余篇,Google Scholar 被引用次数超过10000 次,持有专利20 余项。凭借构建多语言多模态预训练基础模型,探索基于基础模型的 ...
microsoft.com
引用次数超过10000 次,持有专利20 余项。凭借构建多语言. 多模态预训练基础模型,探索基于基础模型的复杂任务推理. 和任务完成机制,推动通用型人工智能技术的发展,段楠成为.