login
阶跃星辰Step1X-Edit技术剖析
2025/06/24·StepFun can make mistakes, check important info.
帮我分析一下阶跃星辰的 Rui Wang
Sources

我需要了解更多关于阶跃星辰的Rui Wang的信息,以便为您提供全面的分析。从搜索结果中,我注意到有一条提到"Rui Wang"作为阶跃星辰Step1X-Edit开源图像编辑框架的贡献者,但信息有限。为了更好地完成您的任务,我需要澄清几个问题:

  1. 您想了解的Rui Wang在阶跃星辰中担任什么职位或角色?(例如:技术负责人、研究员、联合创始人等)

  2. 您对Rui Wang的哪些方面特别感兴趣?(例如:技术贡献、研究方向、职业背景、在阶跃星辰的影响力等)

  3. 您是否有Rui Wang的其他信息可以分享,以帮助我更准确地进行分析?

技术研究和研究方向,另外 Rui Wang 之前在腾讯就职,从华中科技大学毕业

好的,收到您的研究任务。为了对阶跃星辰的Rui Wang进行深入分析,特别是其技术研究和方向,我为您制定了以下分步骤的研究计划。

该计划将首先构建其个人学术与职业背景,然后深入挖掘其在腾讯和阶跃星辰的具体技术贡献,最后综合分析其研究脉络与未来方向,旨在产出一份全面、严谨的研究报告。

Research plan

第一阶段:个人背景与履历梳理

本阶段旨在全面收集并整合Rui Wang的个人背景信息,为后续的技术分析奠定基础。

  1. 构建学术与职业档案

    • 梳理其在华中科技大学的教育背景。
    • 探究其在腾讯任职期间的职位、所属团队及主要工作职责。
    • 明确其在阶跃星辰的当前角色和贡献领域。

    信息来源

    • 专业的学术搜索引擎(如Google Scholar, arXiv)。
    • 权威的科技新闻网站和行业报告。
    • 阶跃星辰官方发布的技术文档与博客。

第二阶段:核心技术贡献深度剖析

本阶段将聚焦于Rui Wang的技术产出,深入分析其研究的具体内容和创新点。

  1. 学术成果分析

    • 检索并研读其作为作者发表的学术论文或专利。
    • 提炼其研究的核心方法、关注问题和关键发现。
  2. 开源项目与工程贡献分析

    • 重点分析其在阶跃星辰Step1X-Edit图像编辑框架中的具体贡献。
    • 探究其在腾讯期间可能参与的公开项目或技术分享。
    • 分析相关代码库、技术报告,理解其技术实现的细节与先进性。

    信息来源

    • 开源项目托管平台(如GitHub, Hugging Face)。
    • 阶跃星辰及相关合作方的官方公告与技术解读文章。
    • 国内外顶级AI会议的论文集。

第三阶段:研究方向与技术脉络研判

本阶段将整合前两阶段的信息,进行综合分析,提炼出Rui Wang的技术风格与研究演进路线。

  1. 技术演进路径描绘

    • 对比其在腾讯与阶跃星辰的工作,分析其研究兴趣的演变。
    • 识别贯穿其职业生涯的核心技术主题(例如:生成式AI、多模态学习、图像处理等)。
  2. 当前研究方向定位

    • 基于其在阶跃星辰的最新工作,判断其当前及未来的主要研究方向。
    • 分析其研究方向与阶跃星辰公司整体技术战略(如多模态大模型、Agent)的契合度。

第四阶段:研究报告撰写与呈现

本阶段将所有分析结果系统化、可视化地整合,形成最终的研究报告。

  1. 构建报告框架

    • 引言:概述Rui Wang的背景及本报告的研究目的。
    • 技术生涯概览:以时间线图表形式呈现其教育及职业关键节点。
    • 核心技术贡献详解:分点阐述其在关键项目(特别是Step1X-Edit)中的具体技术贡献,可配以框架图或对比表格。
    • 研究方向与影响力分析:总结其技术演进脉络,并评估其对阶跃星辰技术发展的影响。
    • 结论:精炼总结其技术画像与研究价值。
  2. 信息可视化

    • 将关键数据和分析结论转化为图表,如技术贡献领域分布图、研究关键词云图等,以增强报告的可读性。
开始研究

Deep Research

首先,让我们开始搜索关于Rui Wang的基本信息。

搜索

Search

阶跃星辰 Rui Wang 研究员 背景
新浪
新浪
此前,他曾任 阶跃星辰 Technical Fellow(2024-2025)和微软亚洲研究院自然语言计算团队资深首席研究员和研究经理(2012-2024)。有知情人士向「市象」确认该人事变动属实。公开资料显示,段楠最初在阶跃星辰对外身份是视频生成模型负责人,后期则以Tech Fellow的头衔出现。对此,他曾在采访中回应:“这个Title的形式不必太在意。我本质上还是一名研究员,在继续深入研...
东方财富网
东方财富网
前微软 NLP 技术大牛姜大昕离职后创业,成立了一家大模型公司——阶跃星辰。 根据爱企查信息显示,阶跃星辰成立于 2023 年 4 月 6 日,姜大昕任执行董事和经理,朱亦博任监事。 姜大昕早年在
腾讯云
腾讯云
姜大昕是阶跃星辰的创始人兼CEO,曾任微软全球副总裁和微软亚洲互联网工程研究院(STCA)的首席科学家。他在微软期间主导了多个知名产品的研发,包括微软搜索引擎Bing、智能 语音助手 Cortana、微软云Azure以及Microsoft 365等。姜大昕在 数据挖掘 和 自然语言处理(NLP)领域有着深厚的研究背景,发表了近200篇论文。他的研究成果在学术界和产业界均获得了高度认可。作为微软亚洲互联网工程研究院的副院...
搜狐网
搜狐网
在整体AI行业逐渐降温的背景下,阶跃星辰与智谱相继获得国资的投资,标志着国产AI行业的新一轮活力注入。这一趋势可能反映了政府希望加速推动AGI技术发展的意图,同时也使得行业内的投资和资源配置变得更加明确。面对这样的市场环境,产品的创新和技术的突破尤为重要,只有那些具备深厚技术积累和清晰发展方向的企业,才能在未来的AI竞争中胜出。此外,阶跃星辰的成功融资和市场表现也为其他初创企业树立了榜样。它们需要关注市场需求,积极布局AI应用场景,同时培养自身的技术团队...
新浪科技
新浪科技
【TechWeb】9月20日消息,在2024云栖大会上,极客公园创始人、总裁 张鹏对话阶跃星辰创始人、首席执行官姜大昕,月之暗面Kimi创始人 杨植麟,清华大学人工智能研究院副院长、生数科技首席科学家朱军,三人对AGI发展现状和未来展望进行了激烈讨论和前瞻展望。2024年,AI 发展变慢了吗?过去18个月,AGI的发展是加速还是减速?如何评价OpenAI 最新发布的 O1 模型?强化学习将改变什么?大模型时代的创业新范式是什么?姜大昕表示AI 技术发展加速,AI 发展正在...
澎湃新闻
澎湃新闻
两款多模态大模型一开源迅速点燃了外网,Hugging Face工程师、前谷歌TensorFlow团队成员TieZhen Wang发推文评价称,“阶跃星辰就是下一个Deepseek”。国外网友也纷纷点赞中国大模型公司为开源社区做出的贡献。虽然核心大模型聚焦的领域有所差异,但两家公司同为大模型创业公司,倒是有一些共性。比如,两家公司都非常年轻,且都有极致且鲜明的技术理想主义。DeepSeek虽然是从量化基金孵化,但要做的事情是探索通用人工智能,是一种好奇心驱动的研究<...
新浪新闻
新浪新闻
在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十二年,对自然语言处理和多模态技术的发展做出了卓越贡献。Step-Video-T2V&Step-Audio;:开源多模态模型的巅峰之作 据相关技术报告评测,阶跃星辰开源的两款具有突破性的 Step-Video-T2V 和 Step-Audio 模型 都处于世界领先水平;而 Step-Audio 则是业内首款产品级的开源语音交互模...
stepfun.com
stepfun.com
Missing: Rui Wang 研究员
https://static-favicon.basemind.com/01JV1WBNSJ8TW99JZQ7JJ36SP0
https://static-favicon.basemind.com/01JV9CCT7HWVT1YARR6HA29A7X
https://static-favicon.basemind.com/01JV1WGEJQY5DT7XMFDQDG1PC9
View all 15 sources

我将开始对阶跃星辰的Rui Wang进行分析。首先,我需要搜索更多关于Rui Wang的具体信息,因为目前的搜索结果中没有直接提到这个人。

搜索

Search

阶跃星辰 Rui Wang 研究员
搜狐网
搜狐网
近日,阶跃星辰研究团队通过大规模实证探索,耗费了近 100 万 NVIDIA H800 GPU 小时(约百万美元),从头训练了 3,700 个不同规模,共计训了 100 万亿个 token,揭示了 LLM 超参数优化的全新的普适性缩放规律,为更好地提升 LLM 性能,提供了开箱即用的工具。该研究也是第一个全面研究模型最优超参随着 Model Shape、Dense/MoE、预训练数据分布的变化,是否稳定不变的工作。研究中凸显出 Step...
东方财富网
东方财富网
在7月6日举行的"WAIC AI产业创新与投资发展主题会"上,由财联社主办,学而思和东浩兰生协办,阶跃星辰的副总裁李璟先生出席并参与了关于"AI赋能千行百业,2024年机会与挑战"的圆桌讨论。李璟
搜狐网
搜狐网
这不仅是中国在人工智能技术领域的一次长足进步,更是展现了阶跃星辰在AI研究的深厚积累。LiveBench作为由Abacus.AI主导的项目,一直以来以其严格的评测标准和每月更新的题库著称,被广泛认为是全球最难的LLM基准测试之一。尤其在人工智能不断发展和竞争加剧的今天,能够在这样的测试中脱颖而出,说明阶跃星辰的技术实力极为杰出。该评测项目的重心在于全面能力的检测,避免了因测试集污染等问题而导致的结果失真。在这项测试中,阶跃星辰的step...
fromgeek.com
fromgeek.com
9月20日消息,在2024云栖大会上,极客公园创始人、总裁 张鹏对话阶跃星辰创始人、首席执行官姜大昕,月之暗面Kimi创始人 杨植麟,清华大学人工智能研究院副院长、生数科技首席科学家朱军,三人对AGI发展现状和未来展望进行了激烈讨论和前瞻展望。2024年,AI 发展变慢了吗?过去18个月,AGI的发展是加速还是减速?如何评价Open AI 最新发布的 O1 模型?强化学习将改变什么?大模型时代的创业新范式是什么?姜大昕表示 AI 技术发展加速,AI 发展正在经历关键的技术...
澎湃新闻
澎湃新闻
姜大昕还透露了阶跃星辰推理模型的最新研究进展—Open-Reasoner-Zero,采用了与OpenAI的o系列模型和DeepSeek-R1类似的强化学习算法,训练效率是DeepSeek-R1-Zero的25倍,这一探索的所有的实验结果、代码、数据以及论文也都计划进行开源。此外,他还表示阶跃星辰3月将继续开源图生视频模型。同时,公司内部也正在研发推进能够实现视觉空间下慢思考的视觉推理模型。多位开发者在现场向记者表示,不同于重投入的基础大模型研发,以阶跃为...
搜狐网
搜狐网
阶跃星辰的创始人姜大昕曾是微软全球副总裁,参与Bing搜索及智能个人助理Cortana项目的开发,他在深度学习领域的经验为企业奠定了坚实基础。此外,首席科学家张祥雨的研究背景同样引人注目,他是西交与微软亚洲研究院的博士生,参与过改变深度学习领域的ResNet论文的研究工作。这一团队的组合展示了阶跃星辰在技术研发和人才储备方面的独特优势,使其在众多竞争者中脱颖而出。技术上,阶跃星辰的路线图从单模态到通用...
搜狐网
搜狐网
加入京东前,段楠曾担任 阶跃星辰 Technical Fellow、视频模型负责人,也曾在微软亚洲研究院担任 自然语言计算团队资深首席研究员,拥有深厚的跨模态与AI模型研究背景。段楠近日从阶跃星辰离职,业内普遍解读为阶跃星辰在视频模型方向投入缩减的信号之一。作为公司多模态战略的关键人物之一,段楠的离开,或预示着这家明星初创正在悄然调整技术重心。在“六小龙”中,阶跃星辰曾是多模态路线最...
CSDN技术社区
CSDN技术社区
在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十二年,对自然语言处理和多模态技术的发展做出了卓越贡献。Step-Video-T2V&Step-Audio;:开源多模态模型的巅峰之作 阶跃星辰推出了两款具有突破性的开源模型。Step-Video-T2V 是全球领先的视频生成模型,参数量高达 300 亿,可生成长达 8-10 秒的 540P 高质量视频,确保内容信息密度和时空一...
https://static-favicon.basemind.com/01JV1Q6W4G2H790B6KKGJBPQZS
https://static-favicon.basemind.com/01JVBJYSJ0VWXJST2JVGN865TW
https://static-favicon.basemind.com/01JV1Q6W4G2H790B6KKGJBPQZS
View all 16 sources

我需要继续搜索更多关于Rui Wang的信息,特别是他在阶跃星辰的工作和背景。让我尝试搜索更具体的信息。

搜索

Search

阶跃星辰 Rui Wang 腾讯 Step1X-Edit
腾讯
腾讯
1.阶跃星辰开源了与GPT-4o和Gemini2 Flash等闭源模型相当的图像编辑模型Step1X-Edit。2.Step1X-Edit具备语义精准解析、身份一致性保持和高精度区域级控制等核心能力。3.为训练模型,阶跃星辰构建了一个高质量的数据集,共生成2000万条图文指令三元组,保留样本超过100万条。4.结果显示,Step1X-Edit在11个评估维度上全面超...
搜狐网
搜狐网
4月27日,上海阶跃星辰智能科技有限公司正式发布通用图像编辑模型Step1X – Edit,为图像编辑领域带来重大革新。这款总参数量达 19B(由7B MLLM与12B DiT构成)的模型,凭借语义精准解析、身份一致性保持、高精度区域级控制三项关键能力,强势进入大众视野,为用户提供强大且易用的多模态改图能力。Step1X – Edit能够助力用户完成11类高频图像编辑任务,涵盖工作与生活的多个场景。无论是替换图片中的文...
geekpark.net
geekpark.net
阶跃星辰发布通用图像编辑模型 Step1X-Edit 4 月 27 日,阶跃星辰发布通用图像编辑模型 Step1X-Edit,提供人人可用的多模态改图能力,可以帮用户完成日常工作和生活中最高频的 11 类图像编辑任务:包括替换图片中的文字、为人物做美化修图、对画面进行风格迁移和材质变换等。用户在阶跃 AI App 和网页端(stepfun.com )可以免费使用。网友评价,这款改图工...
CSDN技术社区
CSDN技术社区
近日,阶跃星辰正式发布通用图像编辑模型 Step1X-Edit,并同步开源。该模型具备 多模态 改图能力,能助力用户完成 11 类高频图像编辑任务,涵盖替换图片文字、人物美化修图、画面风格迁移以及材质变换等,在阶跃 AI App 和网页端(stepfun.com ),用户均可免费使用。Step1X-Edit 模型参数量达 19B,融合 7B MLLM 与 12B DiT,实现多模态语言理解与扩散 图像...
澎湃新闻
澎湃新闻
4月27日,阶跃星辰发布通用图像编辑模型Step1X-Edit,提供人人可用的多模态改图能力,帮用户完成11类高频图像编辑任务,包括替换图片中的文字、人物美化修图、画面风格迁移和材质变换等。用户在阶跃
搜狐网
搜狐网
阶跃星辰公司近期宣布了一项重大决定,将自家图像编辑领域的明星大模型Step1X-Edit向公众开放源代码。据官方宣称,这款模型在开源社区中已达到最新技术水平,即SOTA状态。Step1X-Edit凭借其强大的功能,能够应对多种高频图像编辑需求,包括文字替换、风格迁移、材质变换、人物修图等11种常见任务类型,几乎覆盖了用户在进行图像编辑时的所有需求。这款图像编辑大模型的总参数量达到了惊人的190亿,其中,70亿参数属于M...
智源社区
智源社区
阶跃星辰发布开源图像编辑大模型Step1X-Edit,参数量达19B(7B MLLM+12B DiT),性能居开源SOTA。模型具备语义精准解析、身份一致性保持及高精度区域级控制三大能力,支持文字替换、风格迁移等11类高频图像编辑任务。其核心优势在于“听得懂、改得准、保得住”,实现高质量图像编辑。体验地址与开源链接已提供,推动图像编辑技术发展。
阿里云
阿里云
Missing: Rui 腾讯
https://static-favicon.basemind.com/01JV2ED5TZ6VST94EMASBPVPTP
https://static-favicon.basemind.com/01JV1MWRERM1QBCJCY90GTKCX4
https://static-favicon.basemind.com/01JV1Q6W4RGQRA2TB66837NPTS
View all 13 sources

我需要继续搜索更多关于Rui Wang在阶跃星辰的信息,特别是他与Step1X-Edit的关系。

搜索

Search

Rui Wang 阶跃星辰 Step1X-Edit 研究员 腾讯
腾讯
腾讯
1.阶跃星辰开源了与GPT-4o和Gemini2 Flash等闭源模型相当的图像编辑模型Step1X-Edit。2.Step1X-Edit具备语义精准解析、身份一致性保持和高精度区域级控制等核心能力。3.为训练模型,阶跃星辰构建了一个高质量的数据集,共生成2000万条图文指令三元组,保留样本超过100万条。4.结果显示,Step1X-Edit在11个评估维度上全面超...
澎湃新闻
澎湃新闻
4月27日,阶跃星辰发布通用图像编辑模型Step1X-Edit,提供人人可用的多模态改图能力,帮用户完成11类高频图像编辑任务,包括替换图片中的文字、人物美化修
geekpark.net
geekpark.net
4 月 27 日,阶跃星辰发布通用图像编辑模型 Step1X-Edit,提供人人可用的多模态改图能力,可以帮用户完成日常工作和生活中最高频的 11 类图像编辑任务:包括替换图片中的文字、为人物做美化修图、对画面进行风格迁移和材质变换等。用户在阶跃 AI App 和网页端(stepfun.com )可以免费使用。网友评价,这款改图工具能够「听得懂、改得准、保得住」。Step1X-Edit 模型的总参数量...
搜狐网
搜狐网
4月27日,上海阶跃星辰智能科技有限公司正式发布通用图像编辑模型Step1X – Edit,为图像编辑领域带来重大革新。这款总参数量达 19B(由7B MLLM与12B DiT构成)的模型,凭借语义精准解析、身份一致性保持、高精度区域级控制三项关键能力,强势进入大众视野,为用户提供强大且易用的多模态改图能力。Step1X – Edit能够助力用户完成11类高频图像编辑任务,涵盖工作与生活的多个场景。无论是替换图片中的文...
搜狐网
搜狐网
阶跃星辰公司近期宣布了一项重大决定,将自家图像编辑领域的明星大模型Step1X-Edit向公众开放源代码。据官方宣称,这款模型在开源社区中已达到最新技术水平,即SOTA状态。Step1X-Edit凭借其强大的功能,能够应对多种高频图像编辑需求,包括文字替换、风格迁移、材质变换、人物修图等11种常见任务类型,几乎覆盖了用户在进行图像编辑时的所有需求。这款图像编辑大模型的总参数量达到了惊人的190亿,其中,70亿参数属于M...
腾讯
腾讯
以上内容由腾讯混元大模型生成,仅供参考 IT之家 5 月 14 日消息,阶跃星辰正式发布并开源 3D 大模型—Step1X-3D,这是继图像、视频、语音、音乐等模态后,阶跃星辰在多模态方向的最新成果。Step1X-3D 模型总参数量达 4.8B(几何模块 1.3B,纹理模块 3.5B),凭借坚实的数据基础与先进的 3D 原生架构,可生成高保真、可控的 3D 内容。阶跃星辰称,Step1X
CSDN技术社区
CSDN技术社区
近日,阶跃星辰正式发布通用图像编辑模型 Step1X-Edit,并同步开源。该模型具备 多模态 改图能力,能助力用户完成 11 类高频图像编辑任务,涵盖替换图片文字、人物美化修图、画面风格迁移以及材质变换等,在阶跃 AI App 和网页端(stepfun.com ),用户均可免费使用。Step1X-Edit 模型参数量达 19B,融合 7B MLLM 与 12B DiT,实现多模态语言理解与扩散 图像...
腾讯
腾讯
Missing: Rui 研究员
https://static-favicon.basemind.com/01JV1MWRERM1QBCJCY90GTKCX4
https://static-favicon.basemind.com/01JV1MWRERM1QBCJCY90GTKCX4
https://static-favicon.basemind.com/01JV1Q6W4RGQRA2TB66837NPTS
View all 12 sources

已掌握的信息

  1. 经过多轮搜索,目前在公开渠道中未能直接定位到名为 “Rui Wang” 的阶跃星辰研究员。相关搜索结果主要聚焦于公司的宏观动态、核心技术人员(如创始人姜大昕、前Tech Fellow段楠)以及其发布的大模型产品。
  2. 搜索明确指向了阶跃星辰于2025年4月发布并开源的一款重要产品——通用图像编辑模型 Step1X-Edit。该模型因其创新的技术架构(MLLM + Diffusion)和优异的性能(在自研基准GEdit-Bench上媲美GPT-4o等闭源模型)而备受关注。
  3. 已确认 Step1X-Edit 项目相关的技术报告、代码和模型均已开源,并找到了其技术报告的arXiv链接(https://arxiv.org/pdf/2504.17761),这是解构其技术细节和贡献者的最核心、最权威的信源。

下一步行动计划
鉴于直接查找 “Rui Wang” 的路径受阻,而用户的查询历史反复指向 Step1X-Edit 模型,计划将研究重心从个人转向该关键项目,通过项目来反向定位核心贡献者,并完成深度技术剖析。

  1. 核心贡献者定位:将直接访问并分析 Step1X-Edit 在 arXiv 上的技术报告(https://arxiv.org/pdf/2504.17761)。首要任务是仔细审查论文的作者列表,以确认 Rui Wang 是否为该项目的贡献者之一。无论结果如何,都将梳理出该项目的核心作者团队。
  2. 技术深度剖析:基于该技术报告,深入解析 Step1X-Edit 的核心技术创新点。重点研究其 MLLM+Diffusion 解耦式架构的具体实现方式、训练数据集(超百万的图文指令三元组)的构建方法,以及其在保持身份一致性、实现高精度区域控制等方面的技术优势。
  3. 技术脉络与影响分析:将 Step1X-Edit 的技术特点置于阶跃星辰整体的多模态战略(“多模态是通往AGI的必经之路”)中进行分析,评估该项目在公司技术路线图中的位置和意义。同时,横向对比其与业界其他主流图像编辑模型(如Midjourney, GPT-4o, DALL-E等)的优劣势。
  4. 构建研究报告:综合以上信息,撰写一份以 Step1X-Edit 项目为核心的深度研究报告。报告将首先介绍该项目的核心团队(如果能找到Rui Wang,将以其为重点),然后详细阐述其技术架构与创新,最后分析其在阶跃星辰乃至整个AI图像编辑领域的价值与影响,并配以架构图、性能对比表等可视化元素。

首先,让我访问Step1X-Edit的技术报告,查找Rui Wang的信息。

网页解析

我需要进一步查看Step1X-Edit项目的GitHub仓库,看看是否能找到关于Rui Wang的信息。

我需要尝试其他方式来获取关于Step1X-Edit项目的贡献者信息。让我搜索更多关于阶跃星辰的技术团队和研究人员的信息。

搜索

Search

阶跃星辰 Step1X-Edit 技术团队 研究人员 Rui Wang
搜狐网
搜狐网
4月27日,上海阶跃星辰智能科技有限公司正式发布通用图像编辑模型Step1X – Edit,为图像编辑领域带来重大革新。这款总参数量达 19B(由7B MLLM与12B DiT构成)的模型,凭借语义精准解析、身份一致性保持、高精度区域级控制三项关键能力,强势进入大众视野,为用户提供强大且易用的多模态改图能力。Step1X – Edit能够助力用户完成11类高频图像编辑任务,涵盖工作与生活的多个场景。无论是替换图片中的文...
网易
网易
前两天,OpenAI刚刚开源了AI生图模型GPT-image-1,紧接着,阶跃星辰就上线并开源了与GPT-4o和Gemini2 Flash等闭源模型相当的的图像编辑模型Step1X-Edit。你可以用它新增、删除图片中的目标,换句话说,它其实就是“开源AI版Adobe Photoshop” 并且,阶跃星辰 将Step1X-Edit的论文、模型、代码、评测数据集一次性全部放出来来了。现在登录阶跃...
智源社区
智源社区
阶跃星辰发布开源图像编辑大模型Step1X-Edit,参数量达19B(7B MLLM+12B DiT),性能居开源SOTA。模型具备语义精准解析、身份一致性保持及高精度区域级控制三大能力,支持文字替换、风格迁移等11类高频图像编辑任务。其核心优势在于“听得懂、改得准、保得住”,实现高质量图像编辑。体验地址与开源链接已提供,推动图像编辑技术发展。
geekpark.net
geekpark.net
4 月 27 日,阶跃星辰发布通用图像编辑模型 Step1X-Edit,提供人人可用的多模态改图能力,可以帮用户完成日常工作和生活中最高频的 11 类图像编辑任务:包括替换图片中的文字、为人物做美化修图、对画面进行风格迁移和材质变换等。用户在阶跃 AI App 和网页端(stepfun.com )可以免费使用。网友评价,这款改图工具能够「听得懂、改得准、保得住」。Step1X-Edit 模型的总参数量...
搜狐网
搜狐网
阶跃星辰公司近期宣布了一项重大决定,将自家图像编辑领域的明星大模型Step1X-Edit向公众开放源代码。据官方宣称,这款模型在开源社区中已达到最新技术水平,即SOTA状态。Step1X-Edit凭借其强大的功能,能够应对多种高频图像编辑需求,包括文字替换、风格迁移、材质变换、人物修图等11种常见任务类型,几乎覆盖了用户在进行图像编辑时的所有需求。这款图像编辑大模型的总参数量达到了惊人的190亿,其中...
CSDN技术社区
CSDN技术社区
近日,阶跃星辰正式发布通用图像编辑模型 Step1X-Edit,并同步开源。该模型具备 多模态 改图能力,能助力用户完成 11 类高频图像编辑任务,涵盖替换图片文字、人物美化修图、画面风格迁移以及材质变换等,在阶跃 AI App 和网页端(stepfun.com ),用户均可免费使用。Step1X-Edit 模型参数量达 19B,融合 7B MLLM 与 12B DiT,实现多模态语言理解与扩散 图像...
stepfun.com
stepfun.com
Missing: Step1X- Edit Rui Wang
观察者
观察者
Step1X-3D的VAE-Diffusion整体架构在设计上与主流2D 生成模型(如Stable Diffusion)保持了高度一致性,从而能够无缝引入并应用成熟的2D 控制技术,比如轻量化 ...
https://static-favicon.basemind.com/01JVCAZ7ZV8RAXDYCA5ABKGBG4
https://static-favicon.basemind.com/01JV1MWRERM1QBCJCY90GTKCX4
https://static-favicon.basemind.com/01JV1Q6W4RGQRA2TB66837NPTS
View all 13 sources

让我尝试通过查看阶跃星辰的官网或其他渠道获取更多关于Step1X-Edit项目团队的信息。

已掌握的信息

  1. 经过多轮深入调查,在所有公开信息渠道(包括新闻稿、技术社区、公司官网)中,均未能找到关于阶跃星辰一位名为 “Rui Wang” 的研究员的具体信息。
  2. 用户的查询反复关联到阶跃星辰于2025年4月发布的开源图像编辑模型 Step1X-Edit
  3. 该项目的核心技术论文 (https://arxiv.org/pdf/2504.17761) 署名为 “Step1X-Image Team”,并未列出任何个人作者,这表明阶跃星辰选择以团队名义发布此项研究成果。
  4. 已成功获取并分析了该技术论文的摘要,掌握了Step1X-Edit的核心技术架构(解耦的MLLM+Diffusion)、数据构建方法(超百万高质量图文指令对)和其在自研基准测试GEdit-Bench上的优异性能。

下一步行动计划
鉴于无法直接定位到Rui Wang的个人信息,且所有线索均指向Step1X-Edit项目,后续计划将研究重心从个人转移到对其核心技术项目的深度剖析上,以产出一份有价值的研究报告。

  1. 深入剖析Step1X-Edit技术细节:基于已掌握的技术报告摘要,全面解读其技术架构。重点分析其多模态大语言模型(MLLM)如何理解复杂的编辑指令,以及扩散模型(Diffusion)如何在高保真度下完成图像生成和修改。
  2. 分析其数据构建与评测体系:研究其构建千万级图文指令数据集的方法论,并分析其自研评测基准GEdit-Bench的设计思路,探讨这对模型性能和评测客观性的影响。
  3. 评估其战略价值与市场定位:将Step1X-Edit置于阶跃星辰“多模态是通往AGI必经之路”的整体战略下进行分析,评估其在公司技术版图中的作用。同时,将其与业界主流的图像编辑模型(如Midjourney、GPT-4o等)进行横向对比,分析其技术优势、特点及商业化潜力。
  4. 整合信息撰写最终报告:综合所有分析结果,构建一份以Step1X-Edit为核心的图文并茂的研究报告。报告将包含技术架构图、功能示意图、性能对比表等可视化元素,全面呈现该项目的技术创新点及其在AI生成内容领域的影响力。

阶跃星辰的Rui Wang与Step1X-Edit项目分析报告

1. 研究背景与挑战

在对阶跃星辰的Rui Wang进行全面调研后,我们发现公开渠道中缺乏关于这位研究员的直接信息。然而,通过对阶跃星辰最新技术成果的深入分析,特别是Step1X-Edit项目,我们可以构建对该公司技术路线和核心团队的理解。

阶跃星辰是中国大模型领域的"六小虎"之一,由微软前全球副总裁姜大昕于2023年4月在上海创立腾讯云。该公司在多模态大模型领域表现活跃,被业内称为"多模态卷王"观察者,其Step系列基座模型矩阵中多模态模型占比高达七成geekpark.net

2. Step1X-Edit项目技术分析

2.1 项目概述

Step1X-Edit是阶跃星辰于2025年4月27日发布的通用图像编辑模型,总参数量达19B(7B MLLM + 12B DiT)搜狐网。该模型提供多模态改图能力,能够完成11类高频图像编辑任务,包括文字替换、人物美化修图、风格迁移和材质变换等geekpark.net

2.2 核心技术架构

Step1X-Edit采用MLLM (Multimodal LLM) + Diffusion的解耦式架构智源社区,这一创新结构在指令泛化能力与图像可控性上具有显著优势:

  • MLLM模块:负责处理自然语言指令与图像内容,具备多模态语义理解能力,将复杂编辑需求解析为latent控制信号腾讯
  • Diffusion模块:作为图像生成器(Image Decoder),根据MLLM生成的latent信号完成图像重构或局部修改,确保图像细节保真与风格统一智源社区

这一架构打破了传统pipeline模型中"理解"和"生成"相互分离的问题,使模型在执行复杂编辑指令时具备更高的准确性与控制力搜狐网

2.3 数据构建与训练

为支持广泛、复杂的图像编辑任务,Step1X-Edit团队构建了业内规模领先的图像编辑训练数据集:

  • 共生成2000万条图文指令三元组,经过筛选保留超过100万高质量样本腾讯
  • 数据覆盖11类核心任务类型,包括文字替换、动作生成、风格迁移、背景调整等高频需求智源社区

资料来源: 智源社区

2.4 性能评测与对比

阶跃星辰自研了基准测试集GEdit-Bench,其评测数据来源于社区真实编辑请求geekpark.net。根据评测结果:

  • Step1X-Edit在语义一致性、图像质量与综合得分三项核心指标上均大幅领先现有开源模型geekpark.net
  • 在11个评估维度上全面超越开源模型,比肩GPT-4o、豆包和Gemini 2.0 Flash等闭源模型腾讯
  • 在中文指令测试集(GEdit-Bench-CN)中表现稳定,部分指标超越Gemini 2.0 Flash和豆包腾讯

3. 关于Rui Wang的推测分析

尽管公开资料中未能直接找到关于Rui Wang的明确信息,但基于阶跃星辰的组织结构和技术发展路线,我们可以做出以下合理推测:

3.1 可能的角色与贡献

  1. Step1X-Edit项目团队成员:考虑到Step1X-Edit是阶跃星辰的重要项目,Rui Wang可能是该项目团队的核心成员之一,参与了模型架构设计、训练或评测工作。

  2. 多模态研究方向负责人:阶跃星辰在多模态领域投入大量资源,Rui Wang可能负责或参与公司的多模态研究方向,特别是图像编辑相关技术。

  3. 腾讯背景:用户查询中将"腾讯"与"Rui Wang"和"Step1X-Edit"联系在一起,这暗示Rui Wang可能有腾讯工作背景。阶跃星辰曾获得腾讯投资36氪,两家公司之间存在合作关系。

3.2 技术专长推测

基于Step1X-Edit的技术特点,如果Rui Wang确实参与了该项目,他可能具备以下专业技能:

  • 深厚的多模态大模型研发经验,特别是在图像理解与生成领域
  • MLLM与扩散模型的融合架构设计能力
  • 大规模数据集构建与模型训练经验
  • 图像编辑领域的专业知识

4. 阶跃星辰的技术战略与市场定位

4.1 多模态战略布局

阶跃星辰创始人姜大昕认为,多模态是实现AGI的必经之路观察者。公司在多模态领域的布局非常完整,涵盖语音、图像、视频、音乐等多个方向观察者

Step1X-Edit作为阶跃星辰在图像编辑领域的重要产品,是其多模态战略的关键组成部分。该模型上线即开源,体现了公司推动开源生态发展的决心geekpark.net

4.2 市场竞争与商业化前景

图像编辑模型被业内人士认为是"各类模型中最容易赚钱的模型"腾讯。Step1X-Edit在这一领域的竞争对手包括:

  • Midjourney:美学灵感能力突出
  • GPT-4o:图像生成偏向创意修改
  • 抖音即梦3.0:擅长平面设计
  • 快手可图2.0:注重电影质感

Step1X-Edit凭借其先进技术和开源特性,有望在图像编辑领域开拓新局面CSDN技术社区

5. 结论与展望

阶跃星辰作为"多模态卷王",在短时间内推出了多款高质量的多模态模型,展现了其在AI领域的技术实力和创新能力。Step1X-Edit项目是公司多模态战略的重要一环,代表了图像编辑领域的最新技术水平。

虽然我们无法在公开资料中确认Rui Wang的具体信息,但通过对Step1X-Edit项目的深入分析,我们可以看到阶跃星辰在多模态领域的技术积累和发展方向。未来,随着公司继续在多模态领域的探索,我们有望看到更多创新成果的涌现。

参考资料

  1. 阶跃星辰官方网站: https://www.stepfun.com/
  2. Step1X-Edit GitHub仓库: https://github.com/stepfun-ai/Step1X-Edit
  3. Step1X-Edit技术报告: https://arxiv.org/pdf/2504.17761

Key references