login
国产大模型上下文窗口长度对比
2025/07/31·StepFun can make mistakes, check important info.
国产模型现在哪个上下文最大
Sources

为了更好地帮您完成"国产模型现在哪个上下文最大"的调研报告,我需要了解几个关键信息:

  1. 您是否需要关注特定类型的国产大模型(如通用大模型、行业大模型、开源模型或闭源商业模型等)?

  2. 您希望报告中包含哪些方面的内容?例如:是否需要包含上下文窗口大小的技术原理、各模型上下文能力的对比、或实际应用场景等?

  3. 根据搜索结果,月之暗面的模型可能有200万字的上下文窗口,您是否希望我重点关注这类最新突破的模型信息?

关注目前最新的模型上下文长度情况,要国内大模型,排除国外模型,

好的,收到您的调研任务。

今天是2025年07月31日,星期四。根据您的任务“国产模型现在哪个上下文最大”,我将为您制定一个分步骤的总体研究计划。该计划旨在系统性地收集和分析信息,最终产出一份全面、准确的研究报告。

Research plan

国产大模型长上下文能力调研计划

第一阶段:信息搜集与初步验证
此阶段旨在广泛搜集关于国产大模型上下文窗口长度的最新信息。将系统性地检索和梳理各大科技公司、研究机构发布的最新模型及其技术规格。重点将放在验证现有信息(如月之暗面等模型的长文本能力),并发现其他潜在的领先模型。

第二阶段:关键信息提取与数据整理
将从搜集到的信息中,针对每个主流国产大模型,提取关键数据点,主要包括:

  • 模型名称
  • 研发机构/公司
  • 官方宣布的最大上下文窗口长度(并注明单位,如Token或字)
  • 发布或更新日期

随后,会将这些数据整理成一个结构化的列表或表格,以便进行横向对比。

第三阶段:数据对比分析与可视化呈现
基于整理好的数据,进行对比分析,以明确找出当前上下文窗口最大的国产模型。为了使对比结果更加直观清晰,将创建一个对比图表(如柱状图),可视化地展示不同模型在上下文长度上的表现。

第四阶段:研究报告撰写与整合
整合前述所有分析结果,撰写最终的研究报告。报告将包含以下核心部分:

  1. 核心结论:直接回答“当前哪个国产模型的上下文窗口最大”。
  2. 对比分析:通过图表和文字,详细展示主流国产大模型上下文能力的排名与差异。
  3. 背景概述:简要说明长上下文技术的重要性及其发展趋势。
  4. 信息来源附录:列出所有关键信息的来源,确保报告的权威性和可追溯性。

核心信息来源

为确保研究的准确性和时效性,信息搜集将优先参考以下几类权威渠道:

  1. 模型研发机构官方渠道:各大AI公司和研究机构的官方网站、技术博客、新闻稿及官方社交媒体账号。这是获取第一手、最准确模型参数信息的首选来源。
  2. 权威科技媒体:如36氪、量子位、机器之心、InfoQ等,这些媒体通常会及时报道和深度解读大模型领域的最新动态和技术突破。
  3. 学术与技术社区:如arXiv、GitHub、Hugging Face等平台,可以查找相关的技术论文、模型发布说明和开源社区的评测数据。
  4. 行业研究报告:由中国信通院等权威行业研究机构发布的产业发展报告或白皮书,以获取宏观的行业发展数据和趋势分析。
开始研究

Deep Research

现在开始执行第一阶段的信息搜集。

搜索

Search

2025年国产大模型 最大上下文窗口 排名
新华网
新华网
将大模型“装”进手机、融入供应链,带到办公室和生产线……开年以来,大模型应用加速落地。从百度文心大模型上线“深度搜索”功能,到三家基础电信企业全面接入DeepSeek开源大模型,近段时间,国产大模
中国计算机学会
在人工智能浪潮席卷全球的今天,“百模大战”已进入深水区,开源大模型正成为引领技术创新与产业变革的核心引擎。从追求更强的通用智能,到探索多模态融合的无限可能,再到实现百万级上下文窗口的突破,模型的每一次
新华网
新华网
... 大模型公共服务底座。”百度智能云解决方案架构师米磊介绍。 了解到沈阳人工智能产业园的消息,肖寒和他的同事果断选择让自己的企业也加入这里。肖寒 ...
新华网
新华网
新华社上海7月26日电(记者胡喆董雪)7月26日,中国科学院联合团队研发的“磐石·科学基础大模型”在2025世界人工智能大会上正式发布。“磐石·科学基础大模型”是采用专业 ...

我需要搜集更多关于国产大模型上下文窗口长度的具体信息。从已有搜索结果中,我看到了一些关于大模型的信息,但没有具体的上下文窗口长度数据。我将进行更精确的搜索。

搜索

Search

2025年 国产大模型 最大上下文窗口 排名 百万级
中国计算机学会
在人工智能浪潮席卷全球的今天,“百模大战”已进入深水区,开源大模型正成为引领技术创新与产业变革的核心引擎。从追求更强的通用智能,到探索多模态融合的无限可能,再到实现百万级上下文窗口的突破,模型的每一次
中国计算机学会
在人工智能浪潮席卷全球的今天,“百模大战”已进入深水区,开源大模型正成为引领技术创新与产业变革的核心引擎。从追求更强的通用智能,到探索多模态融合的无限可能,再到实现百万级上下文窗口的突破,模型的每一次
auto.gasgoo.com
auto.gasgoo.com
2025年,芯擎超越瑞萨、跻身行业前三几乎毫无悬念。届时这将进一步改写智能座舱芯片的市场格局,在国产芯片与国际巨头竞争的过程中留下重要一笔。芯擎科技以黑马之姿撬动座舱芯片新格局,瞄准市场对座舱芯片的高性能、高算力、高集成度和低功耗诉求,“龙鹰一号”在设计上采用了多核异构架构设计,内置8核CPU、14核GPU、8 TOPS 算力的独立NPU,以及双HiFi 5 DSP处理器,并集成了 ASIL-D 最高功能安全等级的独立安全岛。不仅如此,为充分满足数字仪表、HUD、4K高清...
新华网
新华网
* 中国科学院发布“磐石·科学基础大模型”; * 创新不止!中国AI驶向“深海”; * 我国大模型数量超1500个; * 让AI医生的智慧边界更加清晰. 06版:综合. * 人民 ...
新华网
新华网
... 大模型公共服务底座。 ... 2004年起开展SOFC陶瓷隔膜片的研发,2012年开始量产SOFC单电池,2017年开始向国内市场推出SOFC电堆,2022年国内首个百千瓦级SOFC发电 ...

我需要更具体地搜索国产大模型的上下文窗口长度信息。从之前的搜索结果中,我看到了一些关于百万级上下文窗口的提及,但没有具体的模型排名信息。让我尝试更精确的搜索。

搜索

Search

2025年 月之暗面 阶跃星辰 百度 智谱 讯飞 上下文窗口长度 对比
tianyancha.com
tianyancha.com
# 跃问-阶跃星辰 所属公司: 上海阶跃星辰智能科技有限公司 简介: 简介: 融资历程 0 核心成员 1 企业股东 2 企业业务 2 竞品信息 0 微信公众号 0 招聘信息 0 新闻舆情 37 ##
tianyancha.com
tianyancha.com
# 阶跃星辰 查看官网 AIGC AI大模型 软件开发 人工智能 人工智能通用应用 软件和信息技术服务业 信息传输、软件和信息技术服务业 所属公司: 上海阶跃星辰智能科技有限公司 成立日期: 2023

我需要更精确地搜索国产大模型的上下文窗口长度信息。让我尝试直接搜索具体的上下文窗口长度数据。

搜索

Search

2025年 国产大模型 上下文窗口长度 排名 百万token Kimi 文心一言 通义千问 星火
ce.cn
ce.cn
近期,OpenAI推出了最新的多模态人工智能大模型GPT-4o,标志着人工智能在多模态交互和实时反应方面迈出了重要一步。同时,国产汉字长文本大模型Kimi访问量迅速攀升,跃居国内首位。生成式人工智能大
ce.cn
ce.cn
近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描
gov.cn
大模型在投资领域有啥新探索?机器人怎样服务美好生活?8月25日,峰会现场的“智汇潮白·青创未来”青年创新创业思享会座无虚席。东泰佳尔(北京)文化发展有限公司创始人吕思墨,已是第三次参加峰会活动,身份也由参赛选手转变成评委、主持人。“峰会见证着创业人才的成长,通过这个平台,能结交更多国内外顶尖人才,在竞争合作中前行。吕思墨说。复刻宋代风格的耳环、运用珐琅工艺的戒指…一件件富含东方韵味的饰品光彩夺目,让回予首饰成为峰会上的人气展台。企业创始人刘纯说,公司获得今年创业大赛二等奖,开启销售业务仅半...

已掌握的信息

  1. 国内大模型领域在长上下文技术上竞争激烈,已进入“百万级”上下文窗口的时代。主要的参与者包括月之暗面、阶跃星辰、百度、阿里巴巴、智谱AI和科大讯飞等。
  2. 根据2024年3月的历史信息,月之暗面(Moonshot AI)的Kimi模型在当时已支持200万汉字的长文本输入,是该领域的早期领先者。
  3. 目前缺乏2025年最新的、各家模型上下文窗口长度的直接对比数据,尤其是以标准化单位(如Token)计量的精确数值。

下一步行动计划

  1. 系统性地搜集各主要国产大模型(Kimi、阶跃星辰、文心一言、通义千问、智谱GLM、讯飞星火等)在2025年发布的最新版本所支持的最大上下文窗口长度。重点关注各公司官方渠道发布的最新公告或技术文档,以获取最准确的数据。
  2. 将搜集到的数据进行标准化处理和整理。由于“字”和“Token”的换算存在差异,将优先查找以“Token”为单位的官方数据,并统一整理成一个清晰的对比列表,内容包括模型名称、研发公司、最大上下文窗口(Tokens)及信息发布日期。
  3. 基于整理后的数据进行对比分析,明确当前上下文窗口最大的国产模型。为使结论更直观,将数据进行可视化处理,生成对比图表。
  4. 整合所有信息,撰写最终研究报告,报告将首先给出核心结论,然后通过图表和文字详细阐述各模型的具体表现和行业发展趋势。

让我先搜索月之暗面Kimi的最新上下文窗口长度信息。

搜索

Search

2025年 月之暗面 Kimi 最大上下文窗口 百万token
ce.cn
ce.cn
近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描
iyiou.com
iyiou.com
... 上下文窗口大大变长:一次可处理400万token。 事实上,长文本处理的技术壁垒并不高,Kimi之所以能以长文本为卖点、成功打响旗号,关键还是营销做得好。
iyiou.com
iyiou.com
MiniMax-01 首次在4000 亿以上参数的大模型中,使用了线性注意力机制新架构(标准Transformer 是非线性注意力机制),能高效处理全球最长的 400 万token ...
前瞻网
前瞻网
有专注大模型的垂直创业公司六小龙,智谱AI、MiniMax、月之暗面、百川智能、零一万物和阶跃星辰。以及老牌BAT出品的,阿里的通义千问、百度的文心一言 ...

我需要继续搜索其他主要国产大模型的上下文窗口长度信息。让我搜索文心一言的相关信息。

搜索

Search

2025年 百度 文心一言 最大上下文窗口 长度
sc.gov.cn
sc.gov.cn
5月25日,第二十届中国西部国际博览会在成都开幕,它因西部大开发而生,此番盛会再启,打开了透视西部“奇迹”的窗口。势头强劲在产业 西部大开发被称作“世纪工程”,是国家层面最早提出的区域协调发展战略之一,25年大开发的成效体现在经济层面。2024年,西部十二省区市实现GDP(地区生产总值)28.73万亿元,占全国比重21.3%。横向看,这些数据并不亮眼,但纵向看就会发现“含金量”在不断提升。时间线回到2000年,西部大开发战略全面启动实施。当时,西部十二省区市经济总量1.5...
academia.edu
academia.edu
这一分类法内容广泛,涵盖认知、人际关系、 内省、数字信息和终身学习技能,并说明了各类技能的定义与进行技能评估时需要考虑的因素。需要指出的是,ETS 2025 技能分类法尤其 ...

我需要搜索更多关于文心一言和其他国产大模型的上下文窗口长度信息。让我尝试另一个关键词组合。

搜索

Search

2025年 文心一言 通义千问 智谱GLM 上下文窗口 百万token 对比
iyiou.com
iyiou.com
除了个人版GLM-3Turbo,智谱AI的企业级产品GLM-4/GLM-4V价格尚未出现大幅波动,仍维持在0.1元/千tokens,百万tokens的价格为100元。作为一款能力逼近GPT-4的 ...

我需要尝试更精确的搜索,直接查找各大模型的上下文窗口长度数据。

搜索

Search

2025年 国产大模型 上下文窗口长度 排名 Kimi 文心一言 通义千问 智谱GLM 讯飞星火 token
ce.cn
ce.cn
近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描
新华网
新华网
将大模型“装”进手机、融入供应链,带到办公室和生产线……开年以来,大模型应用加速落地。从百度文心大模型上线“深度搜索”功能,到三家基础电信企业全面接入DeepSeek开源大模型,近段时间,国产大模

已掌握的信息

  1. 国内大模型在长上下文技术领域竞争激烈,已进入“百万级”上下文窗口的时代。
  2. 主要的参与者包括月之暗面(Kimi)、阶跃星辰、百度(文心一言)、阿里巴巴(通义千问)、智谱AI(GLM)、科大讯飞(星火)以及DeepSeek等公司。
  3. 已有一条2024年3月的过往信息,显示Kimi当时支持200万汉字的长文本输入,但此后各家模型均有更新,目前缺乏2025年最新的、各模型上下文窗口长度的精确对比数据。

下一步行动计划

  1. 分头搜集,逐一击破:改变宽泛的“排名”式搜索策略,转为对每个主要国产大模型(Kimi、通义千问、文心一言、智谱GLM、讯飞星火、阶跃星辰Step系列等)进行独立的、针对性的信息搜集。重点是查找各模型在2025年发布的最新版本所支持的最大上下文窗口长度。
  2. 数据整理与标准化:将搜集到的各模型上下文长度数据进行标准化处理。优先采用“Token”作为统一的对比单位,并注明信息来源的发布日期。将这些关键数据(模型名称、研发公司、最大上下文窗口、发布日期)整理成一个结构化的对比列表。
  3. 对比分析与可视化:基于整理好的数据,进行横向对比分析,以明确找出当前(2025年7月)上下文窗口最大的国产模型。为了使对比结果更加直观,将创建一个对比图表(如柱状图),清晰地展示不同模型在上下文长度上的表现。
  4. 撰写综合研究报告:整合所有分析结果,撰写最终的研究报告。报告将首先明确给出“哪个国产模型上下文最长”的核心结论,然后通过图表和文字详细阐述各模型的具体数据和排名,并简要概述国产大模型在长上下文技术领域的最新发展趋势。

核心信息来源

为确保研究的准确性和时效性,信息搜集将优先参考以下几类权威渠道:

  1. 模型研发机构官方渠道:月之暗面、阿里云、百度智能云、智谱AI、科大讯飞、阶跃星辰等公司的官方网站、技术博客及官方新闻稿。
  2. 权威科技媒体:如量子位、机器之心、36氪等,它们通常会第一时间发布对大模型更新的深度解读。
  3. 技术与开发者社区:如Hugging Face上的模型介绍页面、GitHub上的项目文档等,以获取面向开发者的精确技术参数。

让我尝试搜索DeepSeek的上下文窗口长度信息。

搜索

Search

2025年 DeepSeek 最大上下文窗口 百万token
iyiou.com
iyiou.com
这种创新性MOE的尝试,上一次是Deepseek。和其他开源模型相比如何?不得不想到的就是去年底的顶流Deepseek V3。首先在MOE架构上,两者都运用了MoE架构来构建模型,不过它们在具体的模型细节、应用场景和性能表现等方面可能会因架构参数设置、训练策略等因素的不同而存在差异。MiniMax-01系列模型采用了混合专家(MoE)架构,通过大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,从而能够处理400万tokens的输入。
ce.cn
ce.cn
一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海啸”。 短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“1/18的训练成本、1/10的
新华网
新华网
潘悦 制图 一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海啸”。 短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“1/18的训
iyiou.com
iyiou.com
2024年12月26日,Deepseek 正式发布了Deepseek V3。当大家打开其技术报告时,最先被吸引的便是那“惊人的数字”:6710亿模型参数,同时训练数据规模更是达到14.8万亿tokens。
36氪
36氪
长上下文建模是下一代大型语言模型(LLM)的关键能力,这一需求源于多样化的实际应用,包括深度推理、仓库级代码生成以及多轮自动智能体系统等。 实现高效长 ...
iyiou.com
iyiou.com
... 上下文窗口大大变长:一次可处理400万token。 事实上,长文本处理的技术壁垒并不高,Kimi之所以能以长文本为卖点、成功打响旗号,关键还是营销做得好。
36氪
36氪
上下文窗口(Context Window). 指在模型「遗忘」对话的早期部分、并 ... 百万Token价格」($/Mtok)的——. 模型服务商会通过在单个GPU或GPU集群上 ...
iyiou.com
iyiou.com
2025年7月28日,2025世界人工智能大会——AI商业落地论坛在上海成功举办。 “2025AI商业落地论坛”由世界人工智能大会组委会办公室指导,亿欧、上海市漕河泾新兴 ...

我发现了一些有价值的信息,特别是关于MiniMax和DeepSeek的上下文窗口长度。让我继续搜索阶跃星辰的信息。

搜索

Search

2025年 阶跃星辰 Step系列 上下文窗口长度
iyiou.com
iyiou.com
无论是Mini Max推出的M1新模型,上下文的长度达到一兆,还是月之暗面的K2模型,总参数量达到一万亿,就在7月25日,阶跃星辰场发布了Step 3大模型。

我需要再搜索一些关于智谱GLM和讯飞星火的上下文窗口长度信息。

搜索

Search

2025年 智谱GLM 讯飞星火 上下文窗口长度 最新
央广网
央广网
根据测试效果,在用户与值得买科技自研AI购物助手“小值”对话交互过程中,GLM-Z1-Air能迅速深度分析多轮对话的上下文信息,精准洞悉用户问题的意图,快速处理用户复杂问题请求,满足用户多样化的消费需求。在用户意图任务规划中,GLM-Z1-Air判断商品评价总结、商品对比、商品推荐等十余种意图,准确率高达98.5%,极大提升用户体验,为用户消费决策的效率和质量提供了有力支持。作为智谱华章的重要合作伙伴,值得买科技一直与智谱
ah.gov.cn
11月26日至11月30日,第二届中国国际供应...据了解,此次链博会上,科大讯飞股份有限公司展示了其最新升级的技术成果—首个基于全国产算力底座打造的讯飞星火大模型4.0 Turbo;也带来了星火智慧黑板2.0、智医助理、科大讯飞汽车语音助理国际版、星火企业智能体平台、C端硬件等多款创新产品与技术服务。产业链供应链是现代经济的重要形态,其韧性和安全水平对现代化经济体系运行具有重要影响。而制造业的数智化转型和数实融合发展,无疑是提升供应链韧性和现代化水平的关键路径。数字科技...
iyiou.com
iyiou.com
2025中国高阶智能辅助驾驶最新技术洞察报告 2025中国高阶智能辅助驾驶最新技术洞察 ... 讯飞星火等10 余家国内外主流大模型平台。 微盟集团 ... 智谱AI 等国产厂商也纷纷发布了 ...

我需要继续搜索更多关于通义千问的上下文窗口长度信息。

搜索

Search

2025年 通义千问 最大上下文窗口长度
央广网
央广网
央广网北京2月10日消息 近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。该榜单是目前全球最具权威性的开源大模型榜单,其测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等。(图源 Huggingface2月10日官网榜单截图) 通义千问Qwen大模型已经成为全球最大的开源...
北京市公共数据开放平台
北京市公共数据开放平台
国内不少企业抢抓机遇,纷纷推出自己的AI大模型,比如百度“文心一言”、阿里“通义千问”、华为“盘古大模型”、科大讯飞“星火认知大模型”…据不完全统计,国内迄今已推出了超20个AI大模型。面对这么多AI大模型,国家互联网信息办公室副主任曹淑敏有些担忧,“也不能一哄而上”。她提到了此前一些地方抢建数据中心的“乱象”。中国工程院院士、阿里云创始人王坚曾评价:许多地方把数据中心建设成了房地产一样的项目,一些数据中心实际业务就是“出租”,把数据中心的空间分给不同客户…不要为了建设数据中心而去建设。曹...
iyiou.com
iyiou.com
阿里巴巴的通义大模型,成为奥运首个AI大模型应用的技术提供方。另外,巴黎奥运会还将上线首个大模型应用,由阿里通义千问提供技术支持,辅助各项赛事解说。
academia.edu
academia.edu
这一分类法内容广泛,涵盖认知、人际关系、 内省、数字信息和终身学习技能,并说明了各类技能的定义与进行技能评估时需要考虑的因素。需要指出的是,ETS 2025 技能分类法尤其 ...
researchgate.net
researchgate.net
能会严重制约其处理长文本的能力,所以 LLMs 通常会对上下文窗口10 的长度做出限制. 通过位置编码技术得到的初始词嵌入虽然能解决对语序的建模问题,但仍 ...

已掌握的信息

  1. 国产大模型在长上下文技术领域的竞争已进入“百万级Token”时代,主要参与者包括MiniMax、DeepSeek、月之暗面(Kimi)、阶跃星辰、阿里巴巴(通义千问)、百度(文心一言)和智谱AI等。
  2. 已搜集到部分模型的明确数据:MiniMax于2025年1月发布的MiniMax-Text-01模型,支持高达400万Token的上下文窗口。
  3. 已确认月之暗面、阶跃星辰等公司在2025年发布了新模型(如Kimi K2、阶跃星辰Step 3),但其最大上下文窗口的具体数值尚未查明。
  4. 对于通义千问、文心一言、智谱GLM、讯飞星火等其他主流模型的最新(2025年)上下文窗口长度,目前缺乏确切的、可供直接对比的数据。

下一步行动计划

  1. 补全关键数据缺口:以“400万Token”为当前基准,系统性地搜集其他主要国产大模型(特别是通义千问、文心一言、最新版Kimi、阶跃星辰Step 3、智谱GLM、讯飞星火)在2025年官方宣布的最大上下文窗口长度。搜集时优先查找以“Token”为单位的精确数值,以确保对比的公平性。
  2. 数据整理与交叉验证:将所有搜集到的数据(模型名称、研发公司、最大上下文窗口长度、发布/更新日期)整理成结构化的对比列表。对关键数据点,尝试通过不同来源的信息进行交叉验证,确保准确性。
  3. 数据分析与可视化呈现:基于整理后的数据,进行全面的横向对比,最终确定当前上下文窗口最大的国产模型。为使研究结论一目了然,将创建对比图表(如柱状图),直观地展示各主流模型在上下文长度上的排名和差异。
  4. 撰写综合研究报告:整合所有分析结果,撰写最终报告。报告将以清晰的结论开篇,直接回答用户问题,随后附上详细的对比图表和分析说明,并可简要概述国产大模型在长上下文技术领域的最新发展趋势与竞争格局。

核心信息来源

为确保研究的准确性和时效性,后续信息搜集将优先参考以下几类权威渠道:

  1. 模型研发机构官方渠道:阿里巴巴通义、百度智能云、月之暗面、阶跃星辰、智谱AI、科大讯飞等公司的官方网站、技术博客、开发者社区及官方新闻稿。
  2. 权威科技媒体:量子位、机器之心、36氪等,重点关注其对各大模型最新发布会的深度报道和技术解读。
  3. 技术与开发者社区:Hugging Face上的模型卡片(Model Card)和GitHub项目文档,这些渠道通常会提供面向开发者的精确技术参数。

让我尝试搜索一些更具体的信息,特别是关于MiniMax和其他模型的上下文窗口长度对比。

搜索

Search

2025年 MiniMax 400万token 上下文窗口 Kimi K2 阶跃星辰 Step 3 对比
新华网
新华网
此次最新接入的超长文本模型MiniMax-Text-01,上下文窗口可达400万token,相当于在几秒内快速读完四大名著加哈利波特全集。  作为国家级算力服务平台,国家超算互联网平台通过链接我国算力产业上下游及供需双方资源,集算力、应用、数据、生态、社区等于一体,让创新链和产业链无缝对接。  自2024年4月正式上线以来,国家超算互联网平台注册用户规模与入驻服务商数量均实现快速增长。目前,平台总用户量已突破35万,连接全国14个省区市...

让我尝试搜索更多关于Kimi K2的信息。

搜索

Search

2025年 Kimi K2 上下文窗口长度 百万token
iyiou.com
iyiou.com
在2025年的AI Agent热潮里,Deep Resaerch(深度研究)类的产品是最早落地的一批。 从去年底谷歌发布首个Deep Resaerch开始,数月内,OpenAI、Anthropic等迅速 ...
36氪
36氪
MoE、长上下文窗口、深度推理能力,成为竞赛的核心关键词。Kimi K2的万亿参数和MoE架构,是在DeepSeek、MiniMax接连投入之后,创业公司“二次竞赛”的标配。
36氪
36氪
无论是Mini Max推出的M1新模型,上下文的长度达到一兆,还是月之暗面的K2模型,总参数量达到一万亿,就在7月25日,阶跃星辰场发布了Step 3大模型。针对国产卡 ...

让我尝试搜索更多关于阶跃星辰Step 3的信息。

搜索

Search

2025年 阶跃星辰 Step 3 上下文窗口长度
iyiou.com
iyiou.com
2025年7月28日,2025世界人工智能大会——AI商业落地论坛在上海成功举办。 “2025AI商业落地论坛”由世界人工智能大会组委会办公室指导,亿欧、上海市漕河泾新兴 ...
iyiou.com
iyiou.com
无论是Mini Max推出的M1新模型,上下文的长度达到一兆,还是月之暗面的K2模型,总参数量达到一万亿,就在7月25日,阶跃星辰场发布了Step 3大模型。
36氪
36氪
无论是Mini Max推出的M1新模型,上下文的长度达到一兆,还是月之暗面的K2模型,总参数量达到一万亿,就在7月25日,阶跃星辰场发布了Step 3大模型。

根据我的搜索,我已经收集到了一些关于国产大模型上下文窗口长度的信息。让我整理这些信息并使用可视化工具来呈现结果。

可视化工具

可视化工具

已掌握的信息

  1. 国产大模型在长上下文技术领域的竞争已进入“百万级Token”时代。目前已确认,MiniMax公司于2025年1月发布的MiniMax-Text-01模型支持高达400万Token的上下文窗口,这是当前已搜集到的最明确的最大值。
  2. 国内多家头部AI公司在2025年均有重要更新。例如,月之暗面发布了Kimi K2,阶跃星辰发布了Step 3模型。虽然已知这些是最新型号,但其最大上下文窗口的具体数值(以Token为单位)尚未在现有搜索结果中明确。
  3. 对于其他主流厂商,如阿里巴巴(通义千问)、百度(文心一言)、智谱AI(GLM)和科大讯飞(星火),同样缺乏其在2025年最新版本的上下文窗口长度的确切数据。

下一步行动计划

  1. 补全关键数据:集中力量,针对性地搜集Kimi K2、阶跃星辰Step 3、以及通义千问、文心一言、智谱GLM、讯飞星火等模型在2025年发布的最新版本的最大上下文窗口长度。搜寻的重点是官方发布的、以“Token”为单位的精确数值。
  2. 数据整合与最终排名:将所有搜集到的精确数据更新至对比表格中,进行最终的横向比较,以确定当前(2025年7月)上下文窗口最长的国产模型,并完成排名。
  3. 撰写研究报告:基于最终确认的数据和排名,撰写一份全面的研究报告。报告将首先给出核心结论,然后通过图文并茂的形式(使用最终的可视化图表)详细展示各主要国产大模型的上下文能力对比,并可简要分析当前国产大模型在长上下文技术上的发展趋势和竞争格局。

核心信息来源

为确保研究的准确性和时效性,后续信息搜集将优先参考以下几类权威渠道:

  1. 模型研发机构官方渠道:相关AI公司的官方网站、技术博客、开发者文档或API定价页面。
  2. 权威科技媒体:如36氪、量子位、机器之心等,重点关注其对各大模型最新发布会的深度报道和技术参数解读。
  3. 行业会议与报告:如世界人工智能大会(WAIC)等顶级行业会议的官方发布内容,以及权威研究机构发布的最新产业报告。

让我继续搜索更多关于其他主要国产大模型的上下文窗口长度信息。

搜索

Search

2025年 文心一言 通义千问 智谱GLM 讯飞星火 上下文窗口长度 最新
tianyancha.com
tianyancha.com
# 讯飞星火 所属公司: 科大讯飞股份有限公司 当前融资轮次: 定向增发 简介: 讯飞星火认知大模型是以中文为核心的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行
iyiou.com
iyiou.com
微盟2023 年5 月发布大模型应用产品微盟WAI,目前已成功接入OpenAI ChatGPT、腾讯混元、百度文心一言、智谱GLM、商汤日日新、月之暗面Kimi、阿里通义千问、科大讯飞星火等 ...

让我尝试搜索更具体的信息,特别是关于文心一言的上下文窗口长度。

搜索

Search

2025年 百度 文心一言 最大上下文窗口 百万token
爱企查
爱企查
IT 之家 11 月 21 日消息,据新浪科技报道,在百度 2024 年第三季度财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度将于 2025 年初发布文心大模型的新版本,以巩固在基础模型
央广网
央广网
2023年3月,百度发布文心一言并宣布免费试用,当年11月,文心一言上线专业版并在国内首先开启付费模式;2023年9月,腾讯混元大模型对外开放,其收费标准为每1000个token(模型输入和输出的基本单位)收费0.14元…此时,大模型的使用还是“按分计价”。直到2024年5月,国内AI企业深度求索旗下的DeepSeek-V2模型将大模型的价格降至GPT-4的1%后,阿里、腾讯、字节跳动等多家企业迅速跟进,AI大模型“按厘计价”时代正式开...

让我尝试搜索通义千问的上下文窗口长度信息。

搜索

Search

2025年 阿里 通义千问 最大上下文窗口 百万token
ce.cn
ce.cn
3月10日,国家超算互联网平台宣布接入阿里巴巴通义千问大模型,对外提供千问 QwQ-32B API 服务,用户可免费获得100万tokens。 据了解,千问QwQ-32B是阿里通义团队最新开源的推理
爱企查
爱企查
11 月 20 日消息,最新的 Qwen2.5-Turbo 已在阿里云百炼上线,该模型支持 100 万超长上下文,相当于 100 万个英文单词或 150 万个汉字,在多个长文本评测集上的性能表现超越
央广网
央广网
央广网北京2月10日消息 近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。该榜单是目前全球最具权威性的开源大模型榜单,其测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等。(图源 Huggingface2月10日官网榜单截图) 通义千问Qwen大模型已经成为全球最大的开源模型族群。在海内外...

我已经收集到了一些关键信息,让我整理并可视化这些数据。

可视化工具

可视化工具

已掌握的信息

  1. 国产大模型在长上下文技术领域的竞争已进入“百万级Token”时代。目前已确认,MiniMax公司于2025年1月发布的MiniMax-Text-01模型支持高达400万Token的上下文窗口,这是当前已知的最长记录。
  2. 阿里巴巴的通义千问Qwen2.5-Turbo和MiniMax的另一款模型M1也已确认支持100万Token的上下文窗口。
  3. 国内其他主要AI公司,如月之暗面(Kimi K2)、阶跃星辰(Step 3)、百度(文心一言)等,均在2025年发布了新模型,但其最大上下文窗口的具体数值(以Token为单位)尚未在已有的搜索结果中明确。

下一步行动计划

  1. 补全关键数据缺口:集中力量,针对性地搜集Kimi K2、阶跃星辰Step 3、最新版文心一言、智谱GLM及讯飞星火等模型的最大上下文窗口长度。搜寻的重点是各公司官方发布的、以“Token”为单位的精确技术参数。
  2. 数据整合与最终排名:将所有搜集到的精确数据更新至对比表格中,进行最终的横向比较,以确定当前(2025年7月)上下文窗口最长的国产模型,并完成最终排名。
  3. 撰写综合研究报告:基于最终确认的数据和排名,撰写一份全面的研究报告。报告将首先给出核心结论,然后通过图文并茂的形式(使用最终的可视化图表)详细展示各主要国产大模型的上下文能力对比,并简要分析当前国产大模型在长上下文技术上的发展趋势和竞争格局。

核心信息来源

为确保研究的准确性和时效性,后续信息搜集将优先参考以下几类权威渠道:

  1. 模型研发机构官方渠道:相关AI公司的官方网站、技术博客、开发者文档或API定价页面。
  2. 权威科技媒体:如36氪、量子位、机器之心等,重点关注其对各大模型最新发布会的深度报道和技术参数解读。
  3. 行业会议与报告:如世界人工智能大会(WAIC)等顶级行业会议的官方发布内容,以及权威研究机构发布的最新产业报告。

让我尝试搜索更多关于Kimi K2的上下文窗口长度信息。

搜索

Search

Kimi K2 月之暗面 上下文窗口长度 百万token 2025
ce.cn
ce.cn
近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描
36氪
36氪
去年3月,月之暗面宣布在大模型上下文窗口技术上取得突破,Kimi智能助手的上下文长度从此前的20万字直接提升到了惊人的200万字,并开启了产品内测。不到半年 ...
iyiou.com
iyiou.com
一条路径崇尚傻瓜式操作,门槛更低,以月之暗面的Kimi-Researcher为代表,摸着OpenAI、Gemini过河。正如OpenAI demo所演示的一般,用户只需发出指令,合上电脑 ...
36氪
36氪
无论是Mini Max推出的M1新模型,上下文的长度达到一兆,还是月之暗面的K2模型,总参数量达到一万亿,就在7月25日,阶跃星辰场发布了Step 3大模型。针对国产卡 ...

让我尝试搜索更多关于智谱GLM的上下文窗口长度信息。

搜索

Search

智谱GLM 上下文窗口长度 百万token 2025
央广网
央广网
据了解,本轮融资将用于智谱GLM大模型系列的进一步研发,从回答问题到解决复杂推理、多模态任务,更好地支撑行业生态发展。今年9月,中关村科学城公司宣布以投前200亿估值领投智谱,用于支持国产基座大模型的技术创新和生态发展。从年初视频生成模型的战火,到多模态模型和深度推理模型的出现,再到最近Agent(智能体)的进展,智谱先后发布对标Sora的视频生成模型CogVideoX,以及对标GPT-4o的端到端语音模型GLM-4-Voice和GLM-4-VideoCall,率先推出自主操作手机的智能体...
央广网
央广网
央广网北京1月16日消息(记者 齐智颖)1月15日晚间,北京智谱华章科技有限公司(以下简称“智谱”)发布关于被美国商务部列入实体清单的声明称,关注到美国商务部工业和安全局(BIS)拟将智谱及子公司增列至出口管制实体清单。智谱认为,这一决定缺乏事实依据,并对此表示强烈反对。公开资料显示,智谱由清华大学成果转化而来。自2020年开始投入研发GLM预训练架构,2022年发布中英双语千亿级超大规模预训练模型<...

让我尝试搜索更多关于讯飞星火的上下文窗口长度信息。

搜索

Search

讯飞星火 上下文窗口长度 百万token 2025
tianyancha.com
tianyancha.com
# 讯飞星火 所属公司: 科大讯飞股份有限公司 当前融资轮次: 定向增发 简介: 讯飞星火认知大模型是以中文为核心的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行

基于我的搜索结果,我现在可以整理出一份关于国产大模型上下文窗口长度的最终报告。

国产大模型上下文窗口长度对比研究报告

核心结论

根据2025年7月最新数据,MiniMax-Text-01以400万tokens的上下文窗口长度位居国产大模型之首iyiou.com新华网,远超其他竞争对手。紧随其后的是MiniMax-M1和阿里通义千问Qwen2.5-Turbo,均支持100万tokens的上下文窗口iyiou.com爱企查

排名模型名称上下文窗口长度发布时间
1MiniMax-Text-01400万tokens2025年1月
2MiniMax-M1100万tokens2025年6月
3通义千问Qwen2.5-Turbo100万tokens2024年11月
4Kimi K2未明确2025年7月
5阶跃星辰Step 3未明确2025年7月25日
6DeepSeek-R1未明确2025年1月
7文心一言未明确2025年初
8讯飞星火未明确未提供
9智谱GLM未明确未提供

详细分析

1. 领先者:MiniMax系列

MiniMax公司在长上下文技术领域取得了显著突破。2025年1月发布的MiniMax-Text-01模型拥有惊人的400万tokens上下文窗口长度新华网,相当于在几秒内快速读完四大名著加哈利波特全集。该模型采用了混合专家(Mixture of Experts, MoE)架构,结合了Lightning Attention与Softmax Attention的混合注意力机制,极大地优化了性能表现iyiou.com

MiniMax于2025年6月推出的另一款模型M1也支持100万tokens的上下文长度iyiou.com,进一步巩固了该公司在长上下文技术领域的领先地位。

2. 强劲竞争者:阿里通义千问

阿里云的通义千问Qwen2.5-Turbo模型支持100万tokens的上下文窗口长度爱企查,相当于100万个英文单词或150万个汉字。该模型可应用于长篇小说深入理解、仓库级别代码助手、多篇论文阅读等场景,能一次性处理10本长篇小说,150小时的演讲稿,或3万行代码。

值得注意的是,通义千问Qwen系列模型在开源社区影响力巨大,其衍生模型数量已突破9万,超越美国Meta公司旗下的Llama系列开源模型,位居全球第一央广网

3. 其他主要竞争者

月之暗面的Kimi系列在长文本处理方面有着良好的历史表现。早在2024年3月,Kimi就支持200万汉字的无损上下文长度ce.cn。2025年7月,月之暗面推出了新一代Kimi K2模型,拥有万亿级参数量36氪,但其具体上下文窗口长度尚未公开。

阶跃星辰于2025年7月25日发布了Step 3大模型iyiou.com,DeepSeek于2025年1月发布了DeepSeek-R1模型,被描述为"上下文更长"36氪,但两者的具体上下文窗口长度数据同样未明确公开。

百度于2025年初发布了文心大模型的新版本爱企查,智谱AI和科大讯飞也分别更新了其GLM系列和星火认知大模型,但关于它们的上下文窗口长度,目前公开资料中缺乏明确数据。

长上下文技术的意义与应用

长上下文窗口技术对大模型能力的提升具有重要意义。它解决了"碎片化"输入带来的智能降低问题,使模型能够更好地理解长文本间的逻辑关系ce.cn

在实际应用中,超长上下文窗口能力为以下场景带来显著价值:

  • 完整代码库的分析理解
  • 多步骤复杂任务的自主完成
  • 长文档的深度理解与分析
  • 多模态内容的统一处理

发展趋势与展望

国产大模型在长上下文技术领域的竞争已进入"百万级Token"时代,并向"千万级"迈进。MoE架构、长上下文窗口和深度推理能力已成为大模型竞赛的核心关键词36氪

随着技术的不断突破,预计未来国产大模型将在以下方面继续发力:

  1. 进一步扩展上下文窗口长度,提高长文本理解能力
  2. 优化推理效率,减少长文本处理的计算资源消耗
  3. 增强长序列人类偏好对齐,提升用户体验
  4. 探索更大、更强的长文本模型架构

结语

在国产大模型上下文窗口长度的竞争中,MiniMax-Text-01以400万tokens的惊人成绩遥遥领先,展现了中国AI企业在关键技术领域的创新能力。随着各大厂商持续投入研发,国产大模型在长上下文技术上的差距将进一步缩小,为用户提供更强大、更智能的服务体验。

Key references