login
2025最新开源知识图谱大全
2025/08/20·StepFun can make mistakes, check important info.
找最新最大的开源知识图谱

Requirement clarification

我需要了解用户对开源知识图谱的具体需求,以便提供最相关的信息。

开源知识图谱是一种结构化的知识表示形式,可用于多种AI和数据分析应用。用户可能需要了解最新最大的开源知识图谱用于研究、开发或其他目的。我需要确认几个关键点:

  1. 用户是否关注特定领域的知识图谱(如医疗、金融、通用知识等)
  2. 用户是否有特定的语言需求(如中文、英文或多语言)
  3. 用户是否需要了解这些知识图谱的技术细节、使用方法或下载途径
  1. 您对哪个领域的知识图谱更感兴趣(如通用知识、医疗、金融等)?
  2. 您是否需要特定语言的知识图谱(如中文、英文或多语言)?
  3. 您计划如何使用这些知识图谱(研究、开发应用等)?
跳过

好的,遵照您的指示,这是一个旨在找出最新、最大开源知识图谱的行动计划。

Research plan
  1. 在 Google Scholar、Papers with Code、arXiv 及 GitHub 等学术与代码托管平台,使用 "large-scale knowledge graph"、"open source knowledge graph"、"knowledge base dataset" 等关键词进行检索,初步识别出知名的开源知识图谱项目。
  2. 访问每个候选知识图谱的官方网站、文档或 GitHub 页面,收集关于其规模(如实体数、三元组数)、数据更新频率、最后维护日期、支持语言和覆盖领域(如通用、医疗、金融)的关键信息。
  3. 对收集到的信息进行整理,从“规模最大”(以三元组或实体数量为主要指标)和“最新”(以近期更新频率和最后维护日期为主要指标)两个维度对候选知识图谱进行比较。
  4. 根据知识图谱的领域(通用型 vs. 垂直领域)和主要语言(中文、英文、多语言)进行分类,以便提供更具针对性的参考。
  5. 综合分析结果,总结并列出在不同类别(如通用最大、通用最新、特定领域代表等)中表现最突出的几个开源知识图谱,并简要说明其核心特点。
开始研究

Deep Research

首先,让我们进行一次广泛的网络搜索,以了解当前最大、最新的开源知识图谱。

搜索

Search

largest open source knowledge graph 2024
index.dev
Knowledge Graph: AllegroGraph is, at its core, a knowledge graph database. This means that it organizes knowledge in the form of nodes, entities ...
geeksforgeeks.org
geeksforgeeks.org
Inspired by Google's Knowledge Graph, Cayley is an open-source graph database with over 14,000 stars on GitHub. The database is written in ...
nature.com
nature.com
This paper presents the last version of the Computer Science Knowledge Graph (CS-KG 2.0), an extensive knowledge base generated from 15 million research papers.
SourceForge
SourceForge
Shane's Chess Information Database"is a huge chess toolkit with extensive database,analysis and chess-playing features.Scid vs.PC is a usability and bug-fix fork of Scid.It has many interface fixes and improvements,and is fully compatible with Scid's.si4 d...
SourceForge
SourceForge
Shane's Chess Information Database"is a huge chess toolkit with extensive database,analysis and chess-playing features.Scid vs.PC is a usability and bug-fix fork of Scid.It has many interface fixes and improvements,and is fully compatible with Scid's.si4 d...
AMiner
AMiner
Advances in Ubiquitous Networking(2016) 关键词 Knowledge flows,Expertise,SNA,Open source AI 理解论文 溯源树 样例 生成溯源树,研究论文发展脉络
SourceForge
SourceForge
Browse free open source Test and Measurement software and projects below.Use the toggles on the left to filter open source Test and Measurement software by OS,license,language,programming language,and project status. Get Paid for Web Surf...
墨天轮数据库社区
墨天轮数据库社区
Nebula Graph An open source distributed graph database Min Wu1 Xinglu Yi1 Hui Yu1 Yu Liu1 and Yujue Wang1 Corresponding authors Emails wuminhdueducn Contributing authors yeeyivesoftcom jerryyuvesoftcom lionelliuvesoftcom lion
https://static-favicon.basemind.com/01JV2WN3T0E8DERRE0GHA74D39
https://static-favicon.basemind.com/01JV28GFZSVS4APS368GT11K70
https://static-favicon.basemind.com/01JV1ZXZ12QRXRWK6V23DQJN8X
View all 16 sources

我看到了一些关于开源知识图谱的初步信息,但需要更具体地搜索最新最大的开源知识图谱。让我尝试使用更精确的关键词。

搜索

Search

largest open source knowledge graph dataset 2025 wikidata dbpedia
arxiv.org
arxiv.org
To overcome this, we introduce WikiDBGraph, a large-scale graph of 100,000 real-world tabular databases from WikiData, interconnected by 17 ...
nature.com
nature.com
This paper presents the last version of the Computer Science Knowledge Graph (CS-KG 2.0), an extensive knowledge base generated from 15 million research papers.
sciencedirect.com
sciencedirect.com
Large-scale knowledge graphs such as Wikidata and DBpedia have become a powerful asset for semantic search and question answering.
SourceForge
SourceForge
Compare the best free open source Interface Engines at SourceForge.Free,secure and fast Interface Engines downloads from the largest Open Source applications and software directory
维普网
维普网
In this paper,we describe PeGaSus,an open source Peta Graph Mining library which performs typical graph mining tasks such as computing the diameter of the graph,computing the radius of each node,finding the connected com...
nebula-graph.io
nebula-graph.io
The open source graph database built for super large-scale graphs with milliseconds of latency
dgraph.io
The only open source,AI-ready graph database that gives developers the tools to quickly build distributed applications at scale.
清华大学
清华大学
openwrt 使用帮助|镜像站使用帮助|清华大学开源软件镜像站,致力于为国内和校内用户提供高质量的开源软件镜像、Linux 镜像源服务,帮助用户更方便地获取开源软件。本镜像站由清华大学 TUNA 协会负责运行维护。
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIzMTEwNzE2MjUyNi1tYnF0anhlZG9hZHdlbTF1bjh2aXUyZmJqOWdiaDV4aS5qcGc=&sign=yx:yQchh3-fC9nPjUvoM67lCnyns5g=&tv=400_400
https://static-favicon.basemind.com/01JV2WN3T0E8DERRE0GHA74D39
https://static-favicon.basemind.com/01JV28GFZSVS4APS368GT11K70
View all 16 sources

我需要更详细地了解一些最大的开源知识图谱,特别是Wikidata和DBpedia的最新情况,以及它们的规模数据。

搜索

Search

wikidata dbpedia knowledge graph size statistics 2025 number of triples entities
nature.com
nature.com
This paper presents the last version of the Computer Science Knowledge Graph (CS-KG 2.0), an extensive knowledge base generated from 15 million research papers.
researchgate.net
researchgate.net
Table 1 provides statistics for different DBpedia data groups for three Table 1 show that the amount of triples in the 'mappings', 'text' and 'wikidata' data ...
aclanthology.org
Entity Alignment (EA) is a critical task in Knowledge Graph (KG) integration, aimed at identifying and matching equivalent enti- ties that ...
CSDN技术社区
CSDN技术社区
用 Wikidata Graph Builder https://angryloki.github.io/wikidata-graph-builder/.输入 Wiki page link 后,可以像上面方法一样去根据关键词检索可用的属性 URI。这个方法可以针对具体的实体。用 SPARQL 直接搜。比如搜索所有以 埃隆马斯克 为主语,并且 prefix 为 wdt 的属性 URI。SELECT DISTINCT?p WHERE { w...
DBpedia
DBpedia
Since DBpedia’s establishment in 2006,the DBpedia project,published several Terabytes of useful data.DBpedia is an open community project with contributions and extensions from thousands of developers,engineers,companies...
CSDN技术社区
CSDN技术社区
例如,Google的Knowledge Graph、Wikidata、DBpedia等都是著名的知识图谱实例。0.2 知识图谱的意义 知识图谱作为一种数据组织形式,其意义在于提供了一种高效、直观的方式来表示和管理复杂的数据关系。它通过图结构的节点和边,将数据以结构化的形式展现,增强了数据的语义表达能力,使得实体间的关系清晰明确。知识图谱显著提升了信息检索的准确性,尤其在自然语言处理领域,它使得机器能够更好地理解和回应复杂的用户查询。知识图谱在智能应用中发...
DBpedia
DBpedia
Gartner put‘Knowledge Graphs’in 2020 at the peak of its hype cycle.Browse through different DBpedia data sets and read our mission how we want to develop the open DBpedia Knowledge Graph in the next 5 till 10 years. DBpedia
CSDN技术社区
CSDN技术社区
Wikidata 的数据模型主要围绕着三个基本组成部分展开:项目(Item)、属性(Property)和声明(Statement)。这种设计使得 Wikidata 成为了一个高度互联的知识库。项目(Item)是指现实世界中的对象或抽象概念,每一个都有唯一标识符 Q 和描述该实体的一系列声明。例如,“巴黎”作为一个地理地点被定义为 Item 并赋予特定编号如 Q90[^1]。属性(Property)描述了 Items 之间的关系或者是关于某个 Item 特定方面的信息。每个...
https://static-favicon.basemind.com/01JV1X6JZ2SF2HPYP3H31SV6JK
https://static-favicon.basemind.com/01JV4KP8ZGEX4A4D1J7APXQ59D
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIxMTExODEwMTEzOS0wNDZjbjNvbWI3czd5dTcyNDJkdnM0dTkwdTU2OGgxYS5wbmc=&sign=yx:vwfYxilfk-1jrtYWPjgmjicOSsU=&tv=400_400
View all 16 sources

现在让我查看一下有关CS-KG 2.0这个计算机科学领域的大型知识图谱的更多信息,因为它在搜索结果中多次出现,似乎是2025年最新的大型知识图谱之一。

网页解析

已掌握的信息

  1. 已初步锁定几个核心的开源知识图谱。在通用领域,Wikidata和DBpedia是规模最大、最知名的代表,其中Wikidata的数据质量通常被认为更高。在垂直领域,一个于2025年6月发布的名为CS-KG 2.0的计算机科学知识图谱非常引人注目,它基于最新的OpenAlex学术图谱构建,规模庞大且数据新颖。
  2. 对这些知识图谱的规模有了一些初步的量级概念。例如,有资料显示Wikidata包含数十亿级别的实体和声明,而DBpedia每月处理的更新量也达到百亿级三元组。CS-KG 2.0则覆盖了数百万篇计算机科学领域的论文。
  3. 明确了知识图谱(作为数据集)与图数据库(作为存储和查询技术)的区别,当前的研究任务聚焦于前者。

下一步行动计划

  1. 精确化关键指标:为了准确评估“最大”和“最新”,需要系统性地获取核心知识图谱(特别是Wikidata和DBpedia)的官方最新统计数据。计划访问其官方网站的统计页面或数据转储(dump)说明文档,查找并核实截至2025年的确切实体数量、三元组(或声明)数量以及最新的数据更新日期。
  2. 拓展中文知识图谱调研:当前调研主要集中在国际项目,下一步将专门针对中文领域的开源知识图谱进行探索。将在中国的学术数据库(如知网)、代码托管平台(如Gitee)以及知名科技公司的技术博客上,搜索“中文开放知识图谱”、“大规模知识图谱”等关键词,寻找由中国机构或社区维护的大型项目。
  3. 构建全面的对比框架:将收集到的信息进行结构化整理。计划创建一个包含多个维度的对比框架,涵盖:知识图谱名称、主要语言、覆盖领域(通用/垂直)、规模(实体数、三元组数)、最新版本/更新日期、数据格式及获取方式(如SPARQL端点、文件下载)。
  4. 综合分析与可视化呈现:基于对比框架,对各知识图谱进行横向比较,并从“通用最新最大”和“特定领域最新最大”等角度进行分类总结。计划将核心对比数据以图表形式进行可视化,直观地展示各知识图谱的特点与差异。
  5. 撰写研究报告:最后,将以上所有研究成果整合成一份结构清晰、图文并茂的报告。报告将首先概述当前开源知识图谱的整体格局,然后分章节详细介绍每个重要的知识图谱,并附上其架构图或示例图。报告的核心部分将是可视化的对比分析,最后根据“最新”和“最大”两个核心标准,给出明确的结论和推荐。
搜索

Search

wikidata statistics 2025 number of entities triples
Wikipedia
Wikipedia
As Wikidata has grown, the WDQS graph database has become pretty big, with about 16.6 billion records (known as triples) as of this writing, ...
nature.com
nature.com
Scientific Data volume 12, Article number: 1277 (2025) Cite this article ... Wikidata fact, but actually describe a different entity or ...
dl.acm.org
dl.acm.org
quency (i.e., the number of triples with a given relation) and the head entity degree, both computed from the training graph. 1-1K. 1K-10K.
百度百科
百度百科
Wikidata是维基媒体基金会开发的多语言结构化知识库,提供标准化RDF数据转储格式(Turtle/NTriples),支持通过特定路径获取包含完整实体信息的规范文件。其技术架构区分了包含全体实体数据的-all转储与精简表示的-truthy转储,同时提供Lexeme命名空间专用转储。作为人工智能领域重要的知识基础设施,Wikidata被应用于WikiReading数据集(包含1800万实例)的文本值预测任务,支持深度神经网络的端到端模型训练。在知识分类场景中,其4.1万...
DBpedia
DBpedia
Numbeo is a Serbian crowd-sourced global database of perceived consumer prices,crime rates,quality of health care,among other statistics.Data on Numbeo is not peer-reviewed,and could be inserted or altered by anyone acce...
arXiv.org
arXiv.org
Knowledge gaps and visibility.Wikipedia and its sister projects such as Wikimedia Commons,Wikidata,or Wiktionary,suffer from a wide range of knowledge gaps(Redi et al.2021).For example,the content gender gap refers to the fact that only 1...
艾思科蓝
艾思科蓝
终 轮 截稿时间:2025月5月16日前(特殊情况联系大会秘书) 接受/拒稿通知:投稿一周内 提交检索:EI Compendex,Scopus,ACM Digital Library,谷歌学术 大会简介 2025年数字经济与智能计算国际会议(DEIC 2025)将于2025年5月23日至25日在中国上海召开。随着互联网、大数据、人工智能等技术的快速发展,数字经济已成为全球经济增长的重要动力。数字经济不仅改变了传统产业的生产经营方式,还催...
Semrush
Semrush
Get Free Data e621.net Web Traffic Statistics Get a snapshot of e621.net online performance by viewing its most critical traffic metrics Spy on your competitors’traffic generation strategies Identify your competitor’s top produc...
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIxMDkxNDE3MTUxNC0wdmVxY2ZwYTk2Nmh2c3p5OHRmcW96a3l6cHp0a2VxYy5KUEc=&sign=yx:kROpGG3jrz4QX9N1U0SMnACwTWg=&tv=400_400
https://static-favicon.basemind.com/01JVBN8XHWBH6M4GHH6XVVK7VW
https://static-favicon.basemind.com/01JV28GFZSVS4APS368GT11K70
View all 16 sources

我现在需要查询更多关于DBpedia的最新统计数据,以便与Wikidata进行比较。

搜索

Search

dbpedia statistics 2025 number of entities triples
researchgate.net
researchgate.net
Table 1 provides statistics for different DBpedia data groups for three Table 1 show that the amount of triples in the 'mappings', 'text' and 'wikidata' data ...
dbpedia.org
dbpedia.org
DBpedia Largest Diamond, also BETA is our skyrocketing dataset describing 220 million entities using 1.45 Billion triples from DBpedia, Geonames, DNB, ...
ieeexplore.ieee.org
ieeexplore.ieee.org
In this paper we focus on predicates available on DBpedia, the most important Semantic Web source of data counting 470 million english triples.
DBpedia
DBpedia
Check the Mapping Guide that defines the best practices for how to write clean,efficient mappings that extract lots of high-quality data Take a look at the Mapping Statistics to search for relevant infoboxes to map.How to edit the DBp...
arXiv.org
arXiv.org
Table 1:Statistics of all 16 datasets in Cocktail benchmark.Avg.D/Q denotes the average number of relevant documents per query. 2 Related Work IR meets Large Language Models.Information retrieval(IR),the keystone of information a...
CSDN技术社区
CSDN技术社区
DBpedia是一个从维基百科中提取结构化信息的项目,其数据集广泛用于知识图谱构建、语义网和数据挖掘等领域的研究与开发。知识点详细解析:#DBpedia项目基础 DBpedia是一个多语言的、跨领域的知识图谱,它是从维基百科的内容中提取结构化信息而创建的。DBpedia的目的是将维基百科转变为一个全球知识的数据库,可以被机器处理和理解。它提取了诸如人物、地点、音乐作品、电影、组织机构等多种类型的数据实体,以及实体之间的关系,从而形成一个...
DBpedia
DBpedia
Numbeo is a Serbian crowd-sourced global database of perceived consumer prices,crime rates,quality of health care,among other statistics.Data on Numbeo is not peer-reviewed,and could be inserted or altered by anyone accessing the...
DBpedia
DBpedia
As a review,the DBpedia Databus is a digital factory platform that aims to support FAIRness by facilitating a registry of files(on the Web)using DataID metadata.In a broader perspective,the Databus is part of DBpedia’s Vision whi...
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTg0NDM4NTQ2L2JmL2E2L2VkL2JmYTZlZGQzN2RkZGI0YTZiOGI1MjA1MTI0YzA3MGE5Lmljbw==&sign=yx:eHLszJl78GYrroxjl4S4ZIzDqtU=&tv=400_400
https://static-favicon.basemind.com/01JV44BVCFVYFS2NA0A7RRD9R2
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTg0MzI5MTIyL2ZhLzdiL2QwL2ZhN2JkMGM2MTlhODM2NmIwNzNkNWM3ZWQ0ZWFhNWUwLmljbw==&sign=yx:C1HunXUgWw_Hnydsxo7hNSZ08AU=&tv=400_400
View all 16 sources

让我查询一下有关其他大型开源知识图谱的信息,特别是一些可能在中国或其他国家开发的知识图谱。

搜索

Search

largest chinese open source knowledge graph 2025 CN-DBpedia OpenKG
scidb.cn
scidb.cn
CN-DBpedia is a large-scale Chinese knowledge graph. It integrates knowledge from Baidu Baike, Hudong Baike, Chinese Wikipedia and other domain encyclopedia ...
researchgate.net
researchgate.net
CN-DBpedia, curated and maintained by Fudan University, is a comprehensive domain-agnostic structured encyclopedia knowledge graph, ...
arxiv.org
arxiv.org
Abstract—A policy knowledge graph can provide decision support for tasks such as project compliance, policy analysis, and intelligent question answering ...
opensi.net
OpenSI is a collaboration between Instaclustr and University of Canberra,boosting open source research,innovation,and partnerships.
openknowledgemaps.org
Open Knowledge Maps is the world's largest AI-based search engine for scientific knowledge.We dramatically increase the visibility of research findings for science and society alike. Open and nonprofit We are a charitabl...
百度
百度
As you build a new China,America wants to build a new relationship with you.We want China to be successful,secure and open,working with us for a peaceful and prosperous world.I know there are those in China and the United States who question wheth...
手机知网
手机知网
【摘要】:Comparative space-time thinking lies at the heart of spatiotemporally integrated social sciences.The multiple dimensions and scales of socioeconomic dynamics pose numerous challenges for the application and evaluation of public policies in the compara...
Gitee
Gitee
EasyPR EasyPR是一个开源的中文车牌识别系统,其目标是成为一个简单、高效、准确的车牌识别库。相比于其他的车牌识别系统,EasyPR有如下特点:*它基于openCV这个开源库。这意味着你可以获取全部源代码,并且移植到opencv支持的所有平台。它能够识别中文。例如车牌为苏EUK722的图片,它可以准确地输出std:string类型的"苏EUK722"的结果。它的识别率较高。图片清晰情况下,车牌检测与字符识别可以达到80%以上的精度。更新 当前master分支下的版本有以下几点更新:1.支持linux...
https://static-favicon.basemind.com/01JV3HXKBPA7WAQ0S7KF348615
https://static-favicon.basemind.com/01JV2AF0F7S39CXN9B7TYMM3KC
https://static-favicon.basemind.com/01JV22922SKP67V93MQAV367GZ
View all 16 sources

我现在需要查询一下CS-KG 2.0的具体规模数据,因为之前的搜索结果中提到它是2025年最新的大型知识图谱之一。

搜索

Search

CS-KG 2.0 knowledge graph size statistics number of entities triples
nature.com
nature.com
The novel version of CS-KG 2.050 includes over 1 billion RDF triples and approximately 24 million research entities categorized into types such ...
researchgate.net
researchgate.net
CS-KG 2.0 describes 25 million entities linked by 67 million relationships, offering a nuanced representation of the scientific knowledge ...
sciencedirect.com
sciencedirect.com
CS-KG comprises 41 million statements represented as 350 million triples within the Computer Science domain. Our findings show that integrating LLMs into the CS ...
360doc个人图书馆
360doc个人图书馆
时间:2012-02-26 09:30:41.10 快门:1/320 光圈:F/2.8 焦距:45毫米 感光度:200 合成后 1.打开cs5,打开文件,打开要抠图的图片 2.按住 键盘 上的ctrl+j键,创建一个图层1 3.点击ps滤镜-knockout2-载入工作图层后就转换到下图 4.点击工具箱中的内部对象选区工具绘制内部选区线,在点击外部对象选区工具绘制外部选区线 5.画好区线后点击编辑中的(处理)可以用软件提供的其他工具修复...
bilibili
bilibili
视频播放量 79613、弹幕量 17、点赞数 4587、投硬币枚数 120、收藏人数 1376、转发人数 106,视频作者 普通人小杰,作者简介 喜欢假面战队及奥特曼的老特摄人了!想看什么玩具测评可提醒up主测,但别催!感谢兄弟们的三连!合作+v:jrdbg0806,备注来意,相关视频:帝骑:我打得过逢魔时王吗?回答我!七十块的万代帝骑耶!但是慎入!坏事做尽亚极陀,最有爱心帝骑哥。帝骑最后一次回归与他第一次回归,W CSM2.0极限鹰完美还原菲利普消失名...
bilibili
bilibili
代码见 https://github.com/hjf222289/TimeBomb51—模拟CS:GO中的C4,功能如下:一开始处于待机状态,按住按钮一定时间(8s)以安装炸弹。炸弹安装后开始倒计时(45s),时间到则引爆。炸弹安装后,按住按钮一段时间(8s)以拆弹,拆弹过程中倒计时不停止。各过程中,数码管显示动画、文字或计时。蜂鸣器发出音效。材料:学校发的实验箱再加个通,视频播放量 10553、弹幕量 4、点赞数 99、投硬币枚数 31、收藏人数 126、转发人数 58,视频作者 Xeo...
arXiv.org
arXiv.org
Artificial Intelligence(cs.AI);Machine Learning(stat.ML) Title:Time-varying STARMA models by wavelets Subjects:Methodology(stat.ME);Applications(stat.AP) Title:Post-selection Inference for Conformal Prediction:Trading off Coverage for Precision Su...
百度百科
百度百科
CSO-NST是越南名NST的团队以cs1.6作为基础高仿CSOL的一个csol单机版本。CSO-NST加入了csol的大部分枪支,几乎每把枪都有与CSOL中一样的性能。包含CSOL中的男女人物,区分杀敌声音、男女手与男女无线电声音。各个仿CSOL模式近乎完美,吸引了不少热爱cs的玩家。强!
https://static-favicon.basemind.com/01JV20S0DY1SVFHZJ4C8ZNXWZB
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIxMTExODEwMTEzOS0wNDZjbjNvbWI3czd5dTcyNDJkdnM0dTkwdTU2OGgxYS5wbmc=&sign=yx:vwfYxilfk-1jrtYWPjgmjicOSsU=&tv=400_400
https://static-favicon.basemind.com/01JV1Y8XDFHH6N2DF8DY35Z3J2
View all 16 sources

已掌握的信息

  1. 通用领域知识图谱规模: 已确认Wikidata和DBpedia是通用领域内规模最大的两个开源知识图谱。根据2025年4月维基媒体基金会的技术博客,Wikidata以约166亿个三元组(triples)的体量占据绝对领先地位。DBpedia的数据规模也相当可观,其核心知识库包含约14.6亿个三元组,而其一个名为“Largest Diamond”的聚合数据集则包含14.5亿三元组和2.2亿实体。
  2. 垂直领域最新进展: 发现了一个于2025年6月发布的、名为CS-KG 2.0的计算机科学领域知识图谱。根据其在《Nature》上发表的论文,该知识图谱包含超过10亿个RDF三元组和约2400万个研究实体,是目前已知的在垂直领域内规模最大且最新的开源知识图谱之一。
  3. 中文知识图谱识别: 初步锁定了CN-DBpedia和OpenKG作为中文开源知识图谱的主要代表。CN-DBpedia由复旦大学维护,是一个大规模的中文百科知识图谱。OpenKG则是一个开放的中文知识图谱社区项目。然而,目前尚未获得它们在2025年的确切规模统计数据(如实体和三元组数量)。

下一步行动计划

  1. 补全中文知识图谱核心数据: 集中调研以获取CN-DBpedia和OpenKG社区其他核心知识图谱的最新规模数据。计划访问其官方网站(如openkg.cn)、相关维护机构(如复旦大学知识工场实验室)的最新发布,并在学术数据库(如中国知网)中查找2024-2025年的相关论文,以获取权威的实体数和三元组数。
  2. 构建多维度对比分析框架: 将已收集和待收集的数据整合到一个结构化的对比框架中。该框架将从知识图谱名称、覆盖领域、主要语言、实体规模、三元组规模、最新更新日期、数据特点和访问方式等维度,对Wikidata、DBpedia、CS-KG 2.0及主要的中文知识图谱进行系统性梳理。
  3. 数据可视化与洞察提炼: 基于已整理的对比框架,创建可视化图表(如条形图)来直观比较不同知识图谱在“规模”(三元组数量)上的差异。通过图表清晰地展示Wikidata在通用领域的领导地位以及CS-KG 2.0在垂直领域的巨大体量。
  4. 撰写综合研究报告: 整合所有信息,撰写一份全面的研究报告。报告将包含以下部分:
    • 引言:概述开源知识图谱的现状与重要性。
    • 全球顶级开源知识图谱详解:分章节详细介绍Wikidata、DBpedia和CS-KG 2.0,配以架构图或数据模型示例。
    • 中文开源知识图谱生态:介绍CN-DBpedia及OpenKG社区的发展和规模。
    • 横向对比与分析:展示多维度对比表格与规模可视化图表。
    • 结论:基于所有证据,明确总结出2025年“最新”和“最大”的开源知识图谱,并对通用、垂直、中文等不同类别分别进行推荐。
搜索

Search

CN-DBpedia OpenKG 中文知识图谱 规模 实体数量 三元组 2025
工程科学学报
工程科学学报
知识图谱的本质是连接实体间关系的图,即揭示实体之间关系的语义网络,普遍采用资源描述框架(Resource description framework,RDF)来描述知识。
亿信华辰
CN-DBpedia是目前规模最大的开放百科中文知识图谱之一,主要从中文百科类网站(如百度百科、互动百科、中文维基百科等)页面中提取信息[11]。 CN-DBpedia的 ...
cnblogs.com
cnblogs.com
OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。 RDFox是一个高度可扩展的内存RDF三元组存储,支持共享内存并行OWL 2 RL推理。
Data OpenKG
Dump CN-DBpedia目前提供Dump数据下载。包含900万+的百科实体以及6700万+的三元组关系。其中mention2entity信息110万+,摘要信息400万+,标签信息1980万+,infobox信息4100万+ Dump数据仅供学术研究使用,商用请联系我们获取授权。最新数据请直接访问 CN-DBpedia API 如需大规模调用请联系info.knowledge...
CSDN技术社区
CSDN技术社区
截至2015年7月的版本,实体数量达到900万以上,关系数量为6600万,同时还包含了诸如摘要、标签、infobox等多种类型的数据,提供了110万条mention2entity关系,以及6000万以上的triple(三元组)。CN-DBpedia的核心内容包括数据开放,特别是提供DUMP数据和API接口,如mention2entity API和entityAVP API,这使得开发者能够方便地访问和利用这些知...
博客园
博客园
01 唯品金融大数据 02 PlantData知识图谱数据智能平台 03 拍拍贷图数据库技术 04 CN-DBpedia 05 OpenKG.CN—开放的中文知识图谱 06 楚辞 07 海致大数据 08 腾讯云星图 09 网感至察 10 慧科技术-商业AI(NLP+品牌Logo识别) 二、相关科研机构与算法框架 2.1 复旦大学 Knowledge Works 2.1.1 开源库:FudanDNN 基...
CSDN技术社区
CSDN技术社区
5星·资源好评率100% 描述 CN-DBpedia 是一个大规模的 中文 知识图谱。它整合了百度百科、沪东百科、中文 维基百科等领域百科网站的知识。该数据集由 CN-DBpedia 的一个子集组成,包括 900 万个实体和 6700 万个三元组。特别是,我们分别有 110 万个提及实体关系、400 万个抽象关系...
CSDN技术社区
CSDN技术社区
CN-DBpedia作为中文开放百科知识图谱的一个重要版本,是当前最大的开放中文知识图谱之一,它包含数千万个实体和超过2亿条关系。这个数据集涵盖了广泛的主题,包括但不限于体育(如足球运动员和奖项)、娱乐(如影视作品)、商业(如企业信息)和学术领域(如百度百科和互动百科)。其应用价值显著,例如语义搜索提供更深层次的信息检索,小Cui问答利用知识图谱进行自然语言理解和问答交互,而超级验证...
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIzMTEwNzE2MjUyNi1tYnF0anhlZG9hZHdlbTF1bjh2aXUyZmJqOWdiaDV4aS5qcGc=&sign=yx:yQchh3-fC9nPjUvoM67lCnyns5g=&tv=400_400
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTU5MDk2OTU3LzNjL2M0LzJhLzNjYzQyYTVlZjVlYzNkMzRiOWYwYmUwZjFjNDVhYzZiLmljbw==&sign=yx:4ux0Ov3IaZW0IBYarBCuQnARQ74=&tv=400_400
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTU5MDk2OTU3LzNjL2M0LzJhLzNjYzQyYTVlZjVlYzNkMzRiOWYwYmUwZjFjNDVhYzZiLmljbw==&sign=yx:4ux0Ov3IaZW0IBYarBCuQnARQ74=&tv=400_400
View all 16 sources

现在我需要查看一下有关OpenKG和CN-DBpedia的最新数据和更新情况,特别是2025年的相关信息。

网页解析

我需要继续查询OpenKG的最新信息,以及查找是否有其他中文知识图谱的最新数据。

网页解析

网页解析

http://openkg.cn/

我需要搜索更多关于中文知识图谱的最新统计数据,特别是2025年的更新情况。

搜索

Search

中文知识图谱 最新规模 2025 实体数量 三元组数量 CN-DBpedia OpenKG
工程科学学报
工程科学学报
目前,已经涌现出一大批知识图谱,其中国外具有代表性的有YAGO、DBpedia、Freebase、NELL、Probase等;国内出现了开放知识图谱项目OpenKG,中文知识图谱CN-DBpedia、zhishi.me ...
github.com
github.com
中文通用百科知识图谱(CN-DBpedia), CN-DBpedia目前提供Dump数据下载。包含900万+的百科实体以及6700万+的三元组关系。其中mention2entity信息110万+,摘要信息400万+,标签 ...
阿里云
阿里云
在中国,它在医疗、教育领域有广泛应用,如疾病诊断、教学辅助。知识图谱能克服大模型幻觉,提高文本生成准确性,并在构建中国自主知识体系中发挥关键作用,如 ...
稀土掘金
稀土掘金
学习知识图谱技术离不开数据,其实很多互联网公司都有公开的一些数据源供爱好使用。下面整理一些,仅供参考。 ## 国外知识图谱开源数据 - wikidata:包含所有维基数据实体列表 - freeba
CSDN技术社区
CSDN技术社区
CN-DBpedia作为目前较大的中文通用百科知识图谱之一,它涵盖了大量信息,包括超过900万个实体和6700万条关系,体现了其规模的庞大和知识的丰富性。截至2015年7月的版本,实体数量达到900万以上,关系数量为6600万,同时还包含了诸如摘要、标签、infobox等多种类型的数据,提供了110万条mention2entity关系,以及6000...
华为云社区
华为云社区
目标是包含百度百科、互动百科、中文wiki百科的知识,千万级实体数量和亿级别的关系数目。目前已完成百度百科和互动百科部分,其中百度百科词条4,190,390条,互动百科词条4,382,575条。转换为RDF格式得到三元组 128,596,018个。存入 neo4j中得到节点 16,498,370个,关系 56,371,456个,属性 61,967,517个。项目码源见文末 码源:点击跳转 目录 百度百科与互动百科的知识...
X技术网
X技术网
由此,在对知识图谱中三元组数据标注前,先通过置信度将准确率低的三元组数据过滤掉,对于筛选出的置信度高的三元组数据,确定其调度优先级和标注模式,根据调度优先级和标注模式,对三元组数据进行标注,从而将三元组数据的标注分为多层,通过分层完成数据的标注处理,相比人工对全量数据标注,提升了标注准确率和效率,降低了人工成本。本申请另一方面实施例提出了一种电子设备,包括: 至少一个处理器;以及 与所述至少一个处理器通信连接的存储器;...
搜狐网
搜狐网
目前药品各知识类型的实体和三元组数量如下:表2 药品知识图谱各知识类型量级统计 手术操作知识图谱(更新) 手术操作知识图谱以手术操作为中心,基于人民卫生出版社《实用外科手术学(第2版)》、医疗服务项目目录等知识源,构建手术操作与疾病、药品、检验检查之间的关系,目前已发布使用的器械、麻醉方式、入路、体位、适应证、并发症等关系类型。本期主要新增收录人民卫生出版社《实用外...
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIzMTEwNzE2MjUyNi1tYnF0anhlZG9hZHdlbTF1bjh2aXUyZmJqOWdiaDV4aS5qcGc=&sign=yx:yQchh3-fC9nPjUvoM67lCnyns5g=&tv=400_400
https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIxMDkxNDE3MTUxNC0wdmVxY2ZwYTk2Nmh2c3p5OHRmcW96a3l6cHp0a2VxYy5KUEc=&sign=yx:kROpGG3jrz4QX9N1U0SMnACwTWg=&tv=400_400
https://static-favicon.basemind.com/01JVBPQAD4H19TS2RXQ5RKRVNH
View all 16 sources

已掌握的信息

  1. 通用知识图谱规模已明确: 在通用领域,Wikidata是规模最大的开源知识图谱,截至2025年4月,其三元组数量已达到约166亿。DBpedia作为另一个重要的知识图谱,其核心数据集包含约14.6亿三元组。
  2. 垂直领域有重大新发现: 计算机科学领域在2025年6月发布了CS-KG 2.0,其规模超过10亿三元组和2400万实体,是目前已知的在垂直领域内规模最大且最新的开源知识图谱之一。
  3. 中文知识图谱数据亟待更新: 已锁定CN-DBpedia和OpenKG作为中文知识图谱的主要代表。然而,现有信息显示CN-DBpedia的公开数据(约900万实体和6700万三元组)较为陈旧,一个2024年的文档提到了“数千万个实体和超过2亿条关系”,但缺乏更精确和最新的官方数据。OpenKG本身是一个社区平台,而非单一的知识图谱,其托管的各个图谱的具体规模和更新情况尚不明确。

下一步行动计划

  1. 深入挖掘中文知识图谱最新数据: 重点突破中文知识图谱规模数据不清的瓶颈。计划通过检索维护机构(如复旦大学知识工场实验室、清华大学、中科院自动化所等)在2024-2025年发布的学术论文、技术报告或官方公告,寻找关于CN-DBpedia、XLore、Belief-Engine等核心中文知识图谱的最新、最权威的规模统计数据。
  2. 构建多维对比分析框架: 将所有已确认的知识图谱(Wikidata, DBpedia, CS-KG 2.0, CN-DBpedia等)的关键信息进行结构化整理。创建一个全面的对比表格,维度将包括:知识图谱名称、主要语言、覆盖领域、实体数量、三元组数量、最新版本/更新日期、数据特点(如数据质量、更新频率)及获取方式。
  3. 进行可视化对比呈现: 为了直观地展示“最大”这一维度,计划将各知识图谱的三元组和实体数量进行可视化处理,生成对比图表。图表将清晰地揭示Wikidata在通用领域的绝对优势,CS-KG 2.0在垂直领域的领先地位,以及主要中文知识图谱的相对规模。
  4. 撰写并形成最终研究报告: 整合所有调研结果和分析,撰写一份结构清晰、图文并茂的综合报告。报告将首先概述全球及中文开源知识图谱的生态格局,然后分章节详细介绍各个代表性知识图谱的概况、规模、特点和应用场景,并附上关键的对比表格与可视化图表。最后,报告将根据“规模最大”和“更新最新”两个核心标准,对不同类别(通用、垂直、中文)的开源知识图谱进行总结,并给出最终结论。
可视化工具

可视化工具

现在我需要创建一个更全面的可视化,包括实体数量的对比。

可视化工具

可视化工具

最后,我需要整合所有信息,提供一个全面的总结和结论。

2025年最新最大的开源知识图谱全面分析报告

一、通用领域开源知识图谱

1. Wikidata - 当前规模最大的开源知识图谱

在通用领域,Wikidata无疑是目前规模最大的开源知识图谱。截至2025年4月,Wikidata的WDQS图数据库已包含约16.6亿亿条三元组记录Wikipedia。这一庞大的数据规模使其成为当前世界上最大的开放知识图谱。

Wikidata由维基媒体基金会维护,是一个多语言结构化知识库,提供标准化RDF数据转储格式(Turtle/NTriples)百度百科。其技术架构区分了包含全体实体数据的-all转储与精简表示的-truthy转储,同时提供Lexeme命名空间专用转储百度百科

作为人工智能领域重要的知识基础设施,Wikidata被广泛应用于各类任务。例如,WikiReading数据集(包含1800万实例)的文本值预测任务就基于Wikidata构建百度百科。在知识分类场景中,其4.1万种类型体系支撑了WikiWiki数据集对1000万维基百科实体的系统性分类研究百度百科

2. DBpedia - 结构化百科知识的先驱

DBpedia是另一个重要的通用领域开源知识图谱,其规模仅次于Wikidata。根据DBpedia官方网站,其最新版本"Largest Diamond"数据集包含2.2亿个实体14.5亿个三元组dbpedia.org

DBpedia于2006年建立,旨在生产一个可查询的知识图谱,源自维基百科内容DBpedia。多年来,DBpedia项目已发布了数TB的有用数据DBpedia。这是一个开放社区项目,有来自数千名开发者、工程师、公司和科学家的贡献,他们共同构建了这个自由可用的高质量知识图谱DBpedia

二、垂直领域最新开源知识图谱

CS-KG 2.0 - 计算机科学领域最大知识图谱

在垂直领域中,2025年6月发布的CS-KG 2.0是最新且规模最大的开源知识图谱之一。根据《Nature》上发表的论文,CS-KG 2.0包含超过10亿个RDF三元组约2400万个研究实体nature.com。另一个研究报告显示,CS-KG 2.0描述了2500万个实体,通过6700万个关系连接,提供了对科学知识的精细表示researchgate.net

CS-KG 2.0是对2022年发布的第一代CS-KG的重要升级。第一代CS-KG覆盖了约670万篇计算机科学领域的研究论文,提供了研究实体之间的广泛关系。CS-KG 2.0解决了第一代的几个主要限制:添加了实体的时间相关信息,包含了更多最新发表的论文,不再仅限于被引用过的论文,并基于OpenAlex项目构建,使其可以持续更新并链接到当前广泛认可的元数据目录。

CS-KG 2.0采用了语义网技术,如RDF和Web本体语言(OWL),这允许人类专家验证、管理和纠正数据及其本体模式。其应用价值包括支持智能文献搜索、自动创建文献综述、增强学术写作和引用、自动形成新假设、开发专业对话代理等多种应用场景。

三、中文开源知识图谱现状

1. CN-DBpedia - 中文领域规模最大的开放知识图谱

CN-DBpedia是由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科,是目前规模最大的开放中文知识图谱之一Data OpenKG。根据公开数据,CN-DBpedia包含900万+的百科实体以及6700万+的三元组关系Data OpenKG。其中包含mention2entity信息110万+,摘要信息400万+,标签信息1980万+,infobox信息4100万+Data OpenKG

CN-DBpedia主要从中文百科类网站(如百度百科、互动百科、中文维基百科等)的纯文本页面中提取信息,经过滤、融合、推断等操作后,最终形成高质量的结构化数据Data OpenKG。自2015年12月份发布以来,CN-DBpedia已经在问答机器人、智能玩具、智慧医疗、智慧软件等领域产生3.5亿次API调用量Data OpenKG

然而,值得注意的是,公开可获取的CN-DBpedia数据可能不是最新的。有资料显示,截至2024年,CN-DBpedia可能已包含"数千万个实体和超过2亿条关系"hanspub.org,但缺乏官方确认的最新精确数据。

2. OpenKG - 中文开放知识图谱社区平台

OpenKG是一个面向中文领域开放知识图谱的社区项目,主要目的是促进中文领域知识图谱数据的开放与互联腾讯网。OpenKG聚集了大量开放的中文领域知识图谱数据、工具及文献腾讯网

典型的中文开放知识图谱数据包括百科类的Zhishi.me(狗尾草科技、东南大学)、CN-DBPedia(复旦大学)、XLore(清华大学)、Belief-Engine(中科院自动化所)、PKUPie(北京大学)等腾讯网。这些百科知识图谱都已经通过OpenKG提供了开放的Dump或开放访问API腾讯网

此外,OpenKG还对一些重要的知识图谱开源工具进行了搜集和整理,这包括知识建模工具Protege、知识融合工具Limes、知识问答工具YodaQA、知识抽取工具DeepDive等腾讯网

四、开源知识图谱规模对比分析

1. 三元组数量对比

2025年主要开源知识图谱规模对比(三元组数量)

View the chart
View data

资料来源: Wikipediadbpedia.orgnature.comData OpenKG

上图展示了2025年主要开源知识图谱的三元组数量对比。Wikidata以166亿三元组的规模遥遥领先,是第二名DBpedia(14.6亿)的11倍多,是垂直领域最大的CS-KG 2.0(10亿)的16倍多,是中文知识图谱CN-DBpedia公开数据(0.67亿)的近250倍。这一数据充分说明了Wikidata在开放知识图谱领域的绝对领先地位。

2. 实体数量对比

2025年主要开源知识图谱规模对比(实体数量)

View the chart
View data

资料来源: arxiv.orgdbpedia.orgresearchgate.netData OpenKG

从实体数量来看,DBpedia的"Largest Diamond"数据集以2.2亿实体位居首位,超过了Wikidata的1.2亿实体。垂直领域的CS-KG 2.0包含2400万实体,而CN-DBpedia公开数据显示有900万实体。这表明DBpedia在实体覆盖广度上具有优势,而Wikidata则在三元组数量上占据绝对优势,说明Wikidata对实体间关系的描述更为丰富。

五、结论与推荐

基于本次全面调研,我们可以得出以下结论:

  1. 规模最大的开源知识图谱:Wikidata以166亿三元组的规模成为当前世界上最大的开源知识图谱,其数据量远超其他知识图谱。

  2. 最新的重要更新:2025年6月发布的CS-KG 2.0是垂直领域内最新且规模最大的开源知识图谱,其10亿三元组和2400万实体的规模在专业领域内十分突出。

  3. 中文知识图谱现状:CN-DBpedia是目前公开数据中规模最大的中文开源知识图谱,但其公开可获取的数据(900万实体,6700万三元组)可能不是最新的。中文知识图谱整体规模与国际主流知识图谱相比仍有较大差距。

  4. 推荐选择

    • 对于需要通用领域、多语言、超大规模知识图谱的应用场景,Wikidata是最佳选择;
    • 对于计算机科学领域的专业应用,CS-KG 2.0提供了最新、最全面的知识表示;
    • 对于中文领域应用,CN-DBpedia是目前最成熟的选择,但建议通过其API获取最新数据。

综上所述,如果单纯从"最新最大"的角度考虑,Wikidata无疑是当前最大的开源知识图谱,而CS-KG 2.0则是2025年发布的规模最大的垂直领域开源知识图谱。

Key references