概述
【1】De Abreu, D., Flores, A., Palma, G., Pestana, V., Pinero, J., Queipo, J., … & Vidal, M. E. (2013). Choosing Between Graph Databases and RDF Engines for Consuming and Mining Linked Data. In COLD.
【2】User Behavior Tutorial
【3】刘知远 知识图谱——机器大脑中的知识库 第二章 知识图谱——机器大脑中的知识库
【4】Nickel, M., Murphy, K., Tresp, V., & Gabrilovich, E. A Review of Relational Machine Learning for Knowledge Graphs.
【5】Socher, R., Chen, D., Manning, C. D., & Ng, A. (2013). Reasoning with neural tensor networks for knowledge base completion. In Advances in Neural Information Processing Systems (pp. 926-934).
【6】Bordes, A., Usunier, N., Garcia-Duran, A., Weston, J., & Yakhnenko, O. (2013). Translating embeddings for modeling multi-relational data. In Advances in Neural Information Processing Systems (pp. 2787-2795).
【7】Jenatton, R., Roux, N. L., Bordes, A., & Obozinski, G. R. (2012). A latent factor model for highly multi-relational data. In Advances in Neural Information Processing Systems (pp. 3167-3175).
我们具体再来看金融知识图谱,这是我们今天在中国市场上看到主要的各种类型的金融知识图谱。这是一个很粗的分类,每一个分类下面,都会有很多更细分的分类。比如像前面的创投类数据库,滕放腾总,文飞翔文总,还有郭颖哲郭总,他们接下来会分别向大家介绍自己的经验。另外在很多其他类型的市场上,包括一级市场、二级市场,我们都看到各种不同的知识图谱、数据库陆陆续续出现。比如做A股、新三板的公司,其实还有做港股、美股的公司,各种基本面的数据,行情的数据,现在都在陆陆续续地知识图谱化。以前大家只看 F10,现在一种智能的“F10”出现了,还有公告数据、研报数据的提取、公告研报的检索等等。泛舆情数据、泛企业数据和各种工商数据,都是我们今天看到的金融知识图谱的不同分支。
1.智能金融的本质:其本质是金融信息处理的部分环节中间件化,金融大工业不是超出市场收益率的投资决策,而是建立金融信息处理的协作系统,直奔主题的金融智能系统并不行得通。
的确,在蚂蚁金服,他们就有专门的中间件团队,打造了大量的金融中间件,如果金融大工业是为了找出超出市场收益率的投资决策,那想必这些公司在下一刻就不会存在了,因为大家都忙着躺赚了。
学习资源汇总:
内含参考文献项目源码等:
https://github.com/husthuke/awesome-knowledge-graph
这个系统的强化学习算法同时用到了 Sarsa(On-Policy TD Control)和 Q-learning(Off-Policy Temporal Difference Control Algorithm)
数据库:
2.1 开放链接知识库 在LOD项目的云图中,Freebase、Wikidata、
DBpedia、YAGO这4个大规模知识库处于绝对核心 的地位,它们中不仅包含大量的半结构化、非结构 化数据,是知识图谱数据的重要来源。而且具有较 高的领域覆盖面,与领域知识库存在大量的链接关 系。
- Freebase
Freebase知识库[15]早期由Metaweb公司创建,后 来被Google收购,成为Google知识图谱的重要组成 部分。Freebase中的数据主要是由人工构建,另外一 部分数据则主要来源于维基百科、IMDB、Flickr等 网站或语料库。截止到2014年年底,Freebase已经包 含了6 800万个实体,10亿条关系信息,超过24亿条 事实三元组信息,在2015年6月,Freebase整体移入 至WikiData。 - Wikidata
Wikidata[16]是维基媒体基金会主持的一个自由 的协作式多语言辅助知识库,旨在为维基百科、维 基共享资源以及其他的维基媒体项目提供支持。它 是Wikipedia、Wikivoyage、Wikisource中结构化数据
的中央存储器,并支持免费使用[17]。Wikidata中的 数据主要以文档的形式进行存储,目前已包含了超 过1 700万个文档。其中的每个文档都有一个主题或 一个管理页面,且被唯一的数字标识。 - DBpedia
DBpedia[18]是由德国莱比锡大学和曼海姆大学 的科研人员创建的多语言综合型知识库,在LOD项 目中处于最核心的地位。DBpedia是从多种语言的维 基百科中抽取结构化信息,并且将其以关联数据的 形式发布到互联网上,提供给在线网络应用、社交 网站以及其他在线知识库。由于DBpedia的直接数据 来源覆盖范围广阔,所以它包含了众多领域的实体 信息。截止至2014年年底,DBpedia中的事实三元组 数量已经超过了30亿条。除上述优点外,DBpedia 还能够自动与维基百科保持同步,覆盖多种语言。 - YAGO
YAGO[19]是由德国马普所(max planck institute, MPI)的科研人员构建的综合型知识库。YAGO整合 了维基百科、WordNet[20]以及GeoNames等数据源, 特别是将维基百科中的分类体系与WordNet的分类 体系进行了融合,构建了一个复杂的类别层次结构 体系。第一个版本包含了超过100万的实体以及超过 500万的事实。2012年,发布了它的第二个版本,在 YAGO的基础上进行了大规模的扩展,引入了一个 新的数据源GeoNames[21],被称为YAG02s。包含了 超过1 000万的实体以及超过1.2亿的事实。
最后
以上就是称心芝麻为你收集整理的知识图谱(以金融知识图谱为例)的全部内容,希望文章能够帮你解决知识图谱(以金融知识图谱为例)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复