概述
Tushare ID :475226
我国金融市场在改革开放之后取得了瞩目的成绩,并且随着信息技术的发展、金融市场的发展,金融机构都累积了非常庞大的数据量,包括了海量的交易内容和资讯消息数据等,从业者们希望能够将这些数据充分挖掘,以解决更多的问题、发现更多的机遇。2012年Google正式提出了知识图谱的概念,它是一种揭示实体之间关系的语义网络,通过建立实体之间的关系形成图谱网络,通过对知识图谱的挖掘,能够发现很多数据中隐含表达的内容。
知识图谱的构建往往需要将结构化的数据和非结构化的数据进行整合、加入。
结构化数据的输入往往比较简单,我们可以先试着将一部分结构化数据输入到Neo4J(图数据库)中,形成最构建金融领域知识图谱中最基础的部分。
图:根据行业进行分类的图谱展示
首先我们可以通过tushare获取这些基础数据
现在tushare里面选取需要的内容,可以直接点击生成代码获取对应的代码,直接存对应的dataframe即可。
图:tushare数据获取界面,很方便
这里我们把数据都存为csv格式的。先搭建一个最简单的 行业-公司 关系的知识图谱。
数据长这样的:
那我们只需要按列把数据输入到neo4j中即可:
LOAD CSV with headers FROM "file:///你的文件的名字.csv" as line
然后用merge将其对应的实体(和属性)写入:
MERGE (:company { stock_change:line[0],name: line[3]})
具体cypher写法可以参考论坛上其他答案。
然后我们就可以得到:
如图所示的构建的基于产业链的知识图谱啦。
当然,我们也可以通过py2neo将上述步骤进行整合,一口气输入
之后便可以加入实体、关系识别、实体对齐、以及对知识图谱的后续应用等模块了。
最后
以上就是传统冬天为你收集整理的金融领域的知识图谱搭建简单实操(基于Neo4J)的全部内容,希望文章能够帮你解决金融领域的知识图谱搭建简单实操(基于Neo4J)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复