我是靠谱客的博主 年轻向日葵,这篇文章主要介绍Gobblin简介,现在分享给大家,希望可以做个参考。

   


 Gobblin是LinkedIn公司开发的用于在Hadoop环境里统一数据抽取的框架。目前Gobblin可以建立多种pipelines,比如数据质量检查器、源数据管理、开发和其他操作。 

    Gobblin支持多种类型的数据源。例如数据库,Rest Api服务,FTP/SFTP,hdfs文件系统等,Gobblin对其中的数据抽取,转换和加载,包括任务调度,任务分片,错误处理,任务状态管理,数据质量检查,数据发布等。Gobblin对这些不同的数据源统一源数据管理。

   Gobblin是一款集可用性,容错性,质量保证,可扩展性,处理数据模型变化的简单易用的数据抽取工具。

最后

以上就是年轻向日葵最近收集整理的关于Gobblin简介的全部内容,更多相关Gobblin简介内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(43)

评论列表共有 0 条评论

立即
投稿
返回
顶部