爱笑过客

文章
6
资源
1
加入时间
2年10月17天

Hive2ElasticSearchHive2ElasticSearch

Hive2ElasticSearch目标是将hive数据导入到es中。 起初通过读hive中的表文件使用bulk api来向es推数,但是效率太低,满足不了大数据的需求。 后来发现es官方提供了解决方案es-hadoop。在此记录一些使用中遇到的问题。ES-hadoop为elasticsearch提供了一个hive存储处理器(Hive storage handler),使开发人员可以直接定义一个

多分类问题Softmax Regression

ref:http://www.cnblogs.com/BYRans/p/4905420.html多分类问题 在一个多分类问题中,因变量y有k个取值。例如在邮件分类问题中,我们要把邮件分为垃圾邮件、个人邮件、工作邮件3类,目标值y是一个有3个取值的离散值。这是一个多分类问题,二分类模型在这里不太适用。多分类问题符合多项分布。有许多算法可用于解决多分类问题,像决策树、朴素贝叶斯等。这篇文章主要讲

一文掌握Java8Stream流的常见用法

前言Lambda 表达式是 jdk8引入的一个新特性,可以取代大部分的匿名内部类,在集合的遍历和对集合的操作中,可以极大地优化代码结构。而jdk8又是现在的主流版本,关于lambda表达式,其实也得多多少少了解一点,尤其是在某些情况下,使用lambda表达式确实能够方便很多。在接下来的内容中,通过从简单到复杂,一步一步去了解lambda与Stream流。Lambda表达式遍历比如下面这个数组::String[] name = {"Tom", "Abel",