IDEA下寫(xiě)hive的udf(踩坑教程)

配置maven的過(guò)程網(wǎng)上有很多這里就不寫(xiě)了。
UDF
用戶自定義函數(shù)(user defined function)–針對(duì)單條記錄。
創(chuàng)建函數(shù)流程
1、自定義一個(gè)Java類(lèi)
2、繼承UDF類(lèi)
3、重寫(xiě)evaluate方法 (必須重寫(xiě)這個(gè)方法)
4、打成jar包
6、在hive執(zhí)行add jar方法
7、在hive執(zhí)行創(chuàng)建模板函數(shù)
8、hql中使用

package UDFDemo;//注意如果這里有包的等會(huì)兒會(huì)用到
import org.apache.hadoop.hive.ql.exec.Description;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

import java.math.BigInteger;

public class int2inetaddress extends UDF{
    //重寫(xiě)evaluate方法
  //這里要注意,如果數(shù)據(jù)庫(kù)的類(lèi)型是bigint等還是要用text類(lèi)型
    public Text evaluate(Text input){
        BigInteger one =  new BigInteger(input.toString());
        long intinput = one.longValue();
        String ipStr =
                String.format("%d.%d.%d.%d",
                        (intinput & 0xff),
                        (intinput >> 8 & 0xff),
                        (intinput >> 16 & 0xff),
                        (intinput >> 24 & 0xff));
        return new Text(ipStr);
    }
}

配置MAVEN的可以參考以下,將以下內(nèi)容的 <dependencies>和 <build>放入自己的maven文件當(dāng)中


<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>cupid</groupId>
    <artifactId>int2inetaddressUDF</artifactId>
    <version>1.0-SNAPSHOT</version>

<!---->

    <properties>
        <project.build.sourceEncoding>UTF8</project.build.sourceEncoding>
        <!--Hadoop版本更改成自己的版本-->
        <hadoop.version>2.5.0-cdh5.2.0</hadoop.version>
        <hive.version>1.1.0-cdh5.8.0</hive.version>
    </properties>
<repositories>

    <!--加入Hadoop原生態(tài)的maven倉(cāng)庫(kù)的地址-->
    <repository>
        <id>Apache Hadoop</id>
        <name>Apache Hadoop</name>
        <url>https://repo1.maven.org/maven2/</url>
    </repository>
    <!--加入cdh的maven倉(cāng)庫(kù)的地址-->
    <repository>
        <id>cloudera</id>
        <name>cloudera</name>
        <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
    </repository>
</repositories>

<dependencies>
<!--添加hadoop依賴-->
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-common</artifactId>
    <version>${hadoop.version}</version>
</dependency>
<!--添加hive依賴-->
<dependency>
    <groupId>org.apache.hive</groupId>
    <artifactId>hive-exec</artifactId>
    <version>${hive.version}</version>
</dependency>
</dependencies>

<!--
下面是用于打包的插件,如果不用這個(gè)插件導(dǎo)出jar可能會(huì)出現(xiàn)問(wèn)題
-->
    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-shade-plugin</artifactId>
                <version>1.4</version>
                <executions>
                    <execution>
                        <phase>package</phase>
                        <goals>
                            <goal>shade</goal>
                        </goals>
                        <configuration>
                            <filters>
                                <filter>
                                    <artifact>*:*</artifact>
                                    <excludes>
                                        <exclude>META-INF/*.SF</exclude>
                                        <exclude>META-INF/*.DSA</exclude>
                                        <exclude>META-INF/*.RSA</exclude>
                                    </excludes>
                                </filter>
                            </filters>

                            <transformers>
                                <transformer
                                        implementation="org.apache.maven.plugins.shade.resource.AppendingTransformer">
                                    <resource>META-INF/spring.handlers</resource>
                                </transformer>
                                <transformer
                                        implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer">
                                    <mainClass>com.neu.hive.UDF.ToUpperCaseUDF</mainClass>
                                </transformer>
                                <transformer
                                        implementation="org.apache.maven.plugins.shade.resource.AppendingTransformer">
                                    <resource>META-INF/spring.schemas</resource>
                                </transformer>
                            </transformers>
                        </configuration>
                    </execution>
                </executions>
            </plugin>
        </plugins>
    </build>
</project>

使用maven打包,打包過(guò)程可以參考視頻。

打包后的文件在你的項(xiàng)目的target當(dāng)中,上傳那個(gè)幾kb的original-int2inetaddressUDF-1.0-SNAPSHOT.jar那個(gè)文件,上傳到服務(wù)器上隨便一個(gè)目錄

然后進(jìn)入hive

添加jar包

add jar 你的文件路徑/original-int2inetaddressUDF-1.0-SNAPSHOT.jar;

可以用list jars;查看是否添加成功

create temporary function myudf as "UDFDemo.int2inetaddress";

然后就可以用了

select myudf(XXX) from xxxx

可以參考這里的視頻:
http://www.cnblogs.com/simuhunluo/p/7756250.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容