远程连接hive 本机需要有hive吗

答案:2 悬赏:0 手机版

解决时间 2021-03-16 06:02

提问者网友：疯孩纸
2021-03-15 21:02

远程连接hive 本机需要有hive吗

最佳答案

五星知识达人网友：往事隔山水
2021-03-15 21:47

1、hive 命令行模式，直接输入/hive/bin/hive的执行程序，或者输入 hive --service cli
用于linux平台命令行查询，查询语句基本跟mysql查询语句类似
2、 hive web界面的 (端口号9999) 启动方式
hive –service hwi &
用于通过浏览器来访问hive，感觉没多大用途
3、 hive 远程服务 (端口号10000) 启动方式
hive --service hiveserver &
或者
hive --service hiveserver 10000>/dev/null 2>/dev/null &
备注：
连接Hive JDBC URL：jdbc:hive://192.168.6.116:10000/default （Hive默认端口：10000 默认数据库名：default）

全部回答

1楼网友：妄饮晩冬酒
2021-03-15 22:05

dataframe.registertemptable("result") sql(s"""insert overwrite table $outputtable partition (dt ='$outputdate') select * from result""") 而整个结果数据的产生只需要4分钟左右的时间，比如以下方式：将结果以textfile存入hdfs： result.rdd.saveastextfile(output_tmp_dir) 由此可见，对hive的写入操作耗用了大量的时间。对此现象的优化可以是，将文件存为符合hive table文件的格式，然后使用hive load将产生的结果文件直接move到指定目录下。代码如下： result.rdd.map { r => r.mkstring("\001") }.repartition(partitions).saveastextfile(output_tmp_dir) sql(s"""load data inpath '$output_tmp_dir' overwrite into table $output partition (dt='$dt')""")

我要举报

如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息，可以点下面链接进行举报！

点此我要举报以上问答信息