本文主要介绍如何在SQL-Hive中使用Select From,具有一定的参考价值。有兴趣的朋友可以参考一下。希望大家看完这篇文章后收获多多。
专注于为中小企业提供成都网站设计、网站建设服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业灌阳免费做网站提供优质的服务。我们立足成都,凝聚了一批互联网行业人才,有力地推动了千余家企业的稳健成长,帮助中小企业通过网站建设实现规模扩充和转变。
查询指定的某一列或某几列,命令如下:
SELECT 列名1,列名2,…… FROM 表名;
查询表中的所有字段时,可以使用代表所有字段。星号()是选取所有列的快捷方式。命令如下:
SELECT * FROM 表名;
如果我们想查询表 t_od_use_cnt 中的所有的user_id和use_cnt,具体命令如下:
SELECT user_id
,use_cnt
FROM app.t_od_use_cnt;
备注:app是数据库名,如果当前查询表与当前使用数据库一致,可以省略不写
在Hive中这样写虽然语法正确(不加分区),但在实际工作中这样写很可能会报错。
因为Hive中的表一般数据量极大,为了防止用户误操作进行全表扫描,可以设置为查询分区表时必须加入分区限制。比如这里我们的分区字段是date_8这个日期字段,工作中的表会要求我们必须限定查询哪几天的分区数据。这里我们可以输入设置参数进行模拟,命令如下:
hive (app)> set hive.mapred.mode;
hive.mapred.mode=nonstrict
hive (app)> set hive.mapred.mode=strict;
hive (app)> set hive.mapred.mode;
hive.mapred.mode=strict
然后我们重新执行上面的查询语句,报错如下:
hive (app)> SELECT user_id
> ,use_cnt
> FROM app.t_od_use_cnt;
FAILED: SemanticException [Error 10041]: No partition predicate found for Alias "t_od_use_cnt" Table "t_od_use_cnt"
hive (app)>
如下使用where语句限定分区即可解决这个问题:
SELECT user_id
,use_cnt
FROM app.t_od_use_cnt
WHERE date_8 = '20210420';
上面的查询语句会返回查询到的所有数据,但有时候我们只是要确认一下表中的数据内容,或者要指定行数据,比如只要100行,这时只需要在查询语句后加上(limit 数字)即可。
查询表t_od_use_cnt中前5行数据,命令如下:
SELECT user_id
,use_cnt
FROM app.t_od_use_cnt
WHERE date_8 = 20190101 Limit 5;
运行结果如下:
hive (app)> SELECT user_id
> ,use_cnt
> FROM app.t_od_use_cnt
> WHERE date_8 = 20210420 Limit 5;
OK
user_id use_cnt
10000 6
10001 49
10002 23
10003 1
10004 29
Time taken: 0.829 seconds, Fetched: 5 row(s)
hive (app)>
在查询时可以对数值类型的字段进行加减乘除和取余等四则运算
下面我们将表t_od_use_cnt中use_cnt列和is_active列相乘得到一个新列,其他用法依次类推。
hive (app)> SELECT user_id
> ,use_cnt
> ,is_active
> ,use_cnt * is_active
> FROM app.t_od_use_cnt
> WHERE date_8 = 20210420 Limit 5;
OK
user_id use_cnt is_active _c3
10000 6 1 6
10001 49 1 49
10002 23 1 23
10003 1 0 0
10004 29 1 29
Time taken: 0.124 seconds, Fetched: 5 row(s)
hive (app)>
可以看到上面的例子中我们通过两个列相乘人为制造出一个新列,系统默认将其列名起为_c3。通常有必要给这些新产生的列起一个别名。已有列的列名如果含义不清晰也可以通过起别名的方式进行更改。不过别名只在本条SQL语句中生效,不影响原表中的字段名。
这里顺便介绍一下字段命名规则:
1.不能和已有字段重复
2.只能包括小写字母(a-z)、数字(0-9)、下划线(_)
3.以字母开头
4.单词之间用下划线_分割
这里我们将别名起为active_use_cnt,在列后面加 AS active_use_cnt即可。另AS可以省略,只用空格分隔别名也可以生效
hive (app)> SELECT user_id
> ,use_cnt
> ,is_active
> ,use_cnt * is_active AS active_use_cnt
> FROM app.t_od_use_cnt
> WHERE date_8 = 20210420 Limit 5;
OK
user_id use_cnt is_active active_use_cnt
10000 6 1 6
10001 49 1 49
10002 23 1 23
10003 1 0 0
10004 29 1 29
Time taken: 0.239 seconds, Fetched: 5 row(s)
hive (app)>
网站标题:详解SQL-Hive中的Select From
转载来源:http://www.shufengxianlan.com/qtweb/news10/194360.html
网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联