hive里面的sum()over()使用的时候是单线程计算的么? sum pay fee

7932℃ EMILIO

hive里面的sum()over()使用的时候是单线程计算的么?sum pay fee

hive中count和sum的区别

对你的问题有些疑问,不知你是要了解两者在hive的执行层面的区别,还是纯粹HiveSQL 的两个函数的问题?

如果是前者,把问题描述更具体一些,现在还不知你是想了解什么问题~

如果是后者,关于两个函数的区别,count 是记数,sum是求和。

比如有以下记录:

学号 姓名 课程 分数

001 张三 语文 88

001 张三 数学 90

如果针对上面数据中的分数进行count和sum,count的结果为2,表示2条记录,如果sum,就是88+90=178

hive中count和sum的区别是什么?

首先,sum是对一个字段进行求和,hive中字段的类型一般是string或者int,如果是int当然没问题,如果是string类型但是全部是数字也没问题,如果包含一个字母sum出来将会是0.

假如有这样一张简单的表

user_id stringshop_id string

1234hello

12341234

么sum(user_id)的结果是2468,sum(shop_id)的结果是0.如果没有符合条件的记录,sum的返回值将是null,如

sum(case when user_id<1000 then shop_id

end)返回值将是null。但某些时候我没希望sum的结果如果没有符合条件的记录就返回0怎么办呢,可以用coalesce(shop_id,0)解

决这个问题。

count是对数据记录的条数进行统计,有一条符合的记录就是1,没有就是0.

前几天遇到这样一条sql语句,sum(case when

substr(gmt_receive_pay,0,13)='$cur_date $env.last_hour' then t2.total_fee end)

as hour_alipay_fee,

我知道这条语句当没有符合条件的记录时计算出来结果是null,但是我没有意识到这是一个bug,我们要的结果应该是0。检讨一下。

hive sum包含null吗

sum是对一个字段进行求和,hive中字段的类型一般是string或者int,如果是int当然没问题,如果是string类型但是全部是数字也没问题,如果包含一个字母sum出来将会是0.

假如有这样一张简单的表

sqlite中计算累积和,类似sum()over()

WITH TMP AS

 (SELECT 1 AS ID, 10 AS SAL

    FROM DUAL

  UNION

  SELECT 2 AS ID, 20 AS SAL

    FROM DUAL

  UNION

  SELECT 3 AS ID, 30 AS SAL

    FROM DUAL

  UNION

  SELECT 4 AS ID, 10 AS SAL

    FROM DUAL)

SELECT T.ID, T.SAL, SUM(S.SAL)

  FROM TMP T, TMP S

 WHERE S.ID <= T.ID

 GROUP BY T.ID, T.SAL

 ORDER BY T.ID;

TAG: 里面 时候