我想在hive中模拟bigquery的分位数函数。数据集:1,2,3,4bigquery的查询结果将返回值2选择n(2,分位数(col1,3))但在 hive 里:选择百分位(col1,0.5)我有2.5分注意:对于奇数个记录,我得到了相同的结果。Hive有没有足够的自定义项功能?
5uzkadbs1#
我想你要找的是 percentile_approx 自定义项。此页面提供配置单元中所有内置自定义项的列表。百分位_近似值(双栏,p[,b])返回组中数值列(包括浮点类型)的大约第p百分位。b参数以内存为代价控制近似精度。值越高,得到的近似值越好,默认值为10000。当col中不同值的数目小于b时,这将给出一个精确的百分位值。
percentile_approx
1条答案
按热度按时间5uzkadbs1#
我想你要找的是
percentile_approx
自定义项。此页面提供配置单元中所有内置自定义项的列表。
百分位_近似值(双栏,p[,b])
返回组中数值列(包括浮点类型)的大约第p百分位。b参数以内存为代价控制近似精度。值越高,得到的近似值越好,默认值为10000。当col中不同值的数目小于b时,这将给出一个精确的百分位值。