跳转到帖子

游客您好,欢迎来到黑客世界论坛!您可以在这里进行注册。

赤队小组-代号1949(原CHT攻防小组)在这个瞬息万变的网络时代,我们保持初心,创造最好的社区来共同交流网络技术。您可以在论坛获取黑客攻防技巧与知识,您也可以加入我们的Telegram交流群 共同实时探讨交流。论坛禁止各种广告,请注册用户查看我们的使用与隐私策略,谢谢您的配合。小组成员可以获取论坛隐藏内容!

TheHackerWorld官方

精选回复

发布于

用途

官方点就是计算基数,直白点就是统计不重复的个数

参数为Uint类型,就是不是负数的整数 返回值为Uint64类型

案例

测试数据

UserID
1
1
2
3
SELECT groupBitmap(UserID) as num FROM t;

结果

num
3

再举个例子,比如我们有用户id uid, string类型,相要统计其个数,则

SELECT groupBitmap(toUInt64(uid)) as num from usertable;
+----+
|num |
+----+
|2399|
+----+

等价于如下查询

select count(distinct uid) from usertable;

那么要bitmap做什么呢?就是创建表时如果选择bitmap存储,就会比较节约空间

比如

create table testbit(
    label String,
    name String,
    uv AggregateFunction(groupBitmap,UInt64) comment bitmap存储用户
)engine=AggregatingMergeTree()
partition by label
order by (label,name);

groupBitmapState

可以看出返回值类型是AggregateFunction(groupBitmap,UInt64)

SELECT groupBitmapState(toUInt64(uid)) as num,
       toTypeName(num)
from usertable;

想要知道bitmap存储的是什么东西,直接查是看不出来的,需要转为数组才可以,比如

select bitmapToArray(groupBitmapState(toUInt64(uid))) from usertable;

如果想求基数,如下

select bitmapCardinality(groupBitmapState(toUInt64(uid))) from usertable;
+--------------------------------------------------+
|bitmapCardinality(groupBitmapState(toUInt64(uid)))|
+--------------------------------------------------+
|2399                                              |
+--------------------------------------------------+

参考

创建帐户或登录后发表意见

最近浏览 0

  • 没有会员查看此页面。