news 2026/6/10 10:53:10

如何计算数据立方体中聚合单元的个数?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何计算数据立方体中聚合单元的个数?

课件例题

这个题如此抽象,先看一下基本概念:

有两种情况:count>=1,count>=2

理解一下,这里count>=1时,相当于把每个基础单元格看作集合,然后求出这个集合的所有真子集,然后取并集

发现

数据立方体count>=k(k>=2,k=1的时候还是用容斥原理吧)时聚合单元的个数,等于挖掘频繁项集支持度>=k的个数+1(ALL的情况)

可以这样理解,如果是(a1,b1,*,*)这种情况,就是不考虑后面的项目,相当于只有(a1,b1)

对于课件中count>=2的这一问,1-频繁项集a1,a2,2-频繁项集a1a2,再加上ALL,共4个

一个练习题

按照挖掘频繁项集的思路:1-频繁项集:a1,b1,c1,共3个

2-频繁项集a1b1,a1c1,共2个

3-频繁项集,没有

再加上(*,*,*,*,*,*),一共6个

如果是count>=1呢?

T1T2T3都有2^6 ,3*2^6

T1T2共有(a1,b1),2^2;T2T3共有(a1),2;T1T2共有(a1,c1),2^2

T1T2T3共有a1,2

根据课件中讲的,还要减去basecell,也就是184-3 = 181

闭立方体

冰山立方体与闭立方体常常比较

还是这个例题:

计算冰山立方体的数目与闭立方体的数目

冰山立方体的结果是

闭立方体的计算结果是

(a1)(a1,b1)(a1,c1)

在冰山立方体的基础上,找到最长的项集(a1,b1),(a1,c1),如果它分别的子集(a1),(b1)和(a1),(c1)的count值跟它一样,就把子集去掉

另外,all相当于空集的情况

因为(a1)的子集有空集,且all的count也是3,于是all也被剔除掉了

闭立方体同样可以用闭频繁项集理解:

刚刚的闭立方体是无损压缩,还有个概念是最大立方体,是有损压缩

最大立方体

用之前的例子:

也是先算冰山立方体

最大立方体只有两个记录:(a1,b1),(a1,c1)

同样用频繁项集的概念来理解,最大立方体对应最大频繁项集,也就是要去掉频繁项集的子集(a1,b1)包含子集(a1)(b1)空集,(a1,c1)包含子集(a1)(c1)空集都去掉

闭立方体与最大立方体的区别

闭立方体在剔除的时候,只剔除子集中与这个项集count数目一致的,而最大立方体,不管子集的大小,都剔除

这里立方体定义的时候与项集不同

立方体定义的,父集是(a1,*,*,*),它的子集是(a1,b1,*,*)等

而我刚刚说的子集是项集这个集合的概念,(a1,b1)的子集是(a1)(b1)

对于(*,*,*,*)这种all的情况,相当于空集

(个人认为用项集的概念转化一下就更好理解,希望能有原始的更好的理解方法)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 8:46:24

OptiScaler终极指南:解锁多平台AI上采样的完整潜力

在当今游戏图形技术飞速发展的时代,AI上采样技术正成为平衡性能与画质的关键武器。作为一款革命性的多平台优化工具,OptiScaler通过其强大的DLSS替代方案,让AMD、Intel和NVIDIA显卡用户都能享受到高质量的超分辨率体验。本文将带您深入探索Op…

作者头像 李华
网站建设 2026/6/10 11:04:31

FreeCAD参数化设计实战:从零构建自动化机械零件库

FreeCAD参数化设计实战:从零构建自动化机械零件库 【免费下载链接】FreeCAD This is the official source code of FreeCAD, a free and opensource multiplatform 3D parametric modeler. 项目地址: https://gitcode.com/GitHub_Trending/fr/freecad 在机械…

作者头像 李华
网站建设 2026/6/10 9:18:25

TensorFlow分布式训练实战:提升GPU算力利用率

TensorFlow分布式训练实战:提升GPU算力利用率 在现代AI工程实践中,一个再熟悉不过的场景是:昂贵的GPU集群长时间处于低负载状态,训练任务动辄耗时数十小时,团队被“模型跑得慢、资源用不满、问题难定位”所困扰。这背后…

作者头像 李华
网站建设 2026/6/10 11:10:00

终极3D抽奖系统:企业活动的完美互动解决方案

终极3D抽奖系统:企业活动的完美互动解决方案 【免费下载链接】log-lottery 🎈🎈🎈🎈年会抽奖程序,threejsvue3 3D球体动态抽奖应用。 项目地址: https://gitcode.com/gh_mirrors/lo/log-lottery log…

作者头像 李华
网站建设 2026/6/10 11:11:31

紧急通知:Open-AutoGLM镜像源即将变更,速看最新下载方案

第一章:Open-AutoGLM镜像源变更背景与影响近期,Open-AutoGLM 项目的官方镜像源由原先的 registry.example-ai.org/open-autoglm 迁移至新的域名地址 hub.openglm.ai/auto-glm。此次变更是由于原托管平台停止对开源大模型镜像的免费存储支持,项…

作者头像 李华
网站建设 2026/6/10 13:07:08

深度学习框架基于YOLOv8➕pyqt5的钢材表面缺陷检测系统,YOLOV8模型如何训练钢材表面缺陷数据集 识别检测开裂“, ‘内含杂质‘, ‘斑块斑点‘,“点蚀表面“, ‘轧制氧化皮‘, ‘划痕

基于YOLOv8➕pyqt5的钢材表面缺陷检测系统,系统实现了对于6类钢材表面缺陷识别检测功能,内含2700张钢材表面缺陷数据集 包括[“开裂”, ‘内含杂质’, ‘斑块斑点’,“点蚀表面”, ‘轧制氧化皮’, ‘划痕’],6类 通过选择图片、视频进行实时…

作者头像 李华