百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Table.Group 按时期累计计算唯一值

wptr33 2025-08-03 08:48 1 浏览

本期案例是根据不同id进行汇总统计:组内,相同日期的为一组,统计“from”、“to”中的非重复个数;连续日期的,统计累计数。前后转换效果如下:

解题套路

1.Table.Group

解题思路:根据id和date进行分组,这样获得的子表对于首个分组才有作用。

比如A,第一个分组非重复个数是3,第二组也是3,因第一组和第二组没有重复数,结果是对的。但是换成B,就错了,单独统计的结果与实际结果差了1个。所以,这里分组需要引用其他数据进行转换。

这里通过Table.SelectRows筛选id相同,并且日期小于当前分组日期的数据,然后对后两列进行深化合并去重,最后统计个数。

Table.Group(源,{"id","date"},{"cum_sum",each List.Count(List.Distinct(List.Combine(List.Skip(Table.ToColumns(Table.SelectRows(源,(x)=>x[id]=[id]{0} and x[date]<=[date]{0})),2))))})


这种写法,换成通过添加列的方式也是一样的,多去重和删除列的步骤:

Table.RemoveColumns(Table.AddColumn(Table.Distinct(源,{"id","date"}),"cum_sum",each List.Count(List.Distinct(List.Combine(List.Skip(Table.ToColumns(Table.SelectRows(源,(x)=>x[id]=[id] and x[date]<=[date])),2))))),{"from","to"})

这里也可以最后再去重,不影响最终的结果。


2.List.Accumulate

解题思路:ACC的操作会复杂点,涉及到不同的id,不同的date,其实可以结合分组函数进行转换,可以减少一个判断。

这里函数的第二参数包含五项的列表,第一项用于存放最后的结果,第二项用于存放相同id的结果,第三项是id,第四项是date,最后一项用于存放源数据中最后两列的数据。

当id相同时,在日期相同的情况下,只直接对后两项进行连接;日期不同的时候,将日期与第五项去重个数存放在第二项中。

当id不同时,将第二项数据转移到第一项中,同时,更新第三、四、五项数据。

Table.FromRows(List.Skip(List.Accumulate(Table.ToRows(源)&{{"T",0,"",""}},{{},{},"","",{}},(x,y)=>if x{2}=y{0} then if x{3}=y{1} then {x{0},x{1},x{2},x{3},x{4}&List.LastN(y,2)} else {x{0},x{1}&{List.FirstN(y,2)&{List.Count(List.Distinct(x{4}))}},x{2},y{1},x{4}&List.LastN(y,2)} else {x{0}&x{1}&{{x{2},x{3},List.Count(List.Distinct(x{4}))}},{},y{0},y{1},List.LastN(y,2)}){0}),{"id","date","cum_sum"})


以上是本期内容。

相关推荐

MySql系列-常用命令

本篇是对...

Record.ToTable 格式转换

本期案例对表格格式进行转换,前后转换效果如下:解题套路1.Record.ToTable解题思路:思路就是构造可以透视的样式。使用Record.ToTable对行记录进行转换,获得包含两列的表,首行可以...

Table.Group 按时期累计计算唯一值

本期案例是根据不同id进行汇总统计:组内,相同日期的为一组,统计“from”、“to”中的非重复个数;连续日期的,统计累计数。前后转换效果如下:解题套路1.Table.Group...

MySQL 9.1正式发布,有哪些值得关注的新特性?

MySQL创新版9.1.0于2024年10月15日正式发布。此外,MySQL8.0.40及8.4.3补丁版本也同时发布。8.4.3是目前MySQL的LTS长期支持版本,该版本中将不会增加新的功能与特性...

SQL基本语句练习(基础版)

最近在学习SQL基本语句的练习,在此分享一下笔者做过的练习以及个人的解决教程:首先是基本练习表格的搭建,具体内容如下表所示:...

SQL 从入门到精通:全面掌握数据库操作

学习SQL(StructuredQueryLanguage)是掌握数据库操作的关键步骤。SQL是一种用于管理和处理关系型数据库的标准语言,广泛应用于数据检索、插入、更新和删除等操作。以下是一些...

ClickHouse学习笔记四ClickHouse基础语法

前言这里我们介绍ClickHouse的基本语法,使用环境是腾讯云的ClickHouse。默认情况下,ClickHouse在进行集群纬度执行建表等DDL操作时需要手动添加ONCLUSTERX...

程序员总结的常用sql语句大全

多年经验程序员总结的我们一般需要使用的sql语句,赶快收藏起来,方便以后使用。以下是一些常用的SQL语句及其用法:一、数据定义语言(DDL)创建库CREATEDATABASE:创建一个新数据库。...

PQ03-分组求和

目标已知:销售清单求:每个销售员的销量合计方法数据准备...

好荐:一款数据库元数据管理平台工具

“元数据”的定义在不同的软件、项目、工程的定义范围都不太一样。本文这里指的是软件项目开发使用的数据库表结构信息。我今天介绍的这个开源项目叫Databasir,它是一个面向团队的关系型数据库模型文档管理...

MySQL 8.0 SQL优化黑科技,面试官都不一定知道!

前言提到SQL优化,大多数人想到的还是那些经典套路:建索引、避免全表扫描、优化JOIN顺序…这些确实是基础,但如果你还停留在MySQL5.7时代的优化思维,那就out了。MySQL8.0已经发布好...

MySQL数据库深度优化指南:从基础到架构层面的20个关键策略

一、核心性能优化原则数据最小化原则...

动物源性食品中兽药残留的检测——喹啉类药物残留

喹啉类药物(quinoxaline)是具有喹啉-N1,N4-二氧化物基本结构的一类化学合成的动物专用药,具有广谱抗菌、提高饲料转化率和促生长作用。1965年德国拜耳公司以邻硝基苯胺为原料合成喹乙醇(o...

适合普通开发者和产品经理的PHP应用模板开发AI的SaaS应用框架

简单到傻!Liang_SaaS适合普通开发者和产品经理的PHP应用模板开发AI的SaaS应用框架,利用Php开发AI的SaaS应用框架,是一个强大的内容管理仪表板模板,基于Bootstrap和...

Power Query 交错合并表格的方法

两张表格合并成一张表格,需要交错排列,表1取一行,表2取一行,这样排列在一起:前提是两张表的行数相同,内容排列顺序相同:我们来看两张表:表1:12列10行表2:11列10行行数相同列数不同,我们在数据...