百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

用PostgreSQL生成日历表(Calendar Table)

wptr33 2025-07-08 23:40 7 浏览

前言

前天我们通过一段代码展示了如何通过Python的Pandas包生成一个日历表,如果各位感兴趣可以参考:通过Pandas生成日历表

不得不说在 DB Engine(
https://db-engines.com/en/ranking)排行榜中,PostgreSQL最近几年一直都很稳定,并且在各个云平台中都有非常成熟的PaaS产品供各个企业应用,那么我们今天的目标就是演示一下如何通过
#postgresql#来生成类似的日历表。

本文使用的PostgreSQL版本为14.1,Windows Server 2016环境下运行。



一些重要的功能

GENERATE_SERIES

在完成解决方案之前,我们先了解PostgreSQL的一个函数:“GENERATE_SERIES”,通过字面意思应该能大致猜出来,这个函数可以生成一个序列的数据,直白讲就是生成单列的一个数据表。

我们先通过psql命令得到对于此函数的描述,如下图所示:

此函数主要有几个特点:

  1. 可以返回整型(bigint,int),浮点类型(numeric)序列;
  2. 可以返回带时区的时间戳类型(timestamp)序列;
  3. 可以返回不带时区的时间戳类型(timestamp)序列;

简单举个例子:

1.1 返回整型序列

  • 当指定起点,终点参数
SELECT GENERATE_SERIES(1, 10);

结果如下所示:

  • 当指定起点,终点,步长参数

步长可以理解为跳跃值,从1开始,如果步长为2,那么下一个数字应该是1 + 2 = 3,以此类推;

SELECT GENERATE_SERIES(1, 10, 2);

1.2 返回浮点类型序列

此功能类似于返回整型序列,不同点是传入的可以是带小数位的浮点类型数据,如下图所示:

SELECT GENERATE_SERIES(1.1, 10.9, 0.5);

1.3 返回时间戳(timestamp)序列

此功能可以通过指定起点,终点和步长三个参数,返回一段时间戳的序列数据,如下图所示:

SELECT GENERATE_SERIES('2022-01-01'::TIMESTAMP, '2022-01-31'::TIMESTAMP, '1 DAY') AS datum;

需要注意的是:

  • 必须同时指定三个参数,起点,终点,步长;
  • 起点和终点参数,必须是时间戳类型(timestamp),如果传入的是日期类型,需要显示转换;
  • 步长可以是小时,分钟,秒,天,星期,年等;


日期类型数据操作

我们需要记住这一个操作:日期 + 整数 = 日期,如下面例子所示:

date + integer → date
Add a number of days to a date
date '2022-01-09' + 5 → 2022-01-14

下面我们结合GENERATE_SERIES 函数实现如何得到一个日期类型的序列;

起点:2022-01-01, 终点:2022-01-31;这两个时间点中间间隔了30天,通过代码实现如下:

SELECT '2022-01-01'::DATE + s.a AS datum
FROM GENERATE_SERIES(0, 30) AS s(a);

结果如下图所示:

这种方案的优势是:

  1. 返回日期类型序列,原函数仅支持传入时间戳类型数据;
  2. 不需要按日期时间的Interval指定时间间隔,将时间间隔默认为1天。


自定义函数

通过上面的练习,我们已经能够通过传入开始日期和间隔天数得到我们想要的结果。可是如果业务上经常变换开始日期和时间间隔,我们还需要不断的重写SQL语句。为了避免重新改写SQL语句,我们将定义一个函数“get_calendar”,并将“开始日期”(start_dt)和“时间间隔”(days)做为参数传入,从而使我们的结果和语句更加灵活。

代码如下所示:

CREATE OR REPLACE FUNCTION public.get_calendar(
	start_dt date,
	days integer)
    RETURNS TABLE(datum date) 
    LANGUAGE 'sql'
	
AS $BODY$

SELECT start_dt + s.a AS datum
FROM GENERATE_SERIES(0, days) AS s(a)
GROUP BY s.a
ORDER BY 1;

$BODY$;

简单测试一下,依然将‘2022-01-01’作为开始日期,时间间隔设置为30天:

SELECT * FROM get_calendar('2022-01-01', 30);

完整代码实现

最终,我们将通过PostgreSQL的大量日期和字符串转换函数,扩展我们的自定义函数“get_calendar”,得到一个完整的日历表,具体代码如下所示。

/* Author: Derek Zhu
Date: 2022-01-08
Purpose: Calendar table practice in PostgreSQL 14.1
Description:
    Start date: 2022-01-01
    Set days length in 2nd argument of 'Genarate_series' function */

-- FUNCTION: public.get_calendar(date, integer)

-- DROP FUNCTION IF EXISTS public.get_calendar(date, integer);

CREATE OR REPLACE FUNCTION public.get_calendar(
	start_dt date,
	days integer)
    RETURNS TABLE(datum date, year numeric, month numeric, day_of_month numeric, week_of_year numeric, iso_day_of_week numeric, year_calendar_week text, day_of_year numeric, quarter_of_year numeric, quartal text, year_quartal text, day_name text, month_name text, year_month text, year_half integer, leap_year boolean, weekend text, cw_start date, cw_end date, month_start date, month_end date) 
    LANGUAGE 'sql'
    COST 100
    VOLATILE PARALLEL UNSAFE
    ROWS 1000

AS $BODY$

SELECT
  datum,
  EXTRACT(YEAR FROM datum) AS "year",
  EXTRACT(MONTH FROM datum) AS "month",
  EXTRACT(DAY FROM datum) AS day_of_month,
  EXTRACT(WEEK FROM datum) AS week_of_year,
  -- ISO 8601 day of the week numbering, The day of the week as Monday (1) to Sunday (7)
  EXTRACT(ISODOW FROM datum) AS iso_day_of_week,
  -- Standard Gregorian day of the week numbering, The day of the week as Sunday (0) to Saturday (6)
  -- EXTRACT(DOW FROM datum) AS day_of_week,
  -- ISO calendar year and week
  TO_CHAR(datum, 'iyyy/IW') AS year_calendar_week,
  EXTRACT(DOY FROM datum) AS day_of_year,
  EXTRACT(QUARTER FROM datum) AS quarter_of_year,
  'Q' || TO_CHAR(datum, 'Q') AS quartal,
  TO_CHAR(datum, 'yyyy/"Q"Q') AS year_quartal,
  TO_CHAR(datum, 'TMDay') AS day_name,
  TO_CHAR(datum, 'TMMonth') AS month_name,
  TO_CHAR(datum, 'yyyy/mm') AS year_month,
  -- Half year
  CASE WHEN EXTRACT(MONTH FROM datum) < 7 THEN 1 ELSE 2 END AS year_half,
  -- Leap year
  CASE WHEN EXTRACT(YEAR FROM datum) % 4 = 0 THEN TRUE ELSE FALSE END AS leap_year,
  -- Weekend
  CASE WHEN EXTRACT(ISODOW FROM datum) in (6, 7) THEN 'Weekend' ELSE 'Weekday' END AS weekend,
  -- ISO start and end of the week of this date
  datum + (1 - EXTRACT(ISODOW FROM datum))::integer AS cw_start,
  datum + (7 - EXTRACT(ISODOW FROM datum))::integer AS cw_end,
  -- Start and end of the month of this date
  datum + (1 - EXTRACT(DAY FROM datum))::integer AS month_start,
  ((datum + (1 - EXTRACT(DAY FROM datum))::integer + '1 month'::interval)::date - '1 day'::interval)::DATE AS month_end
FROM (
	SELECT start_dt + s.a AS datum
FROM GENERATE_SERIES(0, days) AS s(a)
GROUP BY s.a
) AS calendar
ORDER BY 1;

$BODY$;

ALTER FUNCTION public.get_calendar(date, integer)
    OWNER TO postgres;

得到2022年全年日历,如下所示:

SELECT * FROM get_calendar('2022-01-01', 364);

通过文本编辑器观察结果,如下所示:

通过Excel观察结果,如下所示:

至此,我们已经完成了所有功能;


总结

通过PostgreSQL生成日历表主要有下面几个注意点:

  1. ISO8601标准中,一个星期的天数为:Monday (1) ~ Sunday (7);
  2. 理解并灵活应用GENERATE_SERIES函数生成日期序列;
  3. 养成模块化思维习惯,将通用的数据操作抽象为函数或方法,能够扩展应用范围;

与前日通过Python Pandas的案例一样,我们最终也将解决方案抽象为一个函数,供后期灵活调用,虽然传入的参数和最终的结果不完全一致,但是整体思路是类似的。

想对自己说的话

PostgreSQL 目前在很多企业都在大量使用,通过PG集群搭建数据仓库平台也是很多企业近些年在努力做的实现,去IOE早已执行多年,使用开源软件替换商用软件也是大势所趋,PG应该被重视起来,对于PG的一些常见和重要的操作,也要应该熟记于心。

至于MySQL和PG选哪个这种神仙打架的事情,真没时间想那么多,纯开源,还是PG吧~

参考资料

https://www.postgresql.org/docs/current/

后续安排

通过Power BI Desktop实现日历表,敬请期待。

相关推荐

SQL轻松入门(5):窗口函数(sql语录中加窗口函数的执行)

01前言标题中有2个字让我在初次接触窗口函数时,真真切切明白了何谓”高级”?说来也是一番辛酸史!话说,我见识了窗口函数的强大后,便磨拳擦掌的要试验一番,结果在查询中输入语句,返回的结果却是报错,Wh...

28个SQL常用的DeepSeek提示词指令,码住直接套用

自从DeepSeek出现后,极大地提升了大家平时的工作效率,特别是对于一些想从事数据行业的小白,只需要掌握DeepSeek的提问技巧,SQL相关的问题也不再是个门槛。...

从零开始学SQL进阶,数据分析师必备SQL取数技巧,建议收藏

上一节给大家讲到SQL取数的一些基本内容,包含SQL简单查询与高级查询,需要复习相关知识的同学可以跳转至上一节,本节给大家讲解SQL的进阶应用,在实际过程中用途比较多的子查询与窗口函数,下面一起学习。...

SQL_OVER语法(sql语句over什么含义)

OVER的定义OVER用于为行定义一个窗口,它对一组值进行操作,不需要使用GROUPBY子句对数据进行分组,能够在同一行中同时返回基础行的列和聚合列。...

SQL窗口函数知多少?(sql窗口怎么执行)

我们在日常工作中是否经常会遇到需要排名的情况,比如:每个部门按业绩来排名,每人按绩效排名,对部门销售业绩前N名的进行奖励等。面对这类需求,我们就需要使用sql的高级功能——窗口函数。...

如何学习并掌握 SQL 数据库基础:从零散查表到高效数据提取

无论是职场数据分析、产品运营,还是做副业项目,掌握SQL(StructuredQueryLanguage)意味着你能直接从数据库中提取、分析、整合数据,而不再依赖他人拉数,节省大量沟通成本,让你...

SQL窗口函数(sql窗口函数执行顺序)

背景在数据分析中,经常会遇到按某某条件来排名、并找出排名的前几名,用日常SQL的GROUPBY,ORDERBY来实现特别的麻烦,有时甚至实现不了,这个时候SQL窗口函数就能发挥巨大作用了,窗...

sqlserver删除重复数据只保留一条,使用ROW_NUMER()与Partition By

1.使用场景:公司的小程序需要实现一个功能:在原有小程序上,有一个优惠券活动表。存储着活动产品数据,但因为之前没有做约束,导致数据的不唯一,这会使打开产品详情页时,可能会出现随机显示任意活动问题。...

SQL面试经典问题(一)(sql经典面试题及答案)

以下是三个精心挑选的经典SQL面试问题及其详细解决方案,涵盖了数据分析、排序限制和数据清理等常见场景。这些问题旨在考察SQL的核心技能,适用于初学者到高级开发者的面试准备。每个问题均包含清晰的...

SQL:求连续N天的登陆人员之通用解答

前几天发了一个微头条:...

SQL四大排序函数神技(sql中的排序是什么语句)

在日常SQL开发中,排序操作无处不在。当大家需要排序时,是否只会想到ORDERBY?今天,我们就来揭秘SQL中四个强大却常被忽略的排序函数:ROW_NUMBER()、RANK()、DENSE_RAN...

四、mysql窗口函数之row_number()函数的使用

1、窗口函数之row_number()使用背景窗口函数中,排序函数rank(),dense_rank()虽说都是排序函数,但是各有用处,假如像上章节说的“同组同分”两条数据,我们不想“班级名次”出现“...

ROW_NUMBER()函数(rownumber函数与rank区别)

ROW_NUMBER()是SQL中的一个窗口函数(WindowFunction)...

Dify「模板转换」节点终极指南:动态文本生成进阶技巧(附代码)Jinja2引擎解析

这篇文章是关于Dify「模板转换」节点的终极指南,解析了基于Jinja2模板引擎的动态文本生成技巧,涵盖多源文本整合、知识检索结构化、动态API构建及个性化内容生成等六大应用场景,助力开发者高效利用模...

Python 最常用的语句、函数有哪些?

1.#coding=utf-8①代码中有中文字符,最好在代码前面加#coding=utf-8②pycharm不加可能不会报错,但是代码最终是会放到服务器上,放到服务器上的时候运行可能会报错。③...