因果推断Matching方式实现代码 因果推断模型
wptr33 2024-11-11 16:08 85 浏览
如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,
欢迎移步宝藏公众号「小火龙说数据」,无广告、无软文、纯干货,更多精彩原创文章与你分享!
00 序言
之前文章中,小火龙和大家分享过在无法做AB实验的场景下,如何通过因果推断的方式,构造相对纯净的虚拟AB组,还不了解方法的同学可以戳这里「不适合做AB实验的场景下,通过这4种方式来衡量策略效果」。
本章,分享其中Matching方法中的EM(精确匹配)、CEM(粗化精确匹配)的SQL实现代码,有需要的同学可以自取。详细理论这里就不再冗余介绍了,可以戳上面链接学习。
01 代码实现
步骤一:前置表(生成匹配前置用户表)
create table if not exists test.cem_user_original as
select
uid,
age,
gender,
edu_level,
is_label --是否应用某些功能(作为虚拟AB的判断标识)
from
test.user_table
where
date between '20240301' and '20240330' --获取此段时间的用户
group by
uid,
age,
gender,
edu_level,
is_label
;
步骤二:匹配(通过label=1去匹配label=0)
create table if not exists test.cem_user_result as
with
title_merge as --标签merge
(
select
*
,is_click as is_ab_treatment --是否是虚拟实验组
,1-is_click as is_ab_contorl --是否是虚拟控制组
,concat_ws('_', age, gender, edu_level) as title_merge
from
test.cem_user_original
),
title_count as --计算每个标签merge对应的虚拟AB组人数
(
select
*
,sum(is_ab_treatment) over(partition by title_merge) as num_ab_treatment
,sum(is_ab_contorl) over(partition by title_merge) as num_ab_contorl
,row_number()over(partition by title_merge,is_ab_contorl order by rand()) as rank_ab_contorl
from
title_merge
),
treatment_few as --当标签merge中「实验组用户≤控制组用户」时,实验组全取+控制组取与实验组相同人数
(
select
*
from
title_count
where
num_ab_treatment <= num_ab_contorl
and
(
is_click=1 or
(is_click=0 and rank_ab_contorl<=num_ab_treatment)
)
),
treatment_more as --当标签merge中「实验组用户>控制组用户」时,实验组全取+控制组全取(实验组用户明显偏少的情况)
(
select
*
from
title_count
where
num_ab_treatment > num_ab_contorl
)
select
*
from
treatment_few
union all
select
*
from
treatment_more
;
最后,推荐一本数据分析进阶书籍《数据分析实践:专业知识和职场技巧》
侧重案例讲解,对于初、中级数据分析师的帮助极大!!!
相关推荐
- Flutter状态管理之Provider数据共享的底层实现
-
#头条创作挑战赛#简介高级的Flutter工程师往往都是从最简单的架构开始研究学习,今天给大家带来的是Flutter中比较重要的状态管理框架Provider,也是每位Flutter开发者必学的框架。P...
- flutter软件开发笔记17-isolate的机制作用
-
这个isolate,相当于其他编程中的线程,并行处理一些事件,让程序更加高效。用厨房做菜的比喻帮你理解Isolate,附完整可运行的代码示例:一isolate的比喻解释假设你是一个主厨(主Isol...
- 七爪源码:如何使用 SQLite 数据库在 Flutter 中保存大数据
-
SQLite是一个开源、零配置、自包含、独立的事务关系数据库引擎,旨在嵌入到应用程序中。sqfliteFlutter的SQLite插件。支持iOS、Android和MacOS。支持事务...
- Flutter 实现多语言
-
本文同步本人掘金平台的文章:https://juejin.cn/post/7164571616314130469我们在处理跨国业务、跨地区(比如港澳台)业务的时候,需要针对当地的语言来做兼容。所以,我...
- 开始第一个Flet应用
-
Flet是基于Flutter的UI框架,但是我们不需要熟悉Flutter,也不需要会前端,只要具备Python面向对象编程基础就可以了。当然我本人是不会Flutter的,所以也没法对比Flet和Flu...
- 《史记微软UI框架轮回本纪》
-
微软者,乃美地西雅图之枭雄,曾持Windows以令诸侯。自庚午(1990)以降,数易UI之术,然其UI之框架兴也勃焉,其亡也忽焉。太史公观其轮回之迹,未尝不掷笔长叹:天命固难测,然微软UI之败,岂非自...
- Android中的数据库和本地存储在Flutter中是怎样实现的
-
如何使用SharedPreferences?在Android中,你可以使用SharedPreferencesAPI来存储少量的键值对。在Flutter中,使用Shared_Pref...
- Flutter——输入部件
-
上一节介绍了文本部件,用于显示文本。但是在我们进行日常软件开发过程中,经常是需要获取用户键入的内容,比如用户名、密码、性别、喜好等等。...
- 我用VS Code 开发工具来开发 自己的 Flutter 应用 工具快而轻
-
本文将与你一起回顾如何在VSCode里进行Flutter应用的开发。1.安装和配置根据编辑工具设定的指引来安装Dart和Flutter扩展(也叫做插件)。1.1更新扩展程序...
- Flutter 结合 Dio 使用
-
#头条创作挑战赛#上一篇文章...
- Flutter——路由
-
路由(Route)在移动开发中通常指页面(Page),这跟Web开发中单页应用的Route概念意义是相同的,Route在Android中通常指一个Activity,在iOS中指一个...
- Flutter 实战经验(五):在 VS Code 里开发 Flutter 应用
-
本文将与你一起回顾如何在VSCode里进行Flutter应用的开发。1.安装和配置根据编辑工具设定的指引来安装Dart和Flutter扩展(也叫做插件)。1.1更新扩展程序扩...
- Flutter 2 的Windows 开发试验
-
刚安装了flutter2.1dev版本,测试下很感觉兴趣的Windows开发当前flutter环境为(flutterdoctor):Doctorsummary(toseeallde...
- 基于flutter/dart仿抖音app实例
-
简介flutter_tiktok项目是基于flutter+dart+fijkplayer等技术开发的仿抖音短视频app实例。https://github.com/mjl0602/flutter_tik...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
因果推断Matching方式实现代码 因果推断模型
-
git pull命令使用实例 git pull--rebase
-
git pull 和git fetch 命令分别有什么作用?二者有什么区别?
-
面试官:git pull是哪两个指令的组合?
-
git 执行pull错误如何撤销 git pull fail
-
git fetch 和git pull 的异同 git中fetch和pull的区别
-
git pull 之后本地代码被覆盖 解决方案
-
还可以这样玩?Git基本原理及各种骚操作,涨知识了
-
git命令之pull git.pull
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mysql max (33)
- vba instr (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)