百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

因果推断Matching方式实现代码 因果推断模型

wptr33 2024-11-11 16:08 85 浏览

如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,

欢迎移步宝藏公众号「小火龙说数据」,无广告、无软文、纯干货,更多精彩原创文章与你分享!


00 序言

之前文章中,小火龙和大家分享过在无法做AB实验的场景下,如何通过因果推断的方式,构造相对纯净的虚拟AB组,还不了解方法的同学可以戳这里「不适合做AB实验的场景下,通过这4种方式来衡量策略效果」

本章,分享其中Matching方法中的EM(精确匹配)、CEM(粗化精确匹配)的SQL实现代码,有需要的同学可以自取。详细理论这里就不再冗余介绍了,可以戳上面链接学习。

01 代码实现

步骤一:前置表(生成匹配前置用户表)
create table if not exists test.cem_user_original as
select
    uid,
    age,
    gender,
    edu_level,
    is_label --是否应用某些功能(作为虚拟AB的判断标识)
from
    test.user_table
where
    date between '20240301' and '20240330' --获取此段时间的用户
group by
    uid,
    age,
    gender,
    edu_level,
    is_label
;


步骤二:匹配(通过label=1去匹配label=0)
create table if not exists test.cem_user_result as

with
title_merge as --标签merge
(
select
    *
    ,is_click as is_ab_treatment --是否是虚拟实验组
    ,1-is_click as is_ab_contorl --是否是虚拟控制组
    ,concat_ws('_', age, gender, edu_level) as title_merge
from
    test.cem_user_original
),

title_count as --计算每个标签merge对应的虚拟AB组人数
(
select
    *
    ,sum(is_ab_treatment) over(partition by title_merge) as num_ab_treatment
    ,sum(is_ab_contorl) over(partition by title_merge) as num_ab_contorl
    ,row_number()over(partition by title_merge,is_ab_contorl order by rand()) as rank_ab_contorl
from
    title_merge
),

treatment_few as --当标签merge中「实验组用户≤控制组用户」时,实验组全取+控制组取与实验组相同人数
(
select
    *
from
    title_count
where
    num_ab_treatment <= num_ab_contorl
    and
    (
    is_click=1 or
    (is_click=0 and rank_ab_contorl<=num_ab_treatment)
    )
),

treatment_more as --当标签merge中「实验组用户>控制组用户」时,实验组全取+控制组全取(实验组用户明显偏少的情况)
(
select
    *
from
    title_count
where
    num_ab_treatment > num_ab_contorl
)


select
    *
from
    treatment_few

union all

select
    *
from
    treatment_more
;

最后,推荐一本数据分析进阶书籍《数据分析实践:专业知识和职场技巧》

侧重案例讲解,对于初、中级数据分析师的帮助极大!!!

相关推荐

Flutter状态管理之Provider数据共享的底层实现

#头条创作挑战赛#简介高级的Flutter工程师往往都是从最简单的架构开始研究学习,今天给大家带来的是Flutter中比较重要的状态管理框架Provider,也是每位Flutter开发者必学的框架。P...

字节跨平台框架 Lynx 开源:一个 Web 开发者的原生体验

...

flutter软件开发笔记17-isolate的机制作用

这个isolate,相当于其他编程中的线程,并行处理一些事件,让程序更加高效。用厨房做菜的比喻帮你理解Isolate,附完整可运行的代码示例:一isolate的比喻解释假设你是一个主厨(主Isol...

七爪源码:如何使用 SQLite 数据库在 Flutter 中保存大数据

SQLite是一个开源、零配置、自包含、独立的事务关系数据库引擎,旨在嵌入到应用程序中。sqfliteFlutter的SQLite插件。支持iOS、Android和MacOS。支持事务...

Flutter 实现多语言

本文同步本人掘金平台的文章:https://juejin.cn/post/7164571616314130469我们在处理跨国业务、跨地区(比如港澳台)业务的时候,需要针对当地的语言来做兼容。所以,我...

开始第一个Flet应用

Flet是基于Flutter的UI框架,但是我们不需要熟悉Flutter,也不需要会前端,只要具备Python面向对象编程基础就可以了。当然我本人是不会Flutter的,所以也没法对比Flet和Flu...

《史记微软UI框架轮回本纪》

微软者,乃美地西雅图之枭雄,曾持Windows以令诸侯。自庚午(1990)以降,数易UI之术,然其UI之框架兴也勃焉,其亡也忽焉。太史公观其轮回之迹,未尝不掷笔长叹:天命固难测,然微软UI之败,岂非自...

Android中的数据库和本地存储在Flutter中是怎样实现的

如何使用SharedPreferences?在Android中,你可以使用SharedPreferencesAPI来存储少量的键值对。在Flutter中,使用Shared_Pref...

Flutter——输入部件

上一节介绍了文本部件,用于显示文本。但是在我们进行日常软件开发过程中,经常是需要获取用户键入的内容,比如用户名、密码、性别、喜好等等。...

我用VS Code 开发工具来开发 自己的 Flutter 应用 工具快而轻

本文将与你一起回顾如何在VSCode里进行Flutter应用的开发。1.安装和配置根据编辑工具设定的指引来安装Dart和Flutter扩展(也叫做插件)。1.1更新扩展程序...

Flutter 结合 Dio 使用

#头条创作挑战赛#上一篇文章...

Flutter——路由

路由(Route)在移动开发中通常指页面(Page),这跟Web开发中单页应用的Route概念意义是相同的,Route在Android中通常指一个Activity,在iOS中指一个...

Flutter 实战经验(五):在 VS Code 里开发 Flutter 应用

本文将与你一起回顾如何在VSCode里进行Flutter应用的开发。1.安装和配置根据编辑工具设定的指引来安装Dart和Flutter扩展(也叫做插件)。1.1更新扩展程序扩...

Flutter 2 的Windows 开发试验

刚安装了flutter2.1dev版本,测试下很感觉兴趣的Windows开发当前flutter环境为(flutterdoctor):Doctorsummary(toseeallde...

基于flutter/dart仿抖音app实例

简介flutter_tiktok项目是基于flutter+dart+fijkplayer等技术开发的仿抖音短视频app实例。https://github.com/mjl0602/flutter_tik...