XSS注入我也不怕不怕啦--PHP从框架层面屏蔽XSS的思考和实践
wptr33 2025-05-08 06:56 8 浏览
本文由腾讯WeTest团队提供,更多资讯可直接戳链接查看:http://wetest.qq.com/lab/
微信号:TencentWeTest
对于新接触web开发的同学来说,XSS注入是一件非常头疼的事情。就算是web开发多年的老手,也不敢保证自己写的代码完全没有XSS注入的风险。
因为现在比较主流的XSS防治手段主要有两种,一种是在用户输入是将异常关键词过滤,另一种则是在页面渲染时将html内容实体化转义。
然而第一种方法一定程度上对业务数据要求相对较高,存在屏蔽数据和业务数据有冲突的情况,例如“程序类帮助文档的编辑保存”,“外站帖子爬虫”等等。都不能无差别将异常关键词过滤掉,必须保持原输入内容的完整性。
而另一种html内容实体化的方式,又非常的依赖开发的编程习惯。一个不小心漏写了就是一个安全工单,做web的前端同事应该深有体会。于是,我开始研究能不能不再依赖开发习惯,从框架层面上完全屏蔽XSS。
这里先介绍一下我的PHP web Server框架,是我自己从从事web开发开始就一直在维护更新的框架,链接在此,有兴趣的同学,可以看下。或者提出更多改进的建议。
首先来看下普通的PHP是怎么转义html实体的:
htmlspecialchars($content, ENT_QUOTES | ENT_SUBSTITUTE) ENT_QUOTES 意思是需要转义双引号(”)和 单引号 (’)
ENT_SUBSTITUTE 意思是 把无效的编码替代成一个指定的带有 Unicode 替代字符
首先很容易想到的是把php模版中的字符串全部替换掉。
而熟悉smarty的同学应该知道,其实smarty的模版渲染也是用了转义字符串的方式。那我们渲染页面的代码可以这么写。
/**
* 获得模板渲染后的内容
* @return string
*/
public function getContent
{
//防XSS注入
foreach ([Math Processing Error]
[Math Processing Error][Math Processing Error]
}
unset($param);
extract($this->params);
ob_start;
//include template
$file = sprintf('%s/template/%s.tpl.php', TXApp::$app_root, $this->view);
include $file;
$content = ob_get_clean;
return $content;
}
这样的话,传入的字符串类型的变量都会被替换掉了。但是问题也很明显。那就是如果是数组或者object对象,里面的内容就无法进行转义了。而这同样也是smarty的一个弊端,smarty是在assign方法里进行的实体化转义,如果是数组或者object就无视了。当然我们还需要更进一步的进行转义处理。
有同学看到这里肯定会有个想法,如果是数组的话,递归进行转义处理不就可以了吗。
事实上我一开始的确是这么做的,但是弊端也很明显。递归的层数越多,性能损耗就越大。而且并非所有进行转义的内容我们都会用到,这样就会造成性能的浪费。最优化的处理方式就是当需要用到的时候再做转义处理,没用到的时候该咋样还是咋样。
于是我开始着手自己写一个类,在我的框架里我命名为TXArray 继承了ArrayObject,也就是让其具备了array的部分性质。接下来开始进行array 方法重构。以下是部分代码
class TXArray extends ArrayObject
{
private [Math Processing Error]
public function __construct($storage=array)
{
$this->storage = $storage;
}
public function getIterator
{
foreach ($this->storage as $key => $value){
$key = $this->encode($key);
if (!isset($this->encodes[$key])){
$this->encodes[$key] = $this->encode($value);
}
}
return new ArrayIterator($this->encodes);
}
public function offsetGet($k)
{
if (isset($this->storage[$k])){
$key = $this->encode($k);
if (!isset($this->encodes[$key])){
$this->encodes[$key] = $this->encode($this->storage[$k]);
}
return $this->encodes[$key];
}
return null;
}
public function offsetExists($k)
{
return isset($this->storage[$k]);
}
public function offsetUnset($k)
{
unset($this->storage[$k]);
$k = $this->encode($k);
unset($this->encodes[$k]);
}
public function offsetSet($k, $value)
{
$this->storage[$k] = $value;
$this->encodes[$k] = $this->encode($value);
}
public function count
{
return count($this->storage);
}
private function encode($value)
{
if (is_string($value)){
$value = is_string($value) ? htmlspecialchars($value, ENT_QUOTES | ENT_SUBSTITUTE) : $value
} elseif (is_array($value)){
$value = new self($value);
}
return $value;
}
} offsetGet 会在[Math Processing Error]
这样一个递归的转义模型就写好了。也实现了用到时才转义的目标。
但是还有个问题。并不是所有字段都需要转义的,例如我们平台的舆情监控数据,数据来源主要是各大贴吧论坛,数据本身包含了图片img,字体颜色等html元素。在展示时并不希望被模版转义。所以我在框架上继续优化。添加了PHP的魔法方法__get
public function __get($k)
{
return isset($this->storage[$k]) ? $this->storage[$k] : null;
}
public function get($key)
{
return $this->__get($key);
}
也就是说只要调用[Math Processing Error]
另外看业务也再需要加上一些对array的处理方法,例如array_key_exists,in_array, join等。或者直接使用__call 魔法方法
public function __call($method, $args)
{
$args = &$this->storage;
return call_user_func_array($method, $args);
}
public function serialize
{
return serialize($this->storage);
}
public function __invoke
{
return $this->storage ? true : false;
}
public function keys
{
return array_keys($this->values(false));
}
然后我们在页面模版里就可以愉快的使用了
但是这个TXArray还是有个问题,就是如果需要转化成json全部下发给js使用的话,那里面的数据就无法被转义了。当然也可以递归先全转义一遍,但总觉得代码不够漂亮。这个问题我还会继续研究。有新的进展和优化我都会上传到我的 PHP开源组件框架 中,大家有什么好的建议都可以rtx跟我探讨沟通哈
相关推荐
- 如何使用git clone克隆包含子模块的仓库
-
技术背景在软件开发中,当项目规模逐渐增大时,为了更好地管理代码,我们常常会使用子模块将项目拆分成多个独立的部分。Git作为目前最流行的版本控制系统,提供了管理子模块的功能。但在克隆包含子模块的仓库时...
- 基于Docker构建安装Git/GitLab,以及制作springboot工程镜像
-
今天给大家分享的是《领先的开源自动化服务器Jenkins的应用实战》之基于Docker安装构建Git/GitLab版本控制与代码云存储的场所;使用Git管理项目,springboot工程制作镜像知识体...
- Windows误删急救!3步找回+防删秘籍,免费工具一键恢复
-
“Shift+Delete一时爽,数据火葬场?”误删工作文档、清空珍贵照片、手滑格式化硬盘……这份Windows专属“后悔药”攻略,从...
- Git分支创建与合并
-
首先,我们创建dev分支,然后切换到dev分支:12$gitcheckout-bdev...
- Java项目版本控制的最佳实践
-
Java项目版本控制的最佳实践在Java开发的世界里,版本控制是构建高效协作和管理代码变更的基础。想象一下,如果没有版本控制,就像一群人在沙滩上画画,每个人都在修改别人的画作,很快就会变得混乱不堪。今...
- 10分钟搭建自己的Git仓库
-
10分钟搭建自己的Git仓库...
- GIT,如何恢复修改过的文件,回到过去呢?
-
我们知道git系统有三个区域:工作目录、暂存区域和git仓库所以恢复修改过的文件,需要考虑到三种情况。第一种情况,修改了文件,之后就再也没有任何的git操作了。这种情况只需要将当前版本的暂存区的状态还...
- 打造企业级自动化漏洞修复系统结( GitOps + Trivy + Argo CD )
-
在当今DevSecOps流水线中,实现漏洞自动检测+自动修复+自动部署是关键环节。本指南将结合:...
- 如何搭建一个git服务器?
-
GitHub是一个免费托管开源代码的Git服务器,如果我们不想公开项目的源代码,又不想付费使用,那么我们可以自己搭建一台Git服务器。首先你需要一台client和一台server。client可以是w...
- Python进阶-day27: 版本控制与协作
-
1.学习Git基本命令Git是一个强大的分布式版本控制系统,用于跟踪代码更改和团队协作。以下是课程要求的四个基本命令的说明和使用方法:(1)gitclone作用...
- git 基础分支管理基础操作
-
两个仓库git有两个仓库,一个本地仓库,一个远端仓库。大部分开发工作都是在本地仓库完成,程序没有问题后提交到远端仓库。一般是多用户维护一个git仓库...
- Git新手入门
-
欢迎各位准开发者与技术爱好者!如果你曾好奇专业开发者如何协作大型项目而不丢失修改记录(更不用说覆盖他人代码),那么你来对地方了。答案就是Git——已成为开发者工具库中不可或缺的利器。这份详尽指...
- Git推送错误:failed to push some refs to 'git@gitee.com:XXX'
-
项目推送时遇Git推送错误:error:failedtopushsomerefsto‘git@gitee.com:name/project.git’...
- 常用git命令-从远程更新代码合并分支、提交代码等
-
gitconfig设置gitconfiguser.name""...
- 迁移GIT仓库并带有历史提交记录
-
迁移git仓库开发在很多时候,会遇到一个问题。GIT仓库的管理,特别是仓库的迁移。我需要保留已有的历史记录,而不是重新开发,重头再来。...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
因果推断Matching方式实现代码 因果推断模型
-
git pull命令使用实例 git pull--rebase
-
面试官:git pull是哪两个指令的组合?
-
git fetch 和git pull 的异同 git中fetch和pull的区别
-
git 执行pull错误如何撤销 git pull fail
-
git pull 和git fetch 命令分别有什么作用?二者有什么区别?
-
还可以这样玩?Git基本原理及各种骚操作,涨知识了
-
git pull 之后本地代码被覆盖 解决方案
-
git命令之pull git.pull
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)