python|某音jsvmp下参数分析笔记


某音jsvmp下参数分析笔记

在获取个人主页发布视频的时候,会有两个特别的参数
python|某音jsvmp下参数分析笔记
文章图片

X-Bogus和_signature,但是在全局搜索的时候,却完全没有搜索到这两个关键字,按照以往的经验,字节的会重写XMLHttpRequest原型下的方法,当发出请求前,会经过一段加密逻辑,自己加上校验的参数,那么在网站上试一试
python|某音jsvmp下参数分析笔记
文章图片

果然XMLHttpRequest原型下的open方法被重写了,点进去后,发现在webmssdk.js这个里面,这个就是jsvmp的入口
【python|某音jsvmp下参数分析笔记】python|某音jsvmp下参数分析笔记
文章图片

下一个断点往下拉,当触发请求的时候,就会断下,可以看到open方法的三个参数,跟着单步往下走,就会进入_0x20653b函数
python|某音jsvmp下参数分析笔记
文章图片

这个函数带有8个参数,既然是jsvmp,那就用jsvmp的思路来看看这8个参数分别代表什么意思,经过多次对比,可以得到下方的表格

变量名 含义
_0x52f757 字节码
_0x1f5661 函数基址
_0xabd09a 函数长度
_0x204c10 本地变量
_0x2bf5d9 闭包变量
_0x5cca65 函数调用者
_0x1a0d5a 无意义
_0x4420e0 分支类型
知道变量的类型后,那么可以尝试根据字节码,来编写一个对应的解释器,根据函数基址为578,函数长度为71,生成open方法的伪代码如下
function open(){ this["_byted_intercept_list"] = []; var local_var_0x0 = new window["Object"](); local_var_0x0["func"] = "open"; local_var_0x0["arguments"] = argument_$2; this["_byted_method"] = argument_0["toUpperCase"].apply(argument_0, []); this["_byted_url"] = argument_1; return argument_$0[26].apply(this, argument_$2); }

函数非常短,看起来不像是生成两个参数的,功能只是把设置了_byted_method和_byted_url这两个属性,其中argument_$0[26]正是底层的open方法
既然不在open方法,那么很有可能就是在send方法了
python|某音jsvmp下参数分析笔记
文章图片

继续点进去
python|某音jsvmp下参数分析笔记
文章图片

可以看到send方法被绑定到这里了,继续单步调试,又来到了熟悉的地方
python|某音jsvmp下参数分析笔记
文章图片

继续往下单步调试,可以看到send方法的字节码以及函数基址等数值,继续尝试生成伪代码
function send(){ for (; this["_byted_url"]["indexOf"].apply(this["_byted_url"], ["_signature="]) > 0 - 1; ) { return argument_$0[28].apply(this, argument_$2); }this["_byted_body"] = argument_0; argument_7 = this["onreadystatechange"]; argument_8 = this["onabort"]; argument_9 = this["onerror"]; argument_10 = this["onload"]; argument_11 = this["onloadend"]; argument_12 = this["onloadstart"]; argument_13 = this["onprogress"]; argument_14 = this["ontimeout"]; var local_var_0x0 = new window["Object"](); argument_15 = local_var_0x0; argument_50 = 0; for (; argument_50 < argument_$0[30]["length"]; ) { argument_15[argument_$0[30][argument_50]] = this["upload"][argument_$0[30][argument_50]]; argument_50++; argument_50 = argument_50; }argument_16 = argument_$0[3]["msStatus"]; *********省略代码**************** }

明显,这次的伪代码逻辑上存在问题,代码并不可信,但是还是能从中获取到一些逻辑,那么这些伪代码就可以作为辅助来还原算法。最终可以在send函数中分别找到X-Bogus和_signature的生成函数,分别根据伪代码辅助,手动调试的方法,还原出python版本的算法。
使用还原的算法测试抖音弹幕的获取,可以正常获取。
python|某音jsvmp下参数分析笔记
文章图片

在深入研究发现,其实还有一些参数也是jsvmp中生成,但是并是在这个这同一个js,如__ac_signature和captchaBody。其中__ac_signature是从首次访问任何页面返回的
python|某音jsvmp下参数分析笔记
文章图片

而captchaBody则是从captcha.js文件中生成的,不过其中所有的文件中,字节码的魔数都是一样的,也就是说可以使用同一套解释器生成伪代码,从而辅助还原算法
python|某音jsvmp下参数分析笔记
文章图片

参考文献
1.【JS逆向系列】某乎x96参数与jsvmp初体验
2. [原创] 给"某音"的js虚拟机写一个编译器
3.某音新版本逻辑分析
更多内容欢迎加入我的星球
python|某音jsvmp下参数分析笔记
文章图片

    推荐阅读