系统重构(3)

2017/05/08
进展:
Linux部分的代码已经调通,并且对代码进行一系列的优化,主要在代码格式上,没有对代码进行什么修改。40%的配置都弄懂了。
Windows部分,就比较尴尬,
Windows部分,当时是最开始调的,主要改了几个参数之后就可以运行了。
然后就没有继续耗费时间。
现在要重新将其跑起来,这部分的话,还是需要能够改改代码。然后将这部分弄出来。
代码的部分应该和Linux部分的相似,应该不会耗费太多的时间。
关于windows部分的配置文件,这部分的内容是与Linux程序的部分一起用的。
其中并不是所有的内容都与windows客户端相关联,只有部分与其相关。
下午和晚上的时候,把windows那部分,跟程序不相关的部分都剔除了,下面就要好好梳理下这部分的内容。
他本身的内容是这样的,把URL和浏览器都提取出来,然后分别遍历,也就是排列组合的意思。
但是这部分,就会跟linux那边相互冲突,因为那边已经没有这个配置了。
而且,所建立的数据结构也不同了。
这部分是一个任务。
这部分的任务已经完成了,但是,
线程部分的内容,需要完善。
还有就是开启线程部分,应该更只能一些。
另外,就是浏览器的线程,参数调整一下,比如什么清楚缓存之类的。
因为他程序的设置,是利用全局变量来传递信息,这边,我得搞清楚,哪些是声明,哪些又的却是定义,这样才能准确的修改。
按说,我觉得,一个程序,应该减少使用全局变量(这是原来看书的时候,得出的结论?记得不清楚了)
线程创建部分,感觉不太合理。
我不知道是不是我这边机器的问题。
目前抓包的部分,采用了简单粗暴的形式,就是开始抓包,然后开始捕获。
然后直接暴力枚举得到的浏览器窗口,然后关闭。
不过我看了几次试验,多数情况下,都是窗口都没加载出来,数据包的数量就满足了,
这部分的话,一会检查下到底都有哪些数据包干涉这部分的内容,把hosts文件加进去。
很大一部分的流量是不干净的。(这部分主要是浏览器造成的,比如谷歌会并发的进行连接)
还得考虑网络状况。
或许说,到底,这部分,有哪些是真的干净的。
或者说, 更重要的一点,就是可能这本身就是浏览器的行为。
现在抓出来的,还是不太干净。
【系统重构(3)】**
几个问题,
1、浏览器开启的时候,那边抓包的程序已经超时了。
2、浏览器开启了,页面还没显示出来呢,就已经收集完毕了。(比如百度)这个其实问题,还不算大,这是因为这部分的网页内容比较小。
3、而后来再次开启的时候, 又没有这种情况。
4、有时候,出来的页面
**
我看了启动浏览器的那部分代码,那部分比较暴力,是用shell代为启动的。
总之,这边进程协调的部分,不完善
2017/12/21
这部分的话,其实可以做的更加精细一点,那就是通过补包的状态,把这些内容都记录下来。

    推荐阅读