最近装了“*城宽带”,发现打开网站时还会弹出广告。打电话给客服沟通,客服表示不知道他们有广告,声称是我本人电脑设置有问题。很无耐,写一代理用来屏蔽广告。
下载地址:http://pan.baidu.com/share/link?shareid=3835585554&uk=590772501#dir/path=%2Fpub%2Fother下载adbreak.zip
使用方法:
1.解压软件包,点击adbreak.bat
软件启动后如下图:
2.设置浏览器代理脚本配置,以IE为例。(firefox使用autoproxy、chrome使用proxy-switchysharp将指定网址的代理定向到 8337端口,使用goagent也可以直接修改GoAgent Pac文件,参照adbreak.pac)
工具->Internet选项->链接->局域网设置 勾选 “使用自动脚本配置” 在下面的“地址”这一栏填入 http://127.0.0.1:8337/break.pac
3.设置屏蔽的网址:
编辑break.pac脚本,在 disable_url 中添加要屏蔽的网址。默认带的几个网址是用来屏蔽“*城宽带”这边的几个广告的。
4.如何知道广告的网址?
首先建议使用抓包工具,如果没有抓包工具可以使用adbreak自带的代理来查看地址。
设置方法:将第2条中的设置地址改为http://127.0.0.1:8337/proxy.pac。
这时再用浏览器上网,所有的请求是走的adbreak自带的http代理访问,会将网址打印在地址栏中。使用浏览器浏览网页,弹出广告后,查看adbreak中的地址列表,找出广告地址。(你访问网址被拦截后的第一条)
由于cmd自带的缓冲区显示内容有限,需要将修改缓冲区大小,以显示足够多的请求地址。
设置方法:鼠右键点击adbreak标题栏,选择属性->布局 “将屏幕缓冲区大小”中的“高度”设为 5000
说明:程序使用nodejs运行,启用后占用 8337、8338 两个端口,8337端口有break.pac和proxy.pac两个文件。
使用break.pac文件时,当弹出ISP的广告时,break.pac脚本识别到广告地址将这个请求定向到8337端口,这时原请求地址被附加在广告请求地址的Referer中,代理读取referer地址,将请求重定向到原地址。
使用proxy.pac时,请求请重定向到8338端口,这时所请求的文件通过adbreak从网络获取,可以得到每一个请求的地址。用来从地址列表中找出广告的地址。
附adbreak的coffee源代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81
| http = require 'http' url = require 'url' http.createServer (req, res)-> request_url = req.url request_pac = request_url.match /\/((?:break|proxy).pac)((?:\?.*)?)/ if request_pac isnt null console.log "[#{req.method}] #{request_url}" res.writeHead 200, 'Content-Type': 'application/x-ns-proxy-autoconfig' pac = require('fs').createReadStream request_pac[1] pac.pipe res pac.on 'end', -> res.end() else referer = req.headers.referer if referer console.log "[#{req.method}] -referer- #{request_url}" res.writeHead 302, 'Location': referer else res.writeHead 200, 'Content-Type': 'text/plain' console.log "[#{req.method}] -disable- #{request_url}" res.write 'no referer' res.end() return .listen 8337, '0.0.0.0' console.log 'start break server by http://127.0.0.1:8337' http.createServer (req, res)-> request_url = req.url console.log "[#{req.method}] #{request_url}" post_data = '' request_option = url.parse request_url request_option.method = req.method request_option.headers = req.headers req.on 'data', (chunk)-> post_data += chunk return .on 'end', -> if request_option.method is 'POST' then proxy_request.end post_data else proxy_request.end() return proxy_request = http.request request_option, (result)-> headers = result.headers statusCode = result.statusCode res.writeHead statusCode, headers result.on 'data', (chunk)-> res.write chunk return result.on 'end', -> res.end() return return .on 'error', (error)-> res.end "remote http.request error#{error}" return return .listen 8338, '0.0.0.0' console.log 'start proxy server by http://127.0.0.1:8338'
|
附使用截图:
“*城宽带”拦截网络访问弹自家广告抓包截图:
可以看到访问www.jd.com被强制转向到了count.chanet.com.cn上面,后面连续跳转了多个广告请求,还有骗京东自家的推广点击的。在第11个请求时,被定向到了京东首页。
代理的拦截效果截图:
访问优酷,被重定向到了ye87.net
ye87.net被代理拦截重新定向到了youku
adbreak打印的重定向信息