我家在重庆网站自动提问软件,这个网站是有一个360防火墙的,因为这软件升级为了5.08专门后台绕过了他的防火墙检验,算是软件钻了他防火墙的一个小小的漏洞,如果不这样做,那软件就需要在网站手工登陆好网站账号,然后点采集缓存,他会在浏览器的POST缓存里,写一个小小的标记,这样采集回来的缓存才有用,因为5.08进行了升级,所以是钻了一个小小的漏洞,不需要手工采集缓存,能自动用POST登陆好账号的方法进行发帖子的。网站登陆有一个极验证码,所以做了逻辑判断进行判断有没有识别成或,有没有登陆成功的过程。01
最后得出这个脚本是没有浏览器的,是POST登陆识别验证码的脚本,所以没有做录像过程,但明显是可以发成功,能自动采集帖子的软件脚本: 这个网站还要自己充值打码,十块钱就有一千张打码额度,可以说是非常便宜的打码网站了,而且识别这种极验证码,有百分之九十的成功率,完全不用担心发帖不成功的命运。
01
由于这个网站有360防火墙的云加速,
所以我们这里需要先访问一次登陆网址,这样就会给访客一个缓存的信号,很多有防火墙的网站都是需要这种操作的,有的是访问首页,有的是登陆网址,有的是个人中心跳转。反正这个是千奇百怪,各式各样。
HTTP/1.1 200 OK
Server: nginx
Date: Mon, 25 Oct 2021 13:27:34 GMT
Content-Type: text/html; charset=UTF-8
Transfer-Encoding: chunked
Connection: close
Vary: Accept-Encoding
P3P: CP="NOI ADM DEV PSAi COM NAV OUR OTRo STP IND DEM"
X-Frame-Options: SAMEORIGIN
Set-Cookie: checkurl=https%3A%2F%2Fwww.wjzcq.com%2Findex.php%3Fm%3Dgeetest%26t%3D1635144266866; expires=Mon, 25-Oct-2021 14:27:34 GMT; Max-Age=3600; path=/
Access-Control-Allow-Origin: *
Set-Cookie: PHPSESSID=394t4c51dgj15h43dmhilafp7n; path=/
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate
Pragma: no-cache
{"success":1,"gt":"0353941cad7f70773ad049699647820c","challenge":"30be780bb0857585f199bccdea53e35e"}
我们需要采集的就是这个GT变量,和challenge变量结果,所以我们这个第二步就是采集这二个变量保存起来的,第三步就是识别结果。
01
网站显示这种是第三代验证码,还有一种抽象形的极验证码,这个平台也是可以识别成功的,识别成功后就可以采集这二个参数。HTTP/1.1 200 OK
Server: openresty
Date: Mon, 25 Oct 2021 13:29:43 GMT
Content-Type: application/json;charset=UTF-8
X-NWS-UUID-VERIFY: ca9605d9fb1219c37e36cf958f268517
Set-Cookie: JSESSIONID=5C6F5EE7B59B1CE5DF568BFFB44AC79A; Path=/; HttpOnly
Pragma: no-cache
Content-Language: zh-CN
X-Daa-Tunnel: hop_count=1
Cache-Control: no-cache, no-store
Content-Length: 171
X-NWS-LOG-UUID: 2456630727440508542
Connection: close
X-Cache-Lookup: Cache Miss
{"msg":"识别成功","time":1535,"data":{"challenge":"66554a899473a3ace08154241933824582","type":"三代点选","validate":"58cd304f30b683000f0a4b14afd8ab64"},"status":0}
由于这个验证码不是百分百识别成功的,所以第六步会对这个验证码识别结果进行逻辑判断,当成功了,我们就不跳转重新识别,如果失败了就会执行跳转重新识别的意思。
01
网站登陆包是没有进行编码的,如果你用的是中文账号需要UTF8编码才可以登陆成功,这个识别结果照模照样的把他们搬到登陆POST包里,就可以百分百登陆成功,如果不成功,那后面还有一个逻辑判断,判断没有返回登陆成功,就重新进行识别和切换账号登陆。
这个第七步是登陆包,当成功了,他网站会提示这个JOSN包,需要解码才可以看到登陆成功的提示。
登陆成功自然就是准备发帖了,发帖也有拖动的极验证古巴,所以软件又重新GET验证码获取地址,采集参数,再进行识别成功判断,再进行发帖操作的过程。
网站似乎一个号只能发五帖,后面的过程是有切换账号登陆的,一个号只能发五帖,软件就会自动再次切换账号自动发帖,我们有多的账号,完全可以放进去自动发帖。
POST包里,发帖思路要清晰,不过也是尊守手工发帖的过程模拟,只是他看不到过程,也不过发成功,我们都是有做采集网址的,也是可以看到发帖的。
01
我家在重庆网站拖动极验证码发帖过程封面LOGO图片: