全球主机交流论坛

标题: kkjio.vip爬虫教程 [打印本页]

作者: karson    时间: 2023-12-30 22:15
标题: kkjio.vip爬虫教程
免责声明:
1. 本文仅出于学习用途,我没有进行实质的资源拷贝,或对站点进行任何攻击
2. 如果有mjj想爬,悠着点,建议派个代表爬,爬完了给大伙整一份
3. 如果你是该站站长,请修复该漏洞,顺便建议考虑给在座的各位来一个sssvip()


看到有人说想要爬这个狱卒网站的,就简单尝试捣鼓了一下,结果真就发现了不花钱访问付费图片的方法= =

1. 更改访问的Referer为:
  1. https://kkjio.vip/
复制代码

2. 对于第一页,正常访问,对于第二页起,在url上加上查询字符串:
  1. ?page=2
复制代码
(2是页码)

作者: vlin    时间: 2023-12-30 22:22
谁爬完了给我整一份,
作者: aba    时间: 2023-12-30 22:22
666
作者: r8088    时间: 2023-12-30 22:22
哈哈,这个付费有点水哦。
作者: 5u5lv    时间: 2023-12-30 22:23
谁爬完了给我整一份,
作者: 美国总统奥巴马    时间: 2023-12-30 22:27
爬完给我一份
作者: NodeLoc    时间: 2023-12-30 22:41
爬完给我一份

作者: 成龙    时间: 2023-12-30 22:49
谁爬完了给我一份
作者: X￴    时间: 2023-12-30 22:54
爬完给我一份
作者: seal0207    时间: 2023-12-30 23:10
爬完给我一份
作者: win68    时间: 2023-12-30 23:11
爬完给我一份

作者: jiunian2012    时间: 2023-12-30 23:12
俺也想要
作者: rocket1178    时间: 2023-12-31 01:11
爬虫教学吗 ~
作者: feile    时间: 2023-12-31 01:35
爬完给我一份
作者: woputby    时间: 2023-12-31 01:52
冲啊
作者: 黑客    时间: 2023-12-31 02:22
火速开工
作者: andox    时间: 2023-12-31 03:00
爬完给我一份

作者: 黑客    时间: 2023-12-31 03:32
貌似不行啊
作者: 黑客    时间: 2023-12-31 03:59
视频爬不到啊
作者: 佚名账户    时间: 2023-12-31 04:26
英雄在哪里?
作者: karson    时间: 2023-12-31 13:32
黑客 发表于 2023-12-31 03:59
视频爬不到啊

我当时没关注视频
视频好像是不行=。=

作者: 黑客    时间: 2023-12-31 13:40
karson 发表于 2023-12-31 13:32
我当时没关注视频
视频好像是不行=。=

这家图很多水印,质量不太行,采集了五万张
作者: 孤枕    时间: 2023-12-31 15:46
爬完给一份
作者: ghosting    时间: 2023-12-31 16:26
黑客 发表于 2023-12-31 13:40
这家图很多水印,质量不太行,采集了五万张

感觉很不错了,就是有水印,分享一下, 还有更高的图站嘛?
作者: 5ks    时间: 2023-12-31 17:18
黑客 发表于 2023-12-31 13:40
这家图很多水印,质量不太行,采集了五万张

我也爬完了。连图带视频一共70530个,分724个套图。用的移动云电脑,速度感人










作者: 黑客    时间: 2023-12-31 17:18
5ks 发表于 2023-12-31 17:18
我也爬完了。连图带视频一共70530个,分724个套图。用的移动云电脑,速度感人

视频怎么爬的?我这边访问要会员权限.
作者: 5ks    时间: 2023-12-31 17:21
黑客 发表于 2023-12-31 17:18
视频怎么爬的?我这边访问要会员权限.

在网页里头,标题含:有视频字样的,第一个video
作者: 黑客    时间: 2023-12-31 17:23
5ks 发表于 2023-12-31 17:21
在网页里头,标题含:有视频字样的,第一个video

我的建议是你直接打包
作者: 5ks    时间: 2023-12-31 17:25
黑客 发表于 2023-12-31 17:23
我的建议是你直接打包

移动云电脑上行不太好,还在上传
作者: 黑客    时间: 2023-12-31 17:26
5ks 发表于 2023-12-31 17:25
移动云电脑上行不太好,还在上传

那我就不爬了,我写的单线程爬的巨慢.坐等大佬分享了
作者: LovelyCat    时间: 2023-12-31 17:27
这是个什么程序
作者: 黑客    时间: 2023-12-31 17:27
5ks 发表于 2023-12-31 17:25
移动云电脑上行不太好,还在上传


跑了一晚上没跑完..
作者: 黑客    时间: 2023-12-31 17:36
5ks 发表于 2023-12-31 17:25
移动云电脑上行不太好,还在上传

get_video_url 这个请求貌似会验证vip权限 给我返回了个400
作者: balala    时间: 2023-12-31 17:38
X￴ 发表于 2023-12-30 22:54
爬完给我一份

你这个名称牛逼plus
作者: karson    时间: 2023-12-31 17:39
黑客 发表于 2023-12-31 17:36
get_video_url 这个请求貌似会验证vip权限 给我返回了个400

我也是。
我看到有个投稿作品的选项,我想试试我能不能自己上传个视频然后找下链接规律啥的()
结果发现它也不让传视频啊
作者: 黑客    时间: 2023-12-31 17:46
karson 发表于 2023-12-31 17:39
我也是。
我看到有个投稿作品的选项,我想试试我能不能自己上传个视频然后找下链接规律啥的()
结果发现 ...


  1. // 获取视频
  2. videoCoverWrapper.click(function () {
  3.     videoCoverInner.hide();
  4.     videoLoading.show();
  5.     let url = $('.get_video_url_url').text();
  6.     $.get({
  7.         url: url,
  8.         data: {
  9.             album_id: album_id
  10.         },
  11.         success: function (result) {
  12.             videoLoading.hide();
  13.             if (result.code === 200) {
  14.                 let url = result.url;
  15.                 videoCoverWrapper.hide();
  16.                 videoElement.show();
  17.                 videoElement.attr('src', url);
  18.                 videoElement[0].play();
  19.             } else {
  20.                 videoCoverInner.show();
  21.                 console.log(result)
  22.                 if (result.msg === 'login_required') {
  23.                     console.log('请先登录');
  24.                     showModal('.login-required-modal')
  25.                 }

  26.                 if (result.msg === 'vip_required') {
  27.                     showPlanModal();
  28.                 }
  29.             }
  30.         }
  31.     })
  32. })

复制代码


会不会是因为没登录
作者: karson    时间: 2023-12-31 17:48
黑客 发表于 2023-12-31 17:46
会不会是因为没登录

我登陆了,也是400。然后就到下面`showPlanModal`的语句了
作者: karson    时间: 2023-12-31 17:49
LovelyCat 发表于 2023-12-31 17:27
这是个什么程序

有可能是自己写的
作者: LovelyCat    时间: 2023-12-31 17:57
karson 发表于 2023-12-31 17:49
有可能是自己写的

风格很像ritheme
作者: hostlocking    时间: 2023-12-31 18:17
我是学生,最近营养比较足,所以我想
作者: karson    时间: 2023-12-31 18:42
本帖最后由 karson 于 2023-12-31 18:43 编辑
LovelyCat 发表于 2023-12-31 17:57
风格很像ritheme


应该不是wordpress,它没有wordpress该有的特征,包括什么/wp-sitemap.xml啊,/wp-admin啊。而且登陆后的cookie格式也不像wordpress

但是cookie里面有个密码的字段=。=,比较不专业。加上这里提到的page查询字符串的bug……看起来像是自己写的
作者: keylows    时间: 2023-12-31 18:44
5ks 发表于 2023-12-31 17:18
我也爬完了。连图带视频一共70530个,分724个套图。用的移动云电脑,速度感人



还不拿出出来




欢迎光临 全球主机交流论坛 (https://52.ht/) Powered by Discuz! X3.4