套图网爬虫[预览版] 23.07.02–天啦噜,有人来砸姐姐场子啦!

之前有人在评论区留言,想让姐姐加一个网站爬虫。但是呢,随便搂了一眼发现是wp的系统,和之前做的页面完全不兼容啊。就没想做,结果好嘛。这两天有人在后台留言了,说感谢提供的网址,然后ta自己写了一个。最重要的是还不共享,这姐姐能忍?叔能忍,婶不能忍啊!!

Continue Reading

性感美女 爬虫<重构版> [Windows] [23.05.21]

更新日志:
1.重构下载代码
2.重写了一部分代码逻辑
3.这个是5月份的代码,忘了发了。哈哈哈
参数:
C:\Users\obaby>F:\Pycharm_Projects\meitulu-spider\dist\xgmn8_v2.exe
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search> -e <early stop>
Arguments:
         -a <download all site images>
         -q <query the image with keywords>
         -h <display help text, just this>
Option Arguments:
         -p <image download path>
         -r <random index category list>
         -c <single category url>
         -e <early stop, work in site crawl mode only>
         -s <site url eg: https://www.jpxgmn.net (no last backslash "/")>
****************************************************************************************************

Continue Reading

家人们,谁懂啊。爬虫写完了,网站挂了。哭唧唧

太羡慕秀人集之类的各种小姐姐了,身材又好。胸又大,哼。正好前几天有看到一个可以看小姐姐图片的网站,imn5.cc,主要是人家还写了啊:

本站为全网最新秀人机构写真,新出的作品为预览版一般在2个星期内更新高清完整版。高清版均采用1200高像素大图,且无别家的水印。本站不管手机还是电脑端均无广告。如果您也喜欢本站,请扫描左右两边的微信或支付宝二维码随意赞助我们 友情提醒:本站不提供下载,小心上当受骗

就相中了这个高清大图,也是想着下载,结果发现图片貌似不是很全,多数都只有一页。然后在浏览的时候发现提到了另外一个网站plmn5.cc。这个网站的图片资源也是真的不少呢。

Continue Reading

秀人集爬虫 [更新版] 【23.05.13】【Windows】

C:\Users\obaby>F:\Pycharm_Projects\meitulu-spider\dist\xiurenji2\xiurenji2.exe
****************************************************************************************************
秀人集爬虫 [更新版]
Verson: 23.05.13
当前服务器地址:https://www.xiuren5.vip
Blog: http://oba.by
姐姐的上面的域名怎样啊?说不好的不让用!!哼!!
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search>
Arguments:
         -a <download all site images>
         -q <query the image with keywords>
         -h <display help text, just this>
Option Arguments:
         -p <image download path>
         -r &lt;random index category list>
         -c <single category url>
         -e <early stop, work in site crawl mode only>
         -s <site url eg: http://www.xiurenji.vip (no last backslash "/")>
****************************************************************************************************

Continue Reading

精品美女吧 爬虫【Windows】【23.04.16】

精品美女吧 爬虫
Verson: 23.04.16
Blog: http://www.h4ck.org.cn
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search> -e <early stop>
Arguments:
         -a <download all site images>
         -h <display help text, just this>
Option Arguments:
         -p <image download path>
         -r <random index category list>
         -c <single category url>
         -e <early stop, work in site crawl mode only>
         -s <site url eg: https://www.jpxgmn.net (no last backslash "/")>
****************************************************************************************************

Continue Reading

美女图片整理工具 V1.0

 

不知道有没有和姐姐我一样把所有美女的图片都下载下来的,如果没有下载的话可以通过博客的搜索功能搜索爬虫去下载妹子图片了哦。通过爬取的乱七八糟的各种网站,目前粗略的估计所有下载的图片大约有1T左右了。由于各个网站都是分别的下载的,所有下载后的图片会有很多重复的。想找一个图片处理工具,找了半天有个什么推荐的eagle的工具,还是收费的,可以免费试用一个月。结果我把下载的图片目录加进去直接卡死了。啊哈哈。这就离谱,所以如果没有图片处理需求的还是推荐picasa3,我也有发布一个补丁工具,真的是一代神器。

既然没有现成的工具,那就写一个吧,具体的要求:

1.能够把所有文件复制到同一个目录下(这不是废话嘛,就是为了干这个的啊)
2.能够过滤10k以下的非图片文件(多数是由于被爬取网站不稳定导致的下载失败,其实不是图片文件)
3.对于不同网站下载的同一个图片不要重复复制(通过计算文件md5的方法进行规避)
4.能够记录整理日志(当然啊,不然那么多文件中间关机了,岂不是得全部再来一遍)
主要就是上面的几个要求啦~~~

Continue Reading