首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX 提问指南
广告
V2EX
›
问与答
如何采集漫画
LINAICAI
·
2014-02-28 09:20:33 +08:00
· 2842 次点击
这是一个创建于 3774 天前的主题,其中的信息可能已经有所发展或是发生改变。
说到底就是采集规则,采集漫画和采集图片一样吗。
采集
漫画
说到底
5 条回复
•
1970-01-01 08:00:00 +08:00
1
kiah
2014-02-28 10:48:40 +08:00
一样的。。
2
zhy0216
2014-02-28 16:29:07 +08:00
一样的,
但最好自己写个model, 分好哪本漫画, 哪一卷这些数据,
然后在页面的model里存图片的url就好
3
LINAICAI
OP
2014-02-28 16:55:35 +08:00
@
zhy0216
是不是读取目标网页html内的特定节点然后记录到相应的model,这样的话,如何做到自动展开二级或者内链读取下级网页数据呢?
4
LINAICAI
OP
2014-02-28 16:56:43 +08:00
@
zhy0216
还有是有些分页数据怎么去,不可能每一页都去读取一次吧。
5
zhy0216
2014-03-20 10:33:05 +08:00
@
LINAICAI
没太看懂你的意思
就是找到这个漫画, 这个漫画下面有很多卷
你把这些都存下, 然后再去爬每一个卷,
看这个卷的时候, 一方面都有下一页的连接, 所以你可以继续爬
另外一般的漫画站都是把页码数写在url上的, 你可以猜
不知道讲清楚没。。。
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
2441 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms ·
UTC 13:41
·
PVG 21:41
·
LAX 06:41
·
JFK 09:41
Developed with
CodeLauncher
♥ Do have faith in what you're doing.