V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wibile  ›  全部回复第 21 页 / 共 22 页
回复总数  438
1 ... 13  14  15  16  17  18  19  20  21  22  
2014-11-26 17:27:02 +08:00
回复了 tywtyw2002 创建的主题 程序员 最近在跑实验,求一些 python 自动化、分布式的框架
fabric,celery,rabbitmq
2014-11-18 11:29:44 +08:00
回复了 cshwen 创建的主题 Android Nexus 4 升级 lollipop 感觉跪了
N7升级完毕,感觉更流畅了,反应迅速。
2014-11-16 23:41:22 +08:00
回复了 binux 创建的主题 分享创造 再次分享 pyspider 爬虫框架
听了你的演讲,东西很不错。不过个人觉得还是scrapy更完善,更强大一些。其实一般的爬虫并不难,用正则手写一个也能跑,而scrapy借鉴django的pipeline和middleware更灵活。对于你的web端自学习抓取数据的,我印象中scrapy的开发团队早就做了类似的东西。
还是那句话,一般的爬虫不难,难的是怎么应付现在的各种反扒机制:高阶js,block IP,captcha,cookie session认证。。。
消息队列用啥?rabbitmq?zeromq?没看到啊
2014-11-15 23:15:48 +08:00
回复了 lcqtdwj 创建的主题 Python 今天的 Pycon 很 Nice!
针对北京的pycon,我可以说脏话吗!!!!!!!他大爷的!!!!早知道在家好好睡觉了!!!要不要把广告搞那么多啊!!!
socket,memcache,queue。。。
详见IPC wiki
2014-11-08 11:13:40 +08:00
回复了 coofly 创建的主题 Python 如何在 Python 中进行跨进程跨脚本同步?
可惜,差点1024....
2014-10-05 23:21:32 +08:00
回复了 lzhi 创建的主题 问与答 如何有效的消灭家里的蟑螂?
据说拜灭士不错,可以试试。我没用过哈。
@janusle 只要是定义好的task,哪里都可以用的。在task A里直接调用task_b.apply_async(kwargs=your_json)就可以把这个任务放入B队列。没必要用table,实在不想用queue,就搞个memcache存中转数据。
这不就是个爬虫嘛,没有大规模的业务不用上celery吧,celery做分布式用的。
传数据可以直接在taskA里再生成一个带参数的任务给另一个队列,作为B来执行。也可以直接用memcache。
2014-09-12 17:30:15 +08:00
回复了 rcmerci 创建的主题 Python django 把所有文件加载 2 遍?
2014-08-29 00:01:11 +08:00
回复了 haython 创建的主题 问与答 做 python 爬虫,有什么推荐的资料,书,或者博客文章
scrapy官方手册
2014-07-26 21:38:50 +08:00
回复了 O21 创建的主题 问与答 问下:大家都在哪接外包?我的水平可以接外包么?
用scrapy吧,同学。不用点非阻塞的框架,怎么好意思说会写爬虫呢
2014-07-26 15:22:23 +08:00
回复了 cssnote 创建的主题 问与答 用 vpn 导致 QQ 账号异常,不想用虚拟机,怎么解决?
搞台国外虚拟机,ssh上去,建立socks隧道,chrome SwitchySharp添加一条规则就好了。
2014-07-21 23:36:02 +08:00
回复了 andyliu 创建的主题 问与答 android 编译服务器大概需要什么配置 ,5-7 个人的团队使用。
@andyliu 环境一次配置好就可以了,关机只计算空间占用费。上传慢?随时开50M带宽,只要公司网络给力,传完回复带宽,毫无压力。首推青云啊。aws要是在国内,那真是太爽了。。。搞块N卡,各种并行运算。。。
2014-07-21 22:59:43 +08:00
回复了 andyliu 创建的主题 问与答 android 编译服务器大概需要什么配置 ,5-7 个人的团队使用。
青云或者aws开台主机,搞个顶配的。随用随开。可行不?不用就关掉。
2014-07-19 11:30:24 +08:00
回复了 Axurez 创建的主题 问与答 怎么用爬虫爬动态需要手动加载部分内容的网页?
@ddzz 效率低。。。。还是phantomJS靠谱
2014-07-15 19:45:39 +08:00
回复了 no13bus 创建的主题 问与答 关于 django 和 celery 执行定时任务的问题。
应该不是setting问题,运行celery -A proj worker -l info看注册的tasks,是否和你beat里的一致,注意是个字符串,不同运行目录会注册不同的tasks名称,如:tasks.add或者xxx.tasks.add。
赞一个,这个方式很好啊。留给有需要的同学 。支持UCloud
1 ... 13  14  15  16  17  18  19  20  21  22  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3105 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 40ms · UTC 00:41 · PVG 08:41 · LAX 17:41 · JFK 20:41
Developed with CodeLauncher
♥ Do have faith in what you're doing.