V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xiaozizayang  ›  全部回复第 16 页 / 共 23 页
回复总数  457
1 ... 8  9  10  11  12  13  14  15  16  17 ... 23  
2018-01-09 09:27:19 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
@ManjusakaL 我用 sanic 比较早 不得不承认是有问题的 记得年中那段时间还有安全问题 等它慢慢完善吧
2018-01-09 09:26:04 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
@ManjusakaL 1.我司有些服务将 flask 替换成 sanic 了 不过都是接口服务 感觉还可以 压测同等条件下 sanic 比 falsk 快 关于部署 docker 下直接裸跑 没毛病,2.我只针对 requets 以及 response 的请求前后做些处理 简单封装下就好 并没有需求对处理过程进行重新的需求,可能不理解你的感受,看你文章中的关于 json 的 pr,何不针对错误封装个 response_handle(),出错就替换成你的 json dumps,3.你说的装饰器的那个其他问题,我觉得那个没毛病,你编写的函数默认其实就是一个装饰器包裹起来的异步函数 sanic 只看返回的函数,这样我觉得还灵活点
2018-01-08 19:22:21 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
@ManjusakaL 何出此言
2018-01-07 16:36:52 +08:00
回复了 okzpy9425 创建的主题 求职 求教, 我这样的代码水平能找到工作吗?
加油 不低 此处该放简历 一点建议 代码可以更规范点 我觉得你的爬虫框架有点乱 我用手机看了下 可能不是看得很清楚 目标网页的提取 框架没有提供提取类 比如 cssselector re xpath 封装下 然后存储目标值也可以写个类 比如 scrapy 的 item 那种 不过我一般都是 item 类定好 target 值 spider 负责生成目标网页 requests 类负责抓取 抓取结果扔 item 类自动提取
2017-12-26 17:49:31 +08:00
回复了 prasanta 创建的主题 Python Toapi 正式发布 - 再也不愁没有数据!
将网站转化为一个 api 服务
2017-12-21 11:55:35 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
2017-12-21 11:54:46 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
你说得有道理 我也是说明和和注释相结合 我是这样写的 我把源码注释好了放在另外一个项目里 我在文章中列出框架的执行路线,每个路线的函数的作用,若想知道这个函数具体代码以及代码的具体解释,这里我就会把我注释好的代码地址放在旁边,读者可以一边看我写的注释,一边追踪框架的运行路线
2017-12-21 11:37:42 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
@neoblackcap 这是导读 核心部分如 server.py 每个函数我都写注释了 难道把注释解释放在文档里?
2017-12-21 08:49:31 +08:00
回复了 xiaozizayang 创建的主题 Python Sanic 源码阅读 - 基于 0.1.2
@mimzy 非常感谢 已改
2017-12-20 08:30:42 +08:00
回复了 Ehco1996 创建的主题 Python 写了个爬虫用的小工具: LazySpider 发布啦!
支持楼主 谁不是新手来的
2017-12-18 20:58:14 +08:00
回复了 graetdk 创建的主题 程序员 违反一下政治正确,骂一下 Google
楼主有发邮件询问么?我和你一样情况,发邮件说情况,第二天就回访弄好了
2017-12-12 09:14:10 +08:00
回复了 quietjosen 创建的主题 程序员 我是如何把 iText 带到这个世界的(双 12 有活动)
block
2017-12-04 10:24:42 +08:00
回复了 prasanta 创建的主题 Python Toapi - 让任何一个网站提供 API 接口.
关于 xpath 的解决方式,我另一个项目和你这个项目的目标值提取方式很像,我当时的解决方式是让使用者自己定义一个函数在 Item 的继承类里面,比如
``` python
from talonspider import Item, TextField, AttrField
from pprint import pprint

try:
bool(type(unicode))
except NameError:
unicode = str


class DoubanItem(Item):
target_item = TextField(css_select='div.item')
title = TextField(css_select='span.title')
cover = AttrField(css_select='div.pic>a>img', attr='src')
abstract = TextField(css_select='span.inq')

def tal_title(self, title):
# 这里当返回是 list,让使用者在自己定义的这个函数里解决
if isinstance(title, unicode):
return title
else:
return ''.join([i.text.strip().replace(u'\xa0', '') for i in title])
```
项目地址 https://github.com/howie6879/talonspider

如果你觉得可以 我们可以改成这样子去解决
2017-12-04 10:20:40 +08:00
回复了 prasanta 创建的主题 Python Toapi - 让任何一个网站提供 API 接口.
@prasanta 抱歉 ,刚看到,我没用 xpath 不过我发现 cssselector 也有这个问题 我已经解决了并提交 pr,我还提交了一些参数的优化 比如 requests 的 get 支持 headers,flask 的一些 options 参数传递问题,新增加了一个用 css 提取写的豆瓣 demo
![]( http://oe7yjec8x.bkt.clouddn.com/howie/2017-12-04-00.png-blog.howie)
2017-12-04 07:59:17 +08:00
回复了 prasanta 创建的主题 Python Toapi - 让任何一个网站提供 API 接口.
我也有这个想法 但随后又想 这就是一个小爬虫框架啊 就没弄 支持楼主 想去贡献下😍😍
2017-11-23 16:25:48 +08:00
回复了 intohole 创建的主题 Python 来一起造作吧!有一个爬虫小框架等你来!
2017-11-02 18:58:54 +08:00
回复了 ssshooter 创建的主题 程序员 不知道大家还有没有认识的人是 11 点前睡觉的...
我啊
2017-10-26 09:15:30 +08:00
回复了 easthing 创建的主题 分享创造 instagram 图片批量下载
我也写了个 ig 下载网址 并开源了 https://github.com/howie6879/instdd
2017-10-24 15:11:59 +08:00
回复了 xiaozizayang 创建的主题 Python 有用 sanic 的么?菜鸟问个 sanic 的压测问题
@strahe 裸跑了 问题依旧 无法水平扩展 你几台机器?
2017-10-24 15:02:15 +08:00
回复了 xiaozizayang 创建的主题 Python 有用 sanic 的么?菜鸟问个 sanic 的压测问题
@raptor 我用 sanic 写个几个小应用 性能是可以的 我现在就是压测水平拓展发现有点问题 不知是我代码问题还是什么
不知有没有其他人遇到过
1 ... 8  9  10  11  12  13  14  15  16  17 ... 23  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2656 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 14:32 · PVG 22:32 · LAX 07:32 · JFK 10:32
Developed with CodeLauncher
♥ Do have faith in what you're doing.