V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  holajamc  ›  全部回复第 6 页 / 共 30 页
回复总数  589
1 ... 2  3  4  5  6  7  8  9  10  11 ... 30  
2019-06-25 13:13:45 +08:00
回复了 mingk 创建的主题 分享发现 哪里可以看世界杯的比赛啊?
@duola 『刘爱玲接扁担,孙雯歇会儿抽袋烟』
2019-05-31 22:48:57 +08:00
回复了 miniyao 创建的主题 Python Python Thread 线程用完了会立即自动销毁吗?
@yth492300648 ???
2019-05-07 19:08:01 +08:00
回复了 qq976739120 创建的主题 职场话题 [求问]杭州九章算法科技情况
boss 上面投递了…希望能面试人在杭州…
2019-05-02 19:41:34 +08:00
回复了 zclHIT 创建的主题 成都 进三银四过去的第二天,还没拿到 offer 的进来握个爪
来了来了
2019-04-23 21:55:24 +08:00
回复了 leon0918 创建的主题 酷工作 [涂鸦智能] [杭州] 金三已过,银四等你
半个多月前在 zhipin 上面交流了安全工程师岗位…至今没有回复…
2019-04-09 10:23:50 +08:00
回复了 Archangell 创建的主题 问与答 请问什么叫文件类型
2019-04-09 09:42:57 +08:00
回复了 Tchai52 创建的主题 职场话题 996+高薪 还是 正常上班+正常薪水?
合着有 996 的朋友拿高薪?
2019-03-29 11:38:15 +08:00
回复了 sunhk25 创建的主题 Python 如何比较两个列表的相似度
In [1]: a = ['a', 'b', 'c']

In [2]: b = ['a', 'b', 'd']

In [3]: def jaccard_sim(a, b):
...: return len(set(a).union(set(b)))/len(set(a).intersection(set(b)))
...:

In [4]: jaccard_sim(a, b)
Out[4]: 2.0

杰卡德相似性
2019-03-25 10:00:00 +08:00
回复了 nicking 创建的主题 Python 萌新求教-爬取马蜂窝数据
2019-03-23 11:44:20 +08:00
回复了 SharkIng 创建的主题 问与答 爬虫( Python )如何处理页面上的 加载 按钮?
相关的 JS 在这里
/html/body/div[1]/script[35]/text()
可以看看~
2019-03-21 18:08:52 +08:00
回复了 SharkIng 创建的主题 问与答 爬虫( Python )如何处理页面上的 加载 按钮?
2019-03-20 15:32:44 +08:00
回复了 jianzhao123 创建的主题 Python Python 百度百科爬虫结果乱码问题
@holajamc emmm chatset -> charset
2019-03-20 15:31:37 +08:00
回复了 jianzhao123 创建的主题 Python Python 百度百科爬虫结果乱码问题
@holajamc 流程大概是这样的,HTTP 的 response 合理的规范会在 Content-Type 中附带 chatset 信息,告知客户端服务端会使用什么样子的编码,比如你可以试试访问 github,看一看 response 的 headers 部分
但是这种设想都是十分美好的事情,比如百度百科的 Content-Type 仅仅只有页面类型,因此 requests 会使用 iso-8859
当然了也可以使用 requests 进行编码推测,这是一件开销很大的事情所以不要尝试~
2019-03-20 15:23:59 +08:00
回复了 jianzhao123 创建的主题 Python Python 百度百科爬虫结果乱码问题
In [1]: import requests

In [2]: url = 'https://baike.baidu.com/item/Python/407313'

In [3]: headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) AppleWebK
...: it/537.36 (KHTML, like Gecko) Chrome/73.0.3683.75 Safari/537.36'}

In [4]: r = requests.get(url=url, headers=headers)

In [5]: '计算机程序设计语言' in r.text
Out[5]: False

In [6]: r.encoding = 'utf8'

In [7]: '计算机程序设计语言' in r.text
Out[7]: True
2019-03-07 10:32:35 +08:00
回复了 zjgwifi 创建的主题 全球工单系统 阿里 dns223.5.5.5 是不是挂了
ping 它有什么用…
1 ... 2  3  4  5  6  7  8  9  10  11 ... 30  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3279 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 50ms · UTC 14:11 · PVG 22:11 · LAX 07:11 · JFK 10:11
Developed with CodeLauncher
♥ Do have faith in what you're doing.