V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  yakczh  ›  全部回复第 55 页 / 共 70 页
回复总数  1391
1 ... 51  52  53  54  55  56  57  58  59  60 ... 70  
2014-03-06 00:00:05 +08:00
回复了 290601953 创建的主题 程序员 微信网页版 api 接口
微信api接口是个啥,是不是一个daemon等着解析腾讯发来的xml文件,然后回应一下?
2014-03-05 14:54:17 +08:00
回复了 0x002 创建的主题 iDev 有没有腾讯 weibo 的人?
腾逊的目光紧盯着下一个适合抄的产品
@for4 求优雅
表达真相
2014-02-28 09:37:16 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@normanzb 炒房的也吃香,什么火就跟进去,总能吃到香,照这个逻辑,任何端都通用,你是神人的话,所有香都能通吃一遍,flash高手们现在正在吃html5的香
2014-02-28 09:29:51 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@normanzb
你自己尿多,只可惜没尿到点子上,尿之前也不看看是帖子标题是啥, 那些flash火爆的时候冲进去学搞flash的那些人,难道现在全都开始实现html5了? 这就德性,跟炒房的一个尿性,html5火完了,后面还有新技术会火的,一直会有东西让你折腾的,不折腾怎么能显示出前端的技术含量呢
2014-02-27 20:31:58 +08:00
回复了 ljcarsenal 创建的主题 Python python shell 中有关 中文输出的问题
>>> s='中文'
>>> s
'中文'
2014-02-27 20:22:45 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@normanzb flash,siverlight 很吃香,这楼里某些人对吃香的的理解很广泛啊,楼上某人小声的嘀咕,结果帖子的标题都看不清楚...呵呵
2014-02-27 20:17:57 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@baconrad 1 现阶段就是这样,你可以去看前端的招聘要求和前端的实际工作
2 bootsrap也很优秀,也很顺手
3 注意,我没否认过前端的价值,我只是否认吃香的论调
2014-02-27 20:12:57 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@flynngao 这只是我的视角,我不明白你从哪里看出是我是上帝了, 到底吃到什么,吃的人自已最清楚 但这并不妨碍旁人做个判断,而且我的判断的依据都说了一堆, 说吃翔就成上帝视角了,那有人说前端要吃香的判断属于什么视角,下帝视角吗?
2014-02-27 18:52:13 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@flynngao 都是中国人,楞充什么外宾,你以为这么多人前赴后继地奔着吃香进来只是因为爱干刷f5的活,别逗了,就看这吃香这个标题就能明白怎么回事, 我只是给那些一心想着吃香,最后扑倒在地上吃翔的人提个醒,如果能达到不扯钱不钱的境界,只是因为喜欢干这个,那就对了
2014-02-27 18:32:25 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@baconrad
1 这么多高科技,差点把我吓傻了
2 除了amazon 犄角旮旯果然是描述这些网站最合适的词了
3 标准统一了,留下的前端薪水情况要看前赴后继因为听说火爆吃香扑进来的劳动力市场,涨不涨等你当上老板你就明白了.
2014-02-27 16:09:41 +08:00
回复了 yakczh 创建的主题 Python 爬虫抽取连接和抽取内容的部分是不是应该分开?
@diaoleona 比如京东的详情页 http://item.jd.com/1020784.html
有商品信息, 有象册,有评论 这种的是写到一个parse函数里吗,评论还可能有翻页
2014-02-27 15:56:00 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@luoyou1014
服了,原来一切都是因为"牛逼的措辞"在捣鬼,这下我懂了!
听君一席话,胜读十年书
2014-02-27 15:53:17 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@baconrad
1 核心价值是啥,能说来听听吗?
2 如果hao123上列出的网站都没有说服力,那你只能做一些犄角旮旯都找不见的网站来给自己壮胆了
3 统一标准了,老板首先会干啥,你猜猜看,养一帮快乐着的前端?
2014-02-27 15:49:36 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@luoyou1014
1 解决浏览器兼容性不是本事,你去问问老板,去听一下那些面试前端的都在问什么高科技
2 后端薄是访问接口更统一,并不是工作减少了,以前是有多少数据直接echo,现在是要对数据做更多的处理工作,后端的人员需求并不在echo数据上,更多的是后台管理,原来多少人还是多少人,没什么变化,除非大家都把后台管理界面做到手机上.
3 这个问题谈过了,只要标准统一,都可以用代码统一生成,不需要那么多人肉,这个账老板算得最清楚
4 数据挖掘分板不属于后端的话,那web开发后端在干吗,就是echo个数据吗?
5 技术含量体现在与用户交互上还是机器交互上? 规范多,变化多那是现阶段,标准统一了还会这样吗,看看metro风格和bootstrap做的小清新网站,希望你能看出来规范多,变化多
2014-02-27 12:15:33 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
1你打开hao123 把主流网站遍历一下,然后掰着指头数,我没用过,总能找到用到的人
2 我没说前端没用,请复习小学语文以后,再来发贴,相反,我一再强调人肉刷f5对老板的极端重要性,多一个客户就多一份收入,这不能称之为没用,不要树立一个假象的耙子,然后自以为赢了,自鸣得意,这是大脑有残疾的人干的事
3 我上过hao123上面列出来的网站, 另外你了解前端可以解释下前端,但这不能成为让别人闭嘴的理由,因为我看不过这两者之间有什么逻辑关系,论坛只是个发贴和讨论的地方,仅次而已
2014-02-27 11:53:55 +08:00
回复了 chenyg32 创建的主题 程序员 Web前端开发现在吃香吗?
@luoyou1014 我不懂计算机,但前端的要求高真没看出来,不信的可以上招聘网站去看看,你要是看出来了,请明示一下哪些地方高,高多少 js框架从最早的mt,yui2到现在的angularjs,ember都玩过来了,但这些除了给小白装下逼实际开发中真没什么用处,互联网发展这么多年 这么多网站用这些框架做出来的网站有多少,你可以掰着指头数一下, 对后端的要求低的是一些迷信dedecms,tp框架的土鳖老板,以为用了个框架就搞定一切了,真正有流量有业务的有几个对后端要求低的,这个你可以从主流网站的招聘页面去看一下,因为所有的技术含量都在后端,象12306的架构,业务数据安全,高性能高并发,数据挖掘算法,因为数据量在后端并不在前端.
前端有个原型链和异步事件模型,这个东西用来唬小白很管用,真正有过几年开发经验的都一笑而过,除了一些css属性get/set还剩什么.对于老板来说,前端的重要性不是什么扯谈框架,而是解决兼容性, 前端火这个原因我已经说过了,因为在这个浏览器纷争的时代,老板急需人肉来解决兼容性,因为多兼容一个浏览器就相当于多拉一个客户,多赚一份钱,而这个兼容性,现阶段可以利用一些jq这样的工具类,但大部分只能靠人肉来解决,老板必须招个人肉去解决这些问题,这是优先级最高的,所以客观上造成前端很火的假象,说白了,就是国外开发浏览器的程序员为抢市场埋了一些坑,然后让发展中国家的前端程序员加班加点地填坑,青春汗水和尸体全填在坑里,,真正等到浏览器统一标准了,这些人对老板也没有利用价值了,象手纸一样会被扔掉,所以我为什么说前端是个阶段性的概念只要不考虑浏览器兼容性,象boostrap,直接写几个class,一样做出ruby-china一样的小清新的网站,或者集成在webwiget填几个参数就ok了,就跟组件式开发是一样的,只需要会get/set,做些简单的数据搬运就可以了,另外还有人天真地认为后端到瓶劲了,后端再到瓶劲,那也是最靠近数据的地方,对于老板来说,程序和前端神马的都不重要,值钱的是业务数据,只要能掌握核心业务数据,永远都不会抛弃,只会抛弃老板,有了数据,搭上熟悉的框架,再招几个人肉前端,一个公司就起来了
2014-02-27 09:14:47 +08:00
回复了 yakczh 创建的主题 Python 爬虫抽取连接和抽取内容的部分是不是应该分开?
@pubby 这种是通用的,我不知道7g的url里面,是不是每一条都有用

定向抓取只抓取需要的链接,根据正则来匹配url连接,一个patten对应一个parser,
貌似scrapy的rule就是这样思路

rules = [Rule(SgmlLinkExtractor(allow=['/xxx/\d+']),'parse_xxx'),
Rule(SgmlLinkExtractor(allow=['/tor/\d+']), 'parse_torrent')]

如果再进一步配置化,可以把parse函数写成数据库字段,启动时读出来动态执行, 这样只需要把parse函数当成一个功能单元测试好,更新到数据库就完了
2014-02-26 21:58:14 +08:00
回复了 yakczh 创建的主题 Python 爬虫抽取连接和抽取内容的部分是不是应该分开?
@pubby 简单的都很好说,就不说了
我在看scrapy, 貌似一个种子站点,一个详情页面一个数据块这种的很好处理,但是比较种子站点多个页面,多个页面都可能有数据,每个页面有多个数据区域的话,还不知道怎么写,http://stackoverflow.com/questions/21323123/scrapy-storing-items-across-multiple-formrequest-pages-meta-python 其他人也有类似的问题

我觉得合理的配置是按urlpatten来配置, 一个patten对应一个页面,和一个parse函数,如果数据在详情页,就写一个parse函数,如果多个页面,分别写多个parser,每个parse中处理的xpath都不同
另外多个parse函数中的items可以平行地收集,(相当于parse是支流,items汇总) 也可以在items里加个一个urlpatten的key,这样各收集各的,两种都支持更灵活一些
1 ... 51  52  53  54  55  56  57  58  59  60 ... 70  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2394 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 29ms · UTC 10:13 · PVG 18:13 · LAX 03:13 · JFK 06:13
Developed with CodeLauncher
♥ Do have faith in what you're doing.