V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lookhi
V2EX  ›  酷工作

[在上海]我们在寻找。。。别犹豫了就是你

  •  
  •   lookhi · 2013-05-24 17:02:47 +08:00 · 6383 次点击
    这是一个创建于 3987 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我们准备做什么:
    我们目的很简单 分析互联网上大家讨论的热点。咳咳,我们只关注商业上的应用,那么你可以放心了(希望你懂的)。
    比如微博/论坛等上面讨论了什么商品,什么活动,都讨论了什么方面,对此的好恶等等。

    我们的愿景:
    将我们普通消费者与商家联系起来,从而提供给我们消费者更好的服务和产品。

    我们是谁:
    我们不算是传统意义上的创业公司,但我们部门将会是一个创业氛围的团队。
    这也就意味着我们不会突然的挂掉,可以比较长的时间来做这件事情 :)
    创业是一个过程,而无论是否在于一个所谓的创业公司。你认为是,那他就是。

    我们打算怎么做:
    1. 从互联网上获取足够多的数据
    2. 启动各种分析计算过程
    3. 展示我们的各种分析结果

    需要的武艺:
    a) 存储,太多的互联网数据需要存储了。因此需有一套齐备的数据存储系统。
    了解分布式存储的基本做法,其实不了解也行。我们可以逐步来熟悉了解。
    熟悉现在的一些KV存储引擎系统(LevelDB,HBase,Bdb,ToykoCabinet...甚至sqlite也算的)
    存储将会是一个服务,因此网络编程是必须要的,当然也不用害怕,其实也就是那么回事。一个Network Daemon而已。
    熟练的掌握Java/Python,熟练使用/C++更好了。
    更多的期待你的展示。
    b) 计算,一大堆的分析都是计算的结果。一个稳定的计算平台不可缺少。
    现在的计算标配嘛,Hadoop.
    因此需要你对Hadoop非常熟悉,不再是只写mapreduce程序了。
    最好知晓如何编写mapreduce的各种自定义接口,阅读过源代码就更好了。
    我们的目标极度明确Hadoop计算框架 + 快速的脚本语言开发。
    更多的分析应用可以采用其他的快速语言来实现,比如python,bash等。
    我们推荐你最好也熟悉python。python将会是整个的粘合剂和分析主力语言。
    为啥是python,因为我们大多数人都对python熟悉。
    c) 分析,最终的分析的实现。
    按照我们的目标,文本分析必不可少啊。
    通常我们会希望您了解NLP(自然语言处理)相关点,简单点分词,复杂点语法分析,高深点语义分析。
    当然我们会逐步推进这些。
    同样的Text Mining的相关点(比如快速聚类等)也是需要的。
    你要是了解更多的社会科学相关知识就更妙了。
    d) 搜索
    结果展示的快速显示能力,这已经是一个标配了。不在累述。
    这里还需要您对中文分词有所了解以及对如何构建一个分布式的"廉价"搜索充满兴趣。
    e) 爬虫
    一个分布式的"廉价"爬虫体系也是需要的,您有任何想法也可以与我来交流。

    上述任一武艺,我们都欢迎。若您具备多种武艺,更是竭力欢迎。
    也欢迎您来我们这聊聊。

    对了,我们用Linux。发行版本不限,希望你也行。
    你可以选择ubuntu,ubuntu还是ubuntu.开玩笑,可随意选择版本。
    我个人用的是xubuntu。

    联系咨询:
    公司HR邮箱: hr-shanghai#(tensynchina.com)
    或者发到我的邮箱 lookhi#(foxmail.com) 代为转发
    有其他的需要了解的也可以找我了解。

    福利待遇:
    法规规定的都有。具体的待遇还是要您来当面来"切磋切磋"。

    地址:
    徐汇区虹桥路+番禹路
    18 条回复    1970-01-01 08:00:00 +08:00
    skywinger
        1
    skywinger  
       2013-05-24 17:10:23 +08:00
    很好很强大,如果能不止用于商业而是整个世界关键信息的搜索分析那就更好,比维基百科好。
    firsthym
        2
    firsthym  
       2013-05-24 17:41:08 +08:00
    明盘?
    yearsaaaa
        3
    yearsaaaa  
       2013-05-24 18:27:37 +08:00
    我做的工作和这个也很相似,基础平台的相关服务,我日常用的也是ubuntu,好吧,是个巧合,支持一下
    lookhi
        4
    lookhi  
    OP
       2013-05-24 22:36:12 +08:00   ❤️ 1
    @skywinger 只是商业应用 能做好这块就已经不错了 整个世界的任务还是google来吧
    @firsthym 明盘?你说的是薪水吗?这个没明盘,我们希望前来切磋的同学多有个认识自己价值的机会,你需求的不一定是最终的。可能有小惊喜也可能是小失落,挺好的。
    @yearsaaaa 欢迎欢迎欢迎同好啊。有空也欢迎来聊聊。
    best1a
        5
    best1a  
       2013-05-24 22:41:00 +08:00
    再贴下和同学做的毕设

    你们的产品会不会包含这些方面的,求围观
    lookhi
        6
    lookhi  
    OP
       2013-05-24 22:50:09 +08:00
    @best1a 你的毕设算opinion reviews吧。类似的方法会用上,不过我们的产品形式可能不是这样。可以算最终产出的一个方面。
    best1a
        7
    best1a  
       2013-05-24 22:55:05 +08:00
    @lookhi 哦哦,到时可以来这宣传下,去围观
    bradlee
        8
    bradlee  
       2013-05-24 23:28:18 +08:00
    听上去不错,也做过NLP方面的毕设。。。不过好久不搞这方面了
    话说可以理解为贵司搞的这是舆情分析?
    lookhi
        9
    lookhi  
    OP
       2013-05-25 09:39:09 +08:00
    @bradlee 咳咳,我们只关注商业上的应用,那么你可以放心了(希望你懂的)。
    arthur8845
        10
    arthur8845  
       2013-05-26 10:09:23 +08:00
    都是我感兴趣的怎么办
    lookhi
        11
    lookhi  
    OP
       2013-05-26 22:36:32 +08:00
    @arthur8845 来嘛 聊聊 有些是有交叉的
    magicbrighter
        12
    magicbrighter  
       2013-05-28 00:02:53 +08:00
    楼主考虑过使用storm进行热点分析,就像twitter一样?
    lookhi
        13
    lookhi  
    OP
       2013-05-28 10:57:04 +08:00
    @magicbrighter 嗯 storm实时后面也要涉及的。先易后难,Hadoop先上,离线是必须要的。
    cacoo
        14
    cacoo  
       2013-05-28 11:09:34 +08:00
    看着挺靠谱的团队
    帮转发微博一下
    yehkevin
        15
    yehkevin  
       2013-05-28 11:22:04 +08:00
    我是Rubist的,这样的可以吗
    lookhi
        16
    lookhi  
    OP
       2013-05-28 13:53:38 +08:00
    @yehkevin 语言不是特别指定的。除了计算用的Hadoop必须上Java外。只要能达成目标,当然与现有团队间的配合可能还是会有些影响,统一语言协助会更好点。熟悉一们新语言也不是很难的事情,合适的地方选用合适的语言都OK的。
    revir
        17
    revir  
       2014-02-24 20:19:41 +08:00
    @lookhi
    今天下午去面试了贵公司, 面试风格很独特, 提的问题也很辛辣, 不瞒您说, 有几个问题真的将我问懵了。
    贵公司做的产品, 使用的技术真的很高精尖呀, 神马 Hadoop, NLP, 真的是一群牛人干的事呢, 期待能与这样的牛人共事!
    lookhi
        18
    lookhi  
    OP
       2014-02-27 10:01:19 +08:00
    @revir :)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3321 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 12:30 · PVG 20:30 · LAX 05:30 · JFK 08:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.