V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
herfool
V2EX  ›  酷工作

[小黑鱼.上海] 准备搞全网电商数据平台,超强战斗力团队组建中,爬虫 & NLP 工程师火热招募 ing~!要精兵也要强将,一起干大事成大器!

  •  1
     
  •   herfool · 2019-02-22 19:40:15 +08:00 · 1459 次点击
    这是一个创建于 1888 天前的主题,其中的信息可能已经有所发展或是发生改变。
    1、高级研发工程师 - 数据采集和处理(爬虫)

    岗位职责
    1. 提供电商类相关产品的基础数据支持;
    2. 从事网页结构分析、网页信息结构化及自然语言处理等技术开发;
    3. 优化抓取策略和算法,提升 Spider 的抓取效果;
    4. 对互联网数据进行加工和提炼,为业务运营提供数据支持;
    5. 撰写需求文档,设计文档,并提供相应实现方案的实现支持。

    岗位要求
    1. 计算机相关专业本科以上学历,2 年以上 Linux 平台开发经验;
    2. 在数据抽取,文本相似性算法,海量数据处理等相关领域有一定的经验积累,具有较好的创新能力和较强的团队合作能力;对搜索系统相关的网页爬虫、网络数据采集或自然语言处理( NLP/NER )等领域有实际经验者优先;
    3. 熟悉 Linux 环境;熟悉 HTTP 协议,熟练使用一门以上脚本语言(Shell/Python/Perl 等);
    4. 理解及沟通能力强,知识面广、学习能力强、自我驱动、专注诚实。

    2、高级研发工程师(自然语言处理)

    岗位职责
    1. 分析和提炼数据特征,从海量文本数据中抽取结构化数据和命名实体识别;
    2. 为小黑鱼旗下电商搜索引擎、竞争力系统和推荐系统提供技术和数据支持;
    3. 结合用户行为数据,改进数据抽取和分类算法;
    4. 撰写需求文档,设计文档,并提供相应实现方案的实现支持;
    5. 参与关键技术攻关,提供解决方案并实现。

    岗位要求
    1. 大学计算机相关专业本科以上学历,3 年以上工作经验;
    2. 熟悉互联网业务,有互联网数据挖掘项目经验尤佳;
    3. 熟悉中文分词,自然语言处理( NLP )及命名实体识别( NER )相关技术和使用方法;
    4. 有大规模数据挖掘、机器学习、并行计算等技术背景;
    5. 熟悉 Linux 平台,至少熟悉一种开发语言,JAVA\C\C++\Python ;
    6. 有很强的分析问题和解决问题的能力,能够积极主动的承担产品职责并推进业务进展 ;
    7. 理解能力强,有优秀的英语阅读能力,知识面广、学习能力强、专注诚实。

    职级不限,开放工程师及技术管理岗位

    想了解更多信息?想投递简历?欢迎联系温柔可爱美丽大方的 HR 小姐姐: [email protected]
    4 条回复    2019-02-26 09:34:52 +08:00
    dennis188
        1
    dennis188  
       2019-02-23 13:56:14 +08:00 via iPhone
    可以不在上海
    herfool
        2
    herfool  
    OP
       2019-02-23 17:27:45 +08:00
    @dennis188 base 地上海哦
    jishu541464750
        3
    jishu541464750  
       2019-02-25 12:50:18 +08:00
    请问招前端嘛?
    jk50505k
        4
    jk50505k  
       2019-02-26 09:34:52 +08:00
    应届要嘛
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3756 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 04:28 · PVG 12:28 · LAX 21:28 · JFK 00:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.