您当前的位置:首页 > 后端开发 > 爬虫开发工程师

[上海]网络爬虫工程师工作职责

时间:2020-09-18 ...
1.负责整个主题爬虫系统架构和数据存储设计,应对各种互联网爬虫规则;
2.把握网络爬虫的核心技术研究方向,例如信息抽取、数据聚类、重组、搜索;
3.分析爬虫系统的技术缺陷,对策略架构做出合理性地调整和改进;
4.负责日常网页数据抓取需求的实现;
5.爬虫系统的维护和优化;

岗位要求:
1.有两年以上网络爬虫软件设计与开发经验;
2.精通Java语言编程,熟悉Linux平台;
3.熟悉搜索引擎的工作原理;熟悉Lucene、Nutch、Heritrix、Larbin、HtmlParse、Scrapy等开源工具;
4.精通网页爬虫、分布式、多线程开发技术;
5.熟悉DOMHTML5CSS3等页面对象,使用过HtmlParser、Parser、xpath等页面解析组件,熟悉正则表达式;
6.熟悉nosql(redis、mongodb),有hbase开发经验者优先;
7.熟悉ActiveMQ、RabbitMQ、Redis、kafka等消息框架;
8.研究过反爬虫技术,熟悉地址去重算法;
9.能独立解决技术问题;

参考工资:1-2万/月


版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,如有本文知识产权人并不愿意我们使用,请联系我们:304541079@qq.com,我们会立即删除。

相关职责

    无相关信息

职责吧

陕ICP备14001139号-1

浏览