大数据爬虫技术基础篇：大快在线爬虫安装步骤

最新推荐文章于 2024-05-29 14:13:29 发布

weixin_33766168

最新推荐文章于 2024-05-29 14:13:29 发布

阅读量113

收藏

点赞数

文章标签：爬虫数据库 java

原文链接： https://my.oschina.net/u/3793864/blog/1933377

版权

2019独角兽企业重金招聘Python工程师标准>>>

在线爬虫是大快大数据一体化开发框架的重要组成部分，本篇重点分享在线爬虫的安装。爬虫安装前准备工作：大快大数据平台安装完成、zookeeper、redis、elasticsearch、mysql等组件安装启动成功。

1、修改爬虫安装配置文件(最好在线下修改好后再上传平台)

2、修改crawler\dkcrw\jdbc.properties配置文件(只修改图片里的内容其他内容默认即可)

Hbase.zookeeper.quorum所填地址应在DKM监控平台查看：

Redis相关配置看如下界面：

3、把已修改的crawler\dkcrw\下的jdbc.properties配置文件替换到\crawler\dkcrw-tomcat-7.0.56\webapps\ROOT\WEB-INF\classes下(这下面有一个没有改好的直接替换)

修改好后把修改好的爬虫文件打压成压缩文件

4、上传平台主节点并解压(这里就不介绍怎么上传了的了,本次例子是上传到root目录下,安装包上传到任何目录下都可以推选root目录)

unzip 解压命令,解压唱功后会多了一个 cuawler 的文件夹

使用cd crawler 命令进入 crawler 文件夹下

使用mysql -uroot -p123456 < numysql.sql 命令添加numysql.sql数据库

5、分发爬虫文件

每个节点都需要有dkcrw文件, dkcrw-tomcat-7.0.56文件只能放在一个节点上,不能放在主节点上(推选放在从节点) 命令: scp -r {要分发的文件名可填写多个,如果不在要分发文件的目录下请添加路径} {分发到的服务器ip或名称:分发到的路径} 例如: cd /opt/dkh scp -r dkcrw dk2:/opt/dkh/ scp -r dkcrw dkcrw-tomcat-7.0.56/ dk2:/opt/dkh/

6、在分发了dkcrw-tomcat-7.0.56文件的节点上给文件添加权限命令: chmod -R 755 {需要给权限的文件等} 例如: cd /opt/dkh chmod -R 755 dkcrw dkcrw-tomcat-7.0.56/

7、启动爬虫界面命令: cd /opt/dkh/dkcrw-tomcat-7.0.56/bin/ ./startup.sh

启动界面之后再浏览器中输入启动界面节点的IP,来打开爬虫界面看是否启动成功(账号密码是默认的)

8、启动每个节点的dkcrw.jar 命令: 主节点运行 cd /opt/dkh/dkcrw/ nohup java -jar dkcrw.jar master > dkcrw.log 2>&1 &

从节点运行 cd /opt/dkh/dkcrw/ nohup java -jar dkcrw.jar slave > dkcrw.log 2>&1 &

注意：可以先使用前台启动爬虫，确定爬虫没错误。前台启动命令java -jar dkcrw.jar master/slave

转载于:https://my.oschina.net/u/3793864/blog/1933377

weixin_33766168

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据爬虫技术基础篇：大快在线爬虫安装步骤

2019独角兽企业重金招聘Python工程师标准>>> ...
复制链接

扫一扫

weixin_33766168 CSDN认证博客专家 CSDN认证企业博客

156: 原创

-: 周排名

40万+: 总排名

129万+: 访问

: 等级

7617: 积分

4627: 粉丝

204: 获赞

33: 评论

1180: 收藏

写文章

热门文章

nginx重新加载配置（reload） 35128
西部数据出现“WD SES Device USB Device”怎么办，而且说明书全是英文。 18259
vue中的input使用e.target.value赋值的问题 17682
开源BT磁力搜索引擎收集 15949
华为交换机限速配置命令2016 15286

最新评论

自动注册appleid
weixin_45186442: 大量收苹果id
自动注册appleid
L·J.J: 有出苹果id么
自动注册appleid
karnooL: 可以批量注册吗
centos6.8下l2tp客户端xl2tpd的安装配置
王腾: 资源404了
地理信息系统专业考研 GIS专业考研名词解释大全[转]
lllugmk: 这个是外国的软件吗，数据存储安全吗

最新文章

【Java】操作mysql数据库
C++中实现回调机制的几种方式
vc 获取外网ip

目录

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

深圳SEO优化公司平湖网站关键词优化公司芜湖模板推广报价襄樊营销网站哪家好上饶企业网站制作公司襄樊网站改版报价坪山关键词排名迪庆SEO按效果付费山南设计网站推荐河源网站搜索优化哪家好新余百度标王潮州网站建设多少钱林芝优秀网站设计价格和县百姓网标王推广推荐深圳外贸网站建设多少钱永州百度网站优化哪家好威海网络推广哪家好深圳建站报价鹤岗网站制作报价永新网页制作宝安企业网站设计推荐宜宾网站建设公司景德镇网页设计价格衢州网页设计价格三亚网站seo优化推荐白山SEO按天收费公司大浪百度竞价多少钱坪地关键词按天计费茂名企业网站改版价格大芬网页设计报价临沂外贸网站建设哪家好歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发春山在望成都发生巨响当地回应 60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警 #春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅：唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子 19岁小伙救下5人后溺亡多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人？开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头 315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU 恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化