JS埋点_Spark分析_echarts展示 上部分

50 篇文章 0 订阅
订阅专栏
16 篇文章 0 订阅
订阅专栏
JS埋点_Spark分析_echarts展示 上部分
总体架构

总体架构 就是 js 将用户访问日志不断采集到nginx,经由脚本切割日志文件,然后由flume采集到hdfs,再经过spark任务分析,将结果存储到mysql,然后由echarts框架将数据展示到前端
实现JS埋点以及到nginx的数据采集
###### [安装nginx](http://www.wordboy.cn/2017/11/01/Nginx_Builde.html)
配置nginx文件,下载 nginx.conf
//nginx.cnf 下载已经配置好的nginx.cnf配置文件然后覆盖掉
cd nginx
mv nginx.conf  conf/
配置nginx.conf
vim nginx.conf

配置nginx的服务器地址

将log.gif 放入到html中

log.gif下载

因为找不见大量的人访问,所以需要自己写一个模拟访问器
查看视频
采用pythn代码,模拟点击
from  selenium import webdriver
import random

class Start(object):
    def __init__(self):
        self.driver="/Users/zhancao/JOB/project/pythonProject/Simple/pyProject/moni/chromedriver"
    def start_go(self):
        self.click=[]
        #进行存储值
        self.click.append( "http://localhost:8080/ExceptionTracker_war/html/JAVA_SE.html")
        self.click.append( "http://localhost:8080/ExceptionTracker_war/html/JAVA_EE.html")
        self.click.append("http://localhost:8080/ExceptionTracker_war/html/BIG_DATA.html")
        self.click.append("http://localhost:8080/ExceptionTracker_war/html/C.html")
        self.click.append("http://localhost:8080/ExceptionTracker_war/html/C++.html")
        self.click.append("http://localhost:8080/ExceptionTracker_war/html/Python.html")
        self.click.append("http://localhost:8080/ExceptionTracker_war/")
        driver = webdriver.Chrome(self.driver)
        index=0
        while(True):
            random_i=int(random.random()*len(self.click))
            url=self.click[random_i]
            driver.get(url)
            print("======"+str(index)+"======="+url)
            index+=1

if __name__ == '__main__':
    start = Start()
    start.start_go()


对nginx 中的日志进行自动定时切分
shell,这块采用shell 编写,对nginx 的日志文件进行切分,存储,定时
#!/bin/bash
LOGS_PATH=/root/software/nginx/logs
LOGS_PATH_split=/root/software/nginx/split_log
nginx_sbin=/root/software/nginx/sbin/nginx
nginx_pid=$LOGS_PATH/nginx.pid
LOGBAK=$LOGS_PATH_split/$(date -d yesterday +%Y%m%d%H%M).log
mv $LOGS_PATH/access.log $LOGBAK
touch $LOGS_PATH/access.log 
kill -HUP `cat $nginx_pid`  #这块使用-HUB
echo "切割完成"
设置定时任务,使用 crontabs
安装crontabs
//安装
yum install vixie-cron
yum install crontabs

cron 是linux的内置服务,但它不自动起来,可以用以下的方法启动、关闭这个服务:
/sbin/service crond start //启动服务
/sbin/service crond stop //关闭服务
/sbin/service crond restart //重启服务
/sbin/service crond reload //重新载入配置

基本格式 :
*  *  *  *  *  command
分 时 日 月 周  命令

第1列表示分钟1~59 每分钟用*或者 */1表示
第2列表示小时1~23(0表示0点)
第3列表示日期1~31
第4列表示月份1~12
第5列标识号星期0~6(0表示星期天)
第6列要运行的命令
利用crontabs设置定时任务
//安装好之后

两步设置: 
#命令行输入
crontab -e
#在出现的vim中输入要执行的命令,每3分钟执行脚本命令
*/3 * * * * sh  /root/software/nginx/split_log.sh
查看图片,每隔三分钟生成一个文件

查看Js代码
Spark快速大数据分析.zip_Spark快速大数据分析_spark python_spark大数据_spark实时分析_数据
07-14
利用Python和Spark进行海量数据的实时分析,解决商业方案
wordcount代码_spark—1:WordCount(Python与Scala对照)
weixin_39958559的博客
12-12 145
spark是一种基于rdd的弹性分布式数据集的计算框架软件。官方提供scala接口,Python接口,以及java接口。这里提供scala和Python的两种版本的对照代码,会持续更新下去。欢迎关注。scala版本package com.chen.spark import org.apache.spark.SparkConf import org.apache.spark.SparkContext...
python 点_scala spark 点统计_spark—1:WordCount(Python与Scala对照)
weixin_39580715的博客
02-19 72
spark是一种基于rdd的弹性分布式数据集的计算框架软件。官方提供scala接口,Python接口,以及java接口。这里提供scala和Python的两种版本的对照代码,会持续更新下去。欢迎关注。scala版本package com.chen.sparkimport org.apache.spark.SparkConfimport org.apache.spark.SparkContextob...
sparkSQL清洗点数据(java版)
阿尼古
03-27 1262
数据格式: {"actionTimes":"2018-11-25","actions":"搜索","bb":"v1.0","fromType":"Chrome/73.0.3683.75","fromURL":"https://www.nyist.com/s?wd=ip%E5%9C%B0%E5%9D%80&rsv_spt=1","ip":"120.50.10.233","requestM...
Spark-echarts数据可视化
qq_43222167的博客
08-19 3766
简介 教程:https://echarts.apache.org/zh/tutorial.html#5%20%E5%88%86%E9%92%9F%E4%B8%8A%E6%89%8B%20ECharts 代码 js的提取文件 链接:https://pan.baidu.com/s/1JbmCR5KiU9PdOwJ6_E0bew 提取码:ubpi 前端 <!DOCTYPE html> <html> <head> <meta charset="utf-8">
数据分析师的个人感悟
zjbohai的博客
04-16 9192
数据来源:基于BOSS直聘-各单位数据分析师招聘信息整理获得。 数据分析师是由业务和技术的结合而衍生出来的一种岗位,随着社会、企业的信息化、数字化的发展,企业对于既了解业务,又懂技术的综合性人才的需求还是比较大的,越来越多的人向这个方向发展。但从招聘者对于应聘者在该岗位的要求来看,应聘者在业务理解、认知等方面的能力要远高于技术方面的能力。这也就是导致,众多职场人从其他岗位(非对口业务岗、非相关业务技术岗)转型做数据分析师时,虽然是学习了excel、python、sql、powerbi/tableau/ech
数据运营-用户路径分析
rover
07-27 3631
1. 什么是用户路径分析 用户行为分析是数据分析中非常重要的一项内容,在统计活跃用户,分析留存和转化率,改进产品体验、推动用户增长等领域有重要作用。单体洞察、用户分群、行为路径分析是用户行为数据分析的三大利器。 用户路径分析,就是用户在APP或网站中的访问行为路径。用户行为路径分析是互联网行业特有的一类数据分析方法,它主要根据每位用户在App或网站中的点击行为日志,分析用户在App或网站中各个模块的流转规律与特点,挖掘用户的访问或点击模式,进而实现一些特定的业务用途,如App核心模块的到达率提升、特定用户群
网站流量日志分析项目01
Passerby1024的博客
11-08 624
1. 流量分析背景&系统架构 视频 01-背景介绍–网站分析的意义 02-背景介绍–如何进行网站分析–流量分析(质量、多维细分) 03-背景介绍–如何进行网站分析–内容导航分析 04-背景介绍–如何进行网站分析–转化分析(漏斗模型) 05–整体技术流程-数据采集和数据预处理 06–整体技术流程-数据入库(ETL) 07–整体技术流程-数据分析和数据可视化 08–整体技术流程-系统架构图 目...
网站点击流数据分析
大JAVA解决方案
03-25 3262
网站点击流数据分析原创 2017年09月19日 18:22:26标签:数据分析22921. 网站点击流数据分析项目业务背景1.1 什么是点击流数据1.1.1 WEB访问日志即指用户访问网站时的所有访问、浏览、点击行为数据。比如点击了哪一个链接,在哪个网页停留时间最多,采用了哪个搜索项、总体浏览时间等。而所有这些信息都可被保存在网站日志中。通过分析这些数据,可以获知许多对网站运营至关重要的信息。采集...
大数据实时流计算详解
fegus的博客
07-13 2703
我曾任职于华为 2012 实验室高斯部门,负责实时分析型内存数据库 RTANA、华为公有云 RDS 服务的研发工作。目前,我专注于移动反欺诈解决方案的研发。针对公司业务需求,我开发了一个实时流计算系统,并在此基础上完成了风控系统的研发。最终,这个系统被一个独角兽收购。最近这两年,越来越多的业务和数据分析对实时性提出更高的要求,与之对应解决实时计算问题的流计算框架,也开始流行起来。因为工作原因,常有人问我有关实时流计算系统的问题。整体观察下来我发现:很多时候,他们并非不知道这些框架 ,也并非不熟悉这些框架的
src.zip_Spark!_spark_spark 聚类_spark聚类
09-23
在spark上对一个包含电影信息,流派等信息的聚类
Spark Ml 源码分析-LogistRegression.zip_Spark ML_spark_spark ML_spa
09-24
spark ml源码分析,逻辑回归源码分析,仅供参考,错误地方多多指教
Spark学习总结-入门.rar_Spark!_spark_spark入门_大数据 spark
09-24
这是一位大数据分析开发者的一本Spark入门学习用的总结
Spark SQL.zip_spark_spark SQL_spark 大数据_spark大数据_公交数据处理
07-15
spark sql, 通过spark处理公交大数据。
用idea中No compiler is provided in this environment. Perhaps you are runningon a JRE
热门推荐
大曹的博客
03-27 2万+
用idea中终端执行mvn clean install命令,出现No compiler is provided in this environment. Perhaps you are running on a JRE错误 将你的pom.xml 文件修改 <build> <plugins> <plugin> <!--提供打包(将应用打包成可执行的jar包)--> ..
springboot 与mybatis @Mapper 与 @MapperScan 注解一直无效
大曹的博客
07-07 5596
1,注解一直无效,刚开始以为是 pom文件版本不对。 <dependencies> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-web</artifactId> <...
SpringCloud 返回对象为xml 格式 This XML file does not appear to have any style information associated with
大曹的博客
02-21 5448
之前做普通的springboot项目返回的就是json格式,但是cloud 项目返回了这个,之后发现是 我cloud-client 项目引入了eureka-server的依赖当中的jackson-dataformat-xml.jar 起了作用,导致了项目每次都返回xml格式,去掉eureka-server依赖就正常返回了。 ...
悟空CRM 安装
大曹的博客
12-24 3806
悟空CRM安装部署环境及组件安装centos7功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 部署环境及组件 crm开源网址: https://gitee.com/wukongcrm/crm_pro 所需部署文件下载: 链接:ht
spark安装_Spark 安装教程
最新发布
06-08
Spark是一个分布式计算框架,安装需要一定的技术和操作步骤。下面是Spark安装的基本步骤: 1. 安装Java环境 Spark是基于Java开发的,因此需要先安装Java环境。可以从Oracle官网下载Java安装包,根据提示进行安装。...

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • java ?: 的使用 29463
  • mysql中change和modify 的区别 27565
  • 用idea中No compiler is provided in this environment. Perhaps you are runningon a JRE 26960
  • too many connections 解决方法 9310
  • centos所有版本下载 7460

分类专栏

  • 系统 1篇
  • redis 1篇
  • JAVA_WEB 50篇
  • java 26篇
  • mysql 20篇
  • shell 2篇
  • hadoop 16篇
  • linux 9篇
  • python 5篇
  • html 1篇
  • html5 1篇

最新评论

  • mysql中change和modify 的区别

    c_androidRookie: 功能上change可以完全替换modify。

  • mysql中change和modify 的区别

    是谁的心呀2556: 另一条语句 [code=sql] #4.将表employees的birth字段改名为employee_birth ALTER TABLE employees CHANGE birth employee_birth DATETIME; [/code]

  • mysql中change和modify 的区别

    是谁的心呀2556: 这个很有用,涉及到表结构修改的时候,新手总是会把change和modify的使用范围弄混,看到这篇文章后,就记着小改用modify,涉及到改名字用change就行了,保证以后错不了表情包 [code=sql] #3.将表employees的mobile字段修改到officeCode字段后面. ALTER TABLE employees MODIFY mobile VARCHAR(25) AFTER officeCode ; [/code]

  • ESXI6.0的安装

    小鱼halo: 为啥我的esxi前几步需要按f11和f9之类的 都按了没反应 选择不了啊!

  • SpringCloud 返回对象为xml 格式 This XML file does not appear to have any style information associated with

    稳定_g: 感谢

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • OkHttp的使用
  • Windows镜像下载所有地址
  • Could not fetch URL XXXXXX: There was a problem confirm confirming the ssl xxxx
2023年2篇
2022年2篇
2021年9篇
2020年7篇
2019年31篇
2018年77篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司仙桃百度网站优化排名价格柳州设计网站多少钱安康网络推广价格四平关键词排名多少钱商丘网络广告推广哪家好黔东南品牌网站设计报价珠海关键词按天计费公司梧州百姓网标王推广多少钱三亚百搜标王公司泰安至尊标王哪家好武威网站改版多少钱镇江网站制作设计株洲百搜标王公司本溪网站建设设计哪家好荷坳seo推荐唐山百度竞价包年推广公司抚顺设计网站哪家好长治外贸网站建设推荐大同百度网站优化排名报价清远网络营销哪家好四平模板推广木棉湾网站设计报价潮州SEO按天计费公司那曲百度网站优化排名报价永湖网站开发镇江企业网站建设东营网站优化按天收费坂田阿里店铺运营多少钱重庆网络营销推荐重庆营销网站哪家好歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化