收藏本站QQ群453308561 本站已运行
查看: 700|回复: 11
收起左侧

大数据-基于Spark的机器学习-智能客户系统项目实战

[复制链接]

654

主题

656

帖子

2537

积分

超级版主

Rank: 8Rank: 8

发表于 2020-10-11 14:53:34 | 显示全部楼层 |阅读模式

本站2012年运营至今,升级为VIP会员,下载本站90000G+最新原版/高清/无加密VIP会员资源

想获取本资料?请点击:http://xue.itjishu.cn/thread-2235-1-1.html

大数据-基于Spark的机器学习-智能客户系统项目实战
项目背景:
1、现在很多平台客户关系管理系统都是使用传统的CRM,所有的信息全靠手工录入,用户寻找上下游企业或者信息只能靠手工去查找并且标注。

2、大数据时代的到来,人工智能,云计算,先进的分析,用机器去替代人工的部分,从 2016 年趋势看,机器学习和人工智能 (AI) 将在未来几年内将会彻底改变 CRM。

因此我们对CRM进行了改造,主要有如下部分:
1、企业信息、商品信息来自互联网,机器学习去自动统计分析并且分类。
2、用户录入的商品信息和新从互联网爬来的商品信息全部通过机器学习计算的模型去分类。
3、机器学习自动计算企业和供求信息上下游。
4、机器学习每隔一段时间自动去优化计算模型。

根据图识,项目将分为三个部分。整个项目基本思路是如何通过爬虫爬取大量数据放到Hbase,然后通过ETL工具初步转化筛选将数据存到mongodb,抽取mongodb的数据进行清洗处理算出模型放到hdfs。后续进来数据通过模型运算出数据的类型。项目系统主要包括前端+后端+机器学习,前端采用React Native,Native,后端采用Dubbo+Spring+java,机器学习采用Spark进行实现,本项目机器学习-spark代码运行在mesos上。

本课程我们只针对以上图示的浅蓝色部分内容(即与机器学习相关的内容),通过用真实的智能客户项目系统作为案例(案例附带源码,可以直接做二次开发),主要根据项目实例穿讲机器学习以及相关知识,包括有:数据提取,数据清洗以及分词,数据特征值提取、机器学习模型计算、数据分类等等,进行详细讲解。

本课程所需掌握的技术:java、scala、IK、Hdfs、Spark ml、Spark Streaming、Spark SQL、Kafka、Zookeeper、Mongodb、Spring-Data-Mongodb,由于每个技术需要掌握的程度不一样,对于我们用到的一些开源技术,课程中将会是简单介绍如何使用,不会着重讲解。课程重点讲解spark ml、spark Streaming,以及如何使用这些技术进行项目的实战,贯穿项目系统并且最后串联所有技术。spark基于2.0.1版本讲解

课程大纲
第1章 第一章
 第1讲 项目介绍以及在本课程中能学到什么东西、如何应用到实际项目中 免费 00:09:43
 第2讲 scala和IDE的安装以及使用以及maven插件的安装 免费 00:07:04
 第3讲 Centos环境准备(java环境、hosts配置、防火墙关闭) 免费 00:06:24
 第4讲 scala基础知识讲解-1 免费 00:08:51
 第5讲 scala基础知识讲解-函数和闭包-2 免费 00:30:07
 第6讲 scala基础知识讲解-数组和集合-3.1 免费 00:48:33
 第7讲 scala基础知识讲解-数组和集合-3.2 免费 00:14:16
 第8讲 scala基础知识讲解-类和对象-4 00:23:06
 第9讲 scala基础知识讲解-特征和模式匹配-5 00:13:46
 第10讲 scala基础知识讲解-正则表达式和异常处理-6 00:12:41
 第11讲 scala基础知识讲解-知识回顾 00:15:58
 第12讲 nosql数据库mongodb安装 00:04:57
 第13讲 spring data for mongodb-简单连接mongodb 00:07:52
 第14讲 spring data for mongodb-spring配置+CRUD操作(不实现repo,默认操作) 00:36:20
 第15讲 spring data for mongodb-实现repo接口+mongoTemplate+CRUD操作 00:36:17
 第16讲 spring data for mongodb-分页查询 00:13:32
 第17讲 zookeeper集群安装 00:13:41
 第18讲 zookeeper基本介绍-1 00:22:36
 第19讲 zookeeper工作原理-选举流程(basic paxos算法)-2 00:24:27
 第20讲 zookeeper工作原理-选举流程(fast paxos算法)-3 00:31:16
 第21讲 kafka-背景及架构介绍 00:12:28
 第22讲 kafka集群安装以及测试 00:14:29
 第23讲 kafka数据发送与接收实现-java 00:31:28
 第24讲 hdfs单机安装部署 00:18:51
 第25讲 连接hdfs查询存储-java 00:35:45
 第26讲 机器学习基本线性代数介绍 00:05:08
 第27讲 IKAnalyzer中文分词工具介绍 00:17:54
 第28讲 IKAnalyzer中文分词工具结合java应用 00:16:29
 第29讲 Spark以及生态圈介绍 00:11:45
 第30讲 Spark运行架构介绍及原理之job,stage,task 00:26:19
 第31讲 Spark编程模型RDD设计以及运行原理 00:15:48
 第32讲 纯手写第一个Spark应用程序:WordCount 00:23:57
 第33讲 RDD常用函数介绍 00:29:22
 第34讲 Spark Sql介绍、DataFrame创建以及使用、RDD DataFrame DataSet相互转化 00:12:54
 第35讲 Spark Streaming介绍 00:12:56
 第36讲 Spark Streaming+Kafka集成操作 00:18:44
 第37讲 avro结合maven使用,实现序列化和反序列化 00:21:07
 第38讲 Spark ML(机器学习)介绍(监督学习、半监督学习、无监督学习) 免费 00:13:59
 第39讲 特征抽取:TF-IDF原理介绍 免费 00:17:49
 第40讲 特征提取:TF-IDF代码实现计算 免费 00:26:37
 第41讲 聚类算法:KMEANS原理介绍 00:20:55
 第42讲 聚类算法:KMEANS代码实现计算 00:20:03
 第43讲 其它Spark ML算法简单介绍 00:03:48
 第44讲 Spark连接Mongodb代码实现 00:13:08
 第45讲 Mesos总体架构介绍 00:08:25
 第46讲 Mesos安装部署 00:12:04
 第47讲 Spark on Mesos安装部署 00:11:12
 第48讲 系统整体架构再次介绍+技术串联介绍(将学习的技术全部整合到项目中) 00:03:57
 第49讲 项目代码:父类工程,管理各个jar的版本 00:03:47
 第50讲 项目代码:avro序列化jar,用于客户端和机器学学习实现序列化和反序列化 00:04:46
 第51讲 项目代码:kafka发送数据jar,给app调用并实现切词并发送数据到kafka 00:06:23
 第52讲 项目代码:工具类jar,实现操作hdfs、切词以及操作mongodb 00:03:28
 第53讲 项目代码:操作类jar,调用工具类具体进行切词以及数据清洗并且存储到Hdfs 00:05:34
 第54讲 项目代码:机器学习集合jar,主要用来存放record 00:02:56
 第55讲 项目代码:机器学习算法jar,主要进行tf-idf以及kmeans计算,主要实现企业上下游、供求上下游模型计算 00:07:11
 第56讲 项目代码:流式计算jar,主要是接受客户端发送到kafka的数据加载模型进行计算 00:04:35
 第57讲 项目代码:测试模拟jar,主要模拟实现用户加载avro序列化jar写数据到kafka 00:01:51
 第58讲 Spark on Mesos部署提交参数介绍 00:08:17
 第59讲 Spark代码提交到Mesos运行(Spark-submit) 00:07:13
 第60讲 项目整体流程跑通,结果展示 00:06:54
 第61讲 Spark调优介绍 00:08:01
 第62讲 基于Spark的机器学习项目-智能客户系统实战课程总结 00:04:12
 第63讲 实际工作及面试注意问题 00:03:45

下载地址:

游客,如果您要查看本帖隐藏内容请回复

cWfjWq.jpg

2

主题

608

帖子

1745

积分

全站永久VIP会员

Rank: 5Rank: 5

发表于 2021-2-28 14:40:54 | 显示全部楼层

本站2012年运营至今,升级为VIP会员,下载本站90000G+最新原版/高清/无加密VIP会员资源

想获取本资料?请点击:http://xue.itjishu.cn/thread-2235-1-1.html

这个绝对牛
cWfjWq.jpg

0

主题

12

帖子

17

积分

全站永久VIP会员

Rank: 5Rank: 5

发表于 2020-10-12 00:03:41 | 显示全部楼层

本站2012年运营至今,升级为VIP会员,下载本站90000G+最新原版/高清/无加密VIP会员资源

想获取本资料?请点击:http://xue.itjishu.cn/thread-2235-1-1.html

最好的IT论坛
cWfjWq.jpg

0

主题

8

帖子

13

积分

普通会员

Rank: 1

发表于 2020-10-12 02:32:09 | 显示全部楼层

本站2012年运营至今,升级为VIP会员,下载本站90000G+最新原版/高清/无加密VIP会员资源

想获取本资料?请点击:http://xue.itjishu.cn/thread-2235-1-1.html

好好学习,天天向上
cWfjWq.jpg

0

主题

8

帖子

13

积分

普通会员

Rank: 1

发表于 2020-10-22 05:14:37 | 显示全部楼层

本站2012年运营至今,升级为VIP会员,下载本站90000G+最新原版/高清/无加密VIP会员资源

想获取本资料?请点击:http://xue.itjishu.cn/thread-2235-1-1.html

还是蛮不错的
cWfjWq.jpg

0

主题

3890

帖子

4922

积分

全站永久VIP会员

Rank: 5Rank: 5

发表于 2020-10-24 03:17:42 | 显示全部楼层
python视频教程
cWfjWq.jpg

0

主题

474

帖子

711

积分

普通会员

Rank: 1

发表于 2020-10-24 11:06:41 | 显示全部楼层
好资料
cWfjWq.jpg

0

主题

474

帖子

711

积分

普通会员

Rank: 1

发表于 2020-10-31 12:55:09 | 显示全部楼层
啦啦啦啦
cWfjWq.jpg

0

主题

7

帖子

21

积分

普通会员

Rank: 1

发表于 2021-4-8 09:37:21 | 显示全部楼层
学IT技术的好地方啊
cWfjWq.jpg

23

主题

511

帖子

866

积分

超级版主

Rank: 8Rank: 8

发表于 2021-4-8 11:42:12 | 显示全部楼层
php培训
cWfjWq.jpg
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则