Spark数据机器学习班视频课程

20191112164006186.jpg

第一阶段 Spark基础入门

第1课 Spark系统概述与编程接口

知识点1:Spark系统概述

知识点2:Spark RDD分区及依赖关系

知识点3:RDD API-transformation、action

实战项目:PageRank中的依赖关系

第2课 Spark运行模式及原理

知识点1:Spark运行模式

知识点2:Spark基本工作流程

知识点3:Spark Shuffle讲解

实战项目:YARN cluster模式—部署、运行、内部实现及其原理

第二阶段 Spark进阶:存储、调度、性能调优

第3课 Spark存储、调度、与监控分析

知识点1:存储管理模块整体架构

知识点2:RDD持久化

知识点3:Shuffle数据持久化

知识点4:广播(Broadcast)变量持久化

知识点5:Spark调度相关流程

实战项目:Spark监控管理

第4课 Spark性能调优

知识点1:开发调优

知识点2:资源调优

知识点3:数据倾斜调优

实战项目:shuffle调优

第三阶段 Spark深入:即时查询、流计算与图计算

第5课 Spark即时查询讲解

知识点1:SQLContext 及DataFrame的介绍

知识点2:常用的查询操作

知识点3:流计算系统的对比

知识点4:Spark streaming的介绍与数据处理流程

知识点5:流数据源的接入

知识点6:transformation与window操作

实战项目:SQL优化配置、及流计算项目的部署与调优

第6课 Spark图计算讲解

知识点1:属性图的介绍

知识点2:edge、vertex、triplet介绍与创建

知识点3:属性图的操作

知识点4:图算法介绍

实战项目:图的调优

第四阶段 Spark机器学习实战

第7课 Spark机器学习讲解

知识点1:Mllib 机器学习库介绍

知识点2:基本的统计分析功能

知识点3:基本的机器学习库使用介绍

知识点4:模型的评价标准库使用介绍

实战项目:使用逻辑回归完成KDD99的分类问题

第8课 Spark机器学习应用

实战项目:使用Mllib的树模型完成分类问题

实战项目:使用Mllib搭建推荐系统本帖隐藏的内容链接:

资源下载此资源下载价格为6学分,请先
充值比例 1元=1学分
资源失效,请咨询客服
客服QQ 980264305
资源下载
下载价格:6 学分
VIP优惠:免费
充值比例 1元=1学分
资源失效,请咨询客服
客服QQ 980264305

评论0

  • 昵称
  • 邮箱
  • 网址
找资源,搜一下,更惊喜
没有账号? 注册忘记密码?