admin 发表于 2018-6-2 19:42:30

7月在线数据挖掘课程

6月数据挖掘课程7月在线2016年

数据挖掘班大纲讨论稿(由浅入深、从基础入门到海量数据挖掘/处理,稳步推进)
1、数据挖掘基础入门:数据科学与数学基础知识6 sf2 i% g9 i4 c% Z% y3 J
内容:数据挖掘基础,微积分、概率论、线性代数基础
实践:用numpy进行矩阵运算

2、数据处理/分析与可视化
内容:数据获取、数据格式、数据内容处理与分析、数据的可视化
实践:用python解析和清洗数据,pandas统计与分析数据,matplotlib和seaborn等做可视化r1 V% D$ |; G0 c" B
) r! r& {2 h7 m1 J) `
3、海量数据的分布式处理+ J. K' I8 _$ K1 s) L( D1 EF
内容:hadoop,Spark介绍,Map Reduce数据处理,hive与常见数据统计分析
实践:map reduce计数,文件关联与特征mapping,hiveql统计示例
9 k. x( @+ y: y
4、数据上的关联规则
内容:数据关联分析,海量数据的关联分析方案,A-Priori与PCY算法" ^m6 _# J. }% n5 N- I
实践:小型商业服务中的在线认证企业资料挖掘,人群背景与身份关联挖掘
* B7 Q4 U, S# H' P8 _! V
5、数据与聚类
内容:聚类与社区发现算法,深度剖析Kmeans等算法
实践:Spark MLlib下的K-Means算法与GraphX下的Label-Propagation算法实践
1 _! f3 M) b3 m
6、海量数据索引与近似最近邻9 r+ s5 s& l# C
内容:海量数据检索问题,近似最近邻(ANN)常用算法:LSH、KD-Tree、Kmeans-Tree7 W4 x/ C& p7 B$ v' g+ @( {5 t
实践:海量图像数据与最近图片检索
! `/ \2 L* J# E6 j" J2 w& h
7、数据分类与排序
内容:有监督学习与分类,LR、SVM、深度神经网络与分类排序问题,样本高效训练
实践:kaggle分类问题、海量数据下电商的CTR预估问题

8、海量数据与推荐系统
内容:基于内容的推荐算法,协同过滤,隐因子模型
实践:基于用户/商品的协同过滤推荐,隐因子模型电影推荐+ v( }# R+ V" w8 y$ @4 V
3 g3 \! y% X- oS- u7 M
9、海量高维数据与维度约减
内容:数据降维与SVD,CUR分解
实践:SVD与PCA在推荐系统与数据压缩应用0 s' b; M* k4 S) U" a% n
" K! V/ U, `# `3 N! t
10、海量网页搜索与PageRank- |# U9 @* d5 R- |; m1 l7 O3 a* q
内容:海量数据构成的图关联分析,PageRank与网页搜索9 m1 L3 k) M0 A. r7 s+ l$ A
实践:PageRank在图关联数据上的应用与排序



7736 发表于 2018-6-2 19:47:24

路过 帮顶 嘿嘿

qiuqiu1933 发表于 2018-6-3 23:14:15

报告!别开枪,我就是路过来看看的。。。

tvufn 发表于 2018-6-5 18:26:07

顶起出售广告位

Vince 发表于 2018-6-5 18:51:51

前排支持下

曹露露 发表于 2018-6-7 09:50:49

没人回帖。。。我来个吧

260874853 发表于 2018-6-7 18:52:41

1v1飘过

xiejiaxin 发表于 2018-6-8 16:40:43

嘘,低调。

q445624451 发表于 2018-6-8 23:01:58

占位编辑

ert 发表于 2018-6-9 16:11:33

站位支持
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: 7月在线数据挖掘课程