数据挖掘从零基础到精通(SPSS MODELER、EXCEL、ORACLE)视频教程
如今我们已从IT时代进入到DT时代,数据被称为新一代石油能源。无论是国家还是企业随着多年的信息化发展都积累了大量的数据,但是当前这些海量的数据并未完全发挥它们的价值。过去人们往往是基于收集到的历史数据做一些简单的展示或分析,但是随着竞争的白热化,发挥出数据自身的价值显得越来越重要。因此,数据挖掘技术和数据挖掘算法越来越受到企业的追捧。
讲师本人多年来一直从事数据挖掘相关方面的工作,参与过电信、金融、零售业、制造业、政府等方面的数据挖掘项目。切身地感受到数据挖掘对于各个行业都具有很高的价值,比如数据挖掘可以提前发现将要流失的客户、获取量化投资方向、规划某个地区的零售分店布局、实现生产过程自动化生产、优化流程提高办事效率等。数据挖掘作用巨大,但是它横跨多个学科,容易让人不知从哪个方向入手。本课程就是要解决这个问题,从大家日常熟悉的excel出发,由易到难分步对数据挖掘技术里面的主流算法进行了依次实现。此后又使用数据挖掘专用工具SPSS MODELER以案例的方式对这些主流算法进行了讲解。
1.课程研发环境
建模工具:IBM SPSS MODELER 14.1;
数据库工具:ORACLE 11G
其他工具:MICROSOFT EXCEL、PL/SQL等除EXCLE外都会提供与项目匹配的安装程序,并且是破解版
2.内容简介
本教程介绍了数据挖掘技术基本的概念、功能、使用人员所需能力、使用方式以及数据挖掘部分主流算法实现方式。课程中嵌入了oracle数据库和办公软件excel,这两款软件主要用于存储及处理数据挖掘所需的数据,其中还使用excel作为简单入门工具对数据挖掘进行了算法实现,该部分主要用于帮助大家对数据挖掘相关知识有一个全面和大概的了解。在此基础上,后期使用数据挖掘专业工具SPSS MODELER结合一些案例对之前的excle实现的挖掘算法部分进行了深入学习以及增加了一些SPSS MODELER自带的算法模块讲解。
课程主要讲解了数据挖掘知识和技术,同时其中还涉及了部分oracle数据库知识、sql语句和excel的函数运用。
阿贝:本名黄雨,5年数据挖掘项目工作经历,3年机器学习工作经历,获得PMP认证。参与过多个行业的数据挖掘项目,熟练使用SPSS Modeler挖掘工具;对机器学习及数学算法模型也有一定实现经验,开发过协同过滤模型;为移动公司开发过企业级数据仓库,熟悉oracle体系架构,了解hadoop架构及mapreduce原理,对spark也有一定了解。
一、数据挖掘基础内容讲解:
第一讲:数据挖掘初探
第二讲:数据挖掘功能介绍
第三讲:Excel基础知识
第四讲:Excel应用示范
第五讲:Oracle数据库安装
第六讲:数据库应用示范1
第七讲:数据库应用示范2
第八讲:数据获取及存储
第九讲:数据预处理-相关知识介绍
第十讲:数据预处理-excel部分
第十一讲:数据预处理-oracle部分
第十二讲:预测算法-线性回归1
第十三讲:预测算法-线性回归2
第十四讲:分类算法-ID3决策树介绍
第十五讲:分类算法-决策树建模处理
第十六讲:分类算法-excel建模实现
第十七讲:关联算法-Apriori算法介绍
第十八讲:关联算法-oracle数据处理
第十九讲:关联算法-excel数据处理
第二十讲:关联算法-excel建模实现
第二十一讲:聚类算法-kmeans算法介绍
第二十二讲:聚类算法-excel建模实现
第二十三讲:最优化求解1
第二十四讲:最优化求解2
二、SPSS MODELER数据挖掘:
第二十五讲:SPSS Modeler下载及安装
第二十六讲:SPSS Modeler数据获取及记录处理
第二十七讲:SPSS Modeler结果输出
第二十八讲:SPSS Modeler数据字段处理
第二十九讲:SPSS Modeler数据探索及分析1
第三十讲:SPSS Modeler数据探索及分析2
第三十一讲:SPSS Modeler图形探索及分析1
第三十二讲:SPSS Modeler图形探索及分析2
第三十三讲:SPSS Modeler回归分析内容补充
第三十四讲:SPSS Modeler回归分析建模(预测)
第三十五讲:SPSS Modeler逻辑分析建模(分类)
第三十六讲:RFM介绍
第三十七讲:RFM建模
第三十八讲:RFM模型应用
第三十九讲:SPSS Modeler分类-商业理解
第四十讲:SPSS Modeler分类-数据理解
第四十一讲:SPSS Modeler分类-数据准备
第四十二讲:SPSS Modeler分类-决策树算法补充
第四十三讲:SPSS Modeler分类-决策树建模
第四十四讲:SPSS Modeler分类-神经网络
第四十五讲:SPSS Modeler分类-模型评估
第四十六讲:SPSS Modeler关联分析-Apriori算法补充
第四十七讲:SPSS Modeler关联分析-Apriori建模
第四十八讲:SPSS Modeler关联分析-序列
第四十九讲:SPSS Modeler聚类分析-KMeans
第五十讲:SPSS Modeler聚类分析-TwoStep1
第五十一讲:SPSS Modeler聚类分析- TwoStep2
目标一、熟悉数据挖掘的基本知识
目标二、使用Excel或Oracle保存数据和处理数据
目标三、熟悉数据挖掘中的主流算法
目标四、使用Excel执行一些简单的挖掘任务
目标五、使用SPSS MODELER挖掘工具支撑相应业务
目标六、为数据挖掘算法研究提供基础知识
亮点一、在学习数据挖掘的同时对于一般的数据库操作进行了讲解.
亮点二、课程以常见的Excel工具开始,由易到难的方式讲解数据挖掘算法,对一些算法首先采用了Excel分步实现的方式进行,在大家有一定了解后,后期又使用SPSS MODELER对算法进行了内容补充及实现.
亮点三、SPSS MODELER以案例与数据挖掘标准流程结合的方式进行,使大家可以快速使用. MODELER解决工作中的具体业务
亮点四、整个课程虽项目不大,但整个项目基本上涉及到数据挖掘自身功能的方方面面
1.课程针对人群
本课程适用于数据挖掘初级人员和中级人员,尤其是对于希望通过SPSS MODELER开展业务的人员和希望弄清楚数据挖掘中各类算法具体实现原理的人员。
2.我该怎么学,如何才能学好这门课程,给些建议。
2.1、时间上的安排建议
本课程共51讲,如果您时间上充分,建议以每天3-4讲的进度往前学习。
2.2、学习要求
如果您没有基础,建议还是中规中矩的按照课程进度一点一点仔细观看学习,并一定要把看完的视频中的方式自己实现一遍,以加深理解和记忆
如果您有基础,可不必按步就搬进行,可以选择您感兴趣的部分去学习,但一定要注意实践,并学会举一反三
2.3、讲师建议
1.最好看完视频之后,抛开视频,独立自己去把上课中的示例实现一遍,看自己是否理解,如果不正确,可以回过头看再看下视频,如此反复,达到真正理解和熟练掌握的目的。
2.对于实战部分,一定要自己亲自动手做一遍,不要满足听完就OK了
3. 建议一边听视频,一边拿个纸和笔,做一些记录和笔记,这是一种非常好的学习习惯。
4. 一定不要过于依赖视频,要学会思考,学会举一反三
5. 最后祝您学有所成
课程是属于某个特定的专业技术,掌握该技术后,你可以从事以下职位的相关工作
1.数据分析师
2.数据挖掘工程师
3.算法工程师(算法方面还需进一步加强)