人工智能-数据挖掘课程大纲
学习建议: 本进阶是 AI 领域核心模块,建议掌握原理后反复练习框架使用方法,基于框架进行项目实 战,内容并不局限于课程所涉及模块,完全可以自己动手做更多的黑科技出来。预计学习时 长 30 天。
大纲: 一、 2. chrome 浏览器抓包工具介绍。 3. http 协议。 4. urllib 网络请求模块。 5. 实战:使用 urllib 技术实现拉勾网爬虫实战。 6. cookie 技术和 cookiejar 模块。 7. 实战:使用 cookiejar 技术实现模拟登录爬虫实战。 8. ProxyHandler 和 ip 代理。
学习建议: 本进阶是整个系列课程中最为核心也是最重要的模块,建议同学们对于每个算法逐个破,对 于难理解的算法部分需要反复观看与研究,争取把机器学习中每个算法都掌握牢固,对于案 例部分,需要勤加练习,建议大家边学边做好笔记便于以后复习。预计学习时间 40 天。
第四阶段:深度学习
概述: 现阶段,计算机视觉,自然语言处理与语音识别发展迅速,巨头公司都在争相发展 AI 科技, 其中最为核心的技术支撑就是深度学习了,深度学习系列内容从神经网络基础模块开始一步 步延伸至卷积神经网络与递归神经网络,基于深度学习两大核心框架 Tensorflow 与 Caffe 进 行项目实战。 大纲:
大纲: 1. Python 快速入门 2. 科学计算库-Numpy 3. 数据分析处理库 Pandas 4. 可视化库 Matplotlib 5. 可视化库 Seaborn
学习建议: 对于零基础的同学建议实际动手跟着课程做一遍 Python 必备的基础模块,有基础的同学们 可以直接从这些必备库开始入手。预计学习时间 10 天。
机器学习基础篇:
1. 人工智能入门指南 2. 线性回归算法 3. 梯度下降原理 4. 逻辑回归算法 5. 案例实战:Python 实现逻辑回归 6. 案例实战:对比不同梯度下降策略 7. 案例实战:Python 分析科比生涯数据 8. 案例实战:信用卡欺诈检测 9. 决策树构造原理 10. 案例实战:决策树构造实例 11. 随机森林与集成算法 12. 贝叶斯算法推导 13. 案例实战:新闻分类任务 14. Kmeans 聚类及其可视化展示 15. DBSCAN 聚类及其可视化展示 16. 案例实战:聚类实践 17. 降维算法:线性判别分析 18. 案例实战:Python 实现线性判别分析 19. 降维算法:PCA 主成分分析 20. 案例实战:Python 实现 PCA 算法
15. 语言模型 16. 自然语言处理-word2vec 17. 案例实战:Gensim 词向量模型 18. 案例实战:word2vec 分类任务 19. 探索性数据分析:赛事数据集 20. 探索性数据分析:农粮组织数据集
数据挖掘实战篇:
1. 泰坦尼克号获救预测 2. 搜索关键词用户画像 3. 京东用户购买意向预测 4. Kaggle 数据科学研究分析 5. Benchmark 与论文的作用
13 强化学习必备原理 14 对抗生成网络架构 15 Seq2Seq 网络模型
深度学习项目实战: 1. 人脸检测 2. 人脸关键点定位 3. 对抗生成网络实战 Mnist 数据集 4. LSTM 情感分析实战 5. 基于 Tensorflow 的文本分类任务 6. DQN 让 AI 自己玩游戏 7. 机器人写唐诗 8. Seq2Seq 序列模型实战 9. 验证码识别实战 10. 风格转换 Style-transfer
机器学习进阶篇:
1. EM 算法原理推导 2. 案例实战:GMM 聚类 3. 推荐系统 4. 案例实战:Python 实战推荐系统 5. 支持向量机原理推导 6. 案例实战:SVM 实例 7. 时间序列 ARIMA 模型 8. 案例实战:时间序列预测任务 9. Xgbooost 提升算法 10. 案例实战:Xgboost 调参实战 11. 计算机视觉挑战 12. 神经网络必备基础 13. 神经网络整体架构 14. 案例实战:CIFAR 图像分类任务
学习建议: 建议学习过程中,每看一个视频就自己动手实践。把这个视频的知识点学会后再继续下一个 知识点。课程内容多而且有深度,切不可为了追求速度而忽略了对知识点的理解。预计学习 20 天。
第三阶段:机器学习
概述:
无论是数据挖掘领域还是人工智能领域最核心的模块就是机器学习了,本阶段从机器学习最 基本的算法开始逐渐过渡到进阶内容,对于复杂的机器学习算法首先给出通俗解释并对原理 进行详细推导解析,最后阐述其应用领域与价值,对于每一个机器学习算法配套案例实战, 基于真实数据集从数据预处理开始一步步演示整个建模过程。
第二阶段:Python 网络爬虫
概述: 在人工智能来临的今天,数据显得格外重要。在互联网的浩瀚大海洋中,隐藏着无穷的数据 和信息。因此学会网络爬虫是在今天立足的一项必备技能。本路线专门针对想要从事 Python 网络爬虫的同学而准备的,并且是严格按照企业的标准定制的学习路线。路线从最基本的 Python 基础开始讲起,到如何借助代码发起网络请求以及将请求回来的数据解析,到后面 的分布式爬虫,让你能够系统的学习到一个专业的网络爬虫工程师所具备的所有技能。课程 讲解通俗易懂,实战案例丰富,技术栈贴近企业需求。学完后可无缝转移到企业开发中
二、爬虫进阶: 1. 多线程与 threading 模块。 2. 实战:使用多线程技术实现快速下载图片爬虫实战。 3. ajax 异步获取技术介绍。 4. Selenium+PhantomJS 获取 ajax 异步加载的数据。 5. 实战:使用 Selenium+PhantomJS 技术实现简书爬虫实战。 6. 图形验证码自动识别技术。 7. 实战:使用图形验证码自动识别技术模拟登录知乎网站。
深度学习必备原理与实战:
1.神经网络必备基础知识点 2. 神经网络整体架构 3. 神经网络实现 CIFAR 图像分类任务 4. 卷积神经网络必备基础 5. 经典网络架构分析 6. 网络设计技巧与数据增强 7. 递归神经网络原理 8. LSTM 网络架构 9. 使用卷积神经网络再战 CIFAR 分类任务 10. 深度学习框架 Caffe 实战演示 11. 深度学习框架 Tensorflow 实战演示 12. Tensorflow 实战手写字体分类任务
9. requests 网络请求库。 10. xpath 语法和 lxml 解析。 11. 实战:使用 xpath 技术实现电影天堂爬虫实战。 12. BeautifulSoup 解析库。 13. 实战:使用 BeautifulSoup 实现中国天气网爬虫实战。 14. 正则表达式和 re 模块。 15. 实战:使用正则表达式实现中国古诗文网爬虫实战。 16. json 文件处理。 17. csv 文件处理。 18. excel 文件处理。
数据挖掘/人工智能工程师体系课程大纲
第一阶段:Python 必备基础与数据科学库
概述: 整个系列课程以 Python 为主导,第一阶段的目标在于快速掌握 Python 语言。全程代码实战, 使用 notebook 一步步分模块演示 Python 必备基础功能。详细介绍与演 Python 数据科学必 备四大库为后续机器学习与数据挖掘打下基础,全程通俗解读,代码实战!
三、Scrapy 框架: 1. Scrapy 框架介绍。 2. Scrapy Shell 介绍。 3. Spider 爬虫。 4. CrawlSpider 爬虫。 5. Item Pipeline。 6. Request 和 Response 对象。 7. 随机请求头和 ip 代理池。 8. 实战:使用 Scrapy 技术实现知名新闻网爬虫实战。 9. 实战:使用 Scrapy 技术实现知名问答平台爬虫实战。 10. Redis 键值对数据库详解。 11. Scrapy-redis 分布式组件介绍。 12. 实战:使用 Scrapy-redis 技术实现知名房源网爬虫实战。 13. 部署 Scrapy 爬虫。