Python数据分析系列视频课程--玩转文本挖掘【51CTO】-百度云盘下载
适合人群:
希望能够成为Python编程和数据分析的跨界人才,目前尚未成功,但仍然在不断努力的人。
你将会学到:
从基本的分词、词袋模型、分布式表示等概念开始,多面深入学习文本挖掘技术的各个方面。
课程简介:
请至PC端网页下载本课程代码课件及数据。
文本挖掘(TM),又称自然语言处理(NLP),是AI时代炙手可热的数据分析挖掘前沿领域,其所涉及的人机对话系统,推荐算法,文本分类等技术在BAT等企业中都得到广泛应用。
本课程将使用经典武侠小说、大众点评抓取结果、微博语料数据等多个实际案例进行教学。
本次课程将会从基本的分词、词袋模型、分布式表示等概念开始,多面介绍文本挖掘技术的各个方面,特别会针对目前最热的word2vec,gensim 等结合实际案例进行学习,帮助学员直接升级至业界技术前沿。
学习完本课程后,学员将能够独立使用Python环境完成中文文本挖掘的各种工作。
资源目录
——/计算机教程BTDLG/17-51CTO/120-Python数据分析系列视频课程--玩转文本挖掘/ ├──Python数据分析系列视频课程--玩转文本挖掘 | ├──TM10-01.pdf 684.72kb | ├──TM11-01.pdf 339.54kb | ├──TM12n-01.pdf 783.83kb | ├──TM2-01.pdf 876.99kb | ├──TM3-01.pdf 1.07M | ├──TM4-01.pdf 1.23M | ├──TM5-01.pdf 767.66kb | ├──TM6-01.pdf 721.23kb | ├──TM7-01.pdf 829.94kb | ├──TM8-01.pdf 961.02kb | ├──TM9-01.pdf 635.82kb | ├──TMData1801101-01.zip 7.19M | ├──TMData190320-01.zip 7.27M | ├──TM浣滀笟10-01.pdf 122.79kb | ├──TM浣滀笟11-01.pdf 113.64kb | ├──TM浣滀笟12-01.pdf 136.56kb | ├──TM浣滀笟5-01.pdf 109.51kb | ├──TM浣滀笟6-01.pdf 125.58kb | ├──TM浣滀笟7-01.pdf 122.44kb | ├──TM浣滀笟8-01.pdf 117.65kb | ├──TM浣滀笟9-01.pdf 117.64kb | ├──浣滀笟2-01.pdf 116.40kb | ├──浣滀笟3-01.pdf 114.65kb | └──浣滀笟4-01.pdf 117.18kb ├──1-1 什么是文本挖掘.mp4 32.39M ├──1-2 文本挖掘的基本流程和任务.mp4 24.26M ├──1-3 文本挖掘的基本思路.mp4 21.74M ├──1-4 语料数据化时需要考虑的工作.mp4 26.11M ├──10-1 情感分析概述.mp4 66.84M ├──10-2 情感分析的词袋模型实现.mp4 35.64M ├──10-3 情感分析的分布式表达实现.mp4 47.16M ├──11-1 自动摘要的基本原理.mp4 24.56M ├──11-2 自动摘要的效果评价.mp4 18.19M ├──11-3 自动摘要的python实现.mp4 38.16M ├──12-1 RNN的基本原理.mp4 23.30M ├──12-2 LSTM的基本原理.mp4 22.81M ├──12-3 Keras+TensorFlow组合的优势.mp4 9.88M ├──12-4 Keras+TensorFlow组合的安装.mp4 9.35M ├──12-5 案例1:数据准备.mp4 36.45M ├──12-6 案例1:模型拟合.mp4 31.85M ├──12-7 案例2:数据准备.mp4 37.53M ├──12-8 案例2:模型拟合.mp4 26.76M ├──2-1 Python常用IDE简介.mp4 32.15M ├──2-2 Anaconda的安装与配置.mp4 31.21M ├──2-3 Jupyter Notebook的基本操作.mp4 25.51M ├──2-4 NLTK的安装与配置.mp4 30.69M ├──2-5 什么是语料库.mp4 60.50M ├──2-6 准备《射雕》语料库.mp4 59.96M ├──3-1 分词原理简介.mp4 32.60M ├──3-2 结巴分词的基本用法.mp4 33.28M ├──3-3 使用自定义词典和搜狗细胞词库.mp4 45.46M ├──3-4 去除停用词.mp4 52.25M ├──3-5 词性标注及其他.mp4 30.82M ├──4-1 词频统计.mp4 38.46M ├──4-2 词云概述.mp4 22.00M ├──4-3 wordcloud包的安装.mp4 37.31M ├──4-4 绘制词云.mp4 66.21M ├──4-5 设置词云背景模板.mp4 45.61M ├──4-6 修改词云颜色.mp4 53.05M ├──5-1 词袋模型.mp4 33.47M ├──5-2 词袋模型的gensim实现.mp4 56.38M ├──5-3 用Pandas生成文档词条矩阵.mp4 56.58M ├──5-4 用sklearns生成文档-词条矩阵.mp4 57.52M ├──5-5 从词袋模型到N-gram模型.mp4 27.33M ├──5-6 文本信息的分布式表示.mp4 29.78M ├──5-7 共现矩阵.mp4 23.38M ├──5-8 NNLM模型的突破.mp4 23.37M ├──5-9 word2vec一出,满座皆惊.mp4 53.30M ├──6-1 关键词提取的基本思路.mp4 24.67M ├──6-2 TF-IDF 算法.mp4 25.96M ├──6-3 TF-IDF算法的jieba实现.mp4 52.75M ├──6-4 TF-IDF算法的sklearn实现.mp4 27.91M ├──6-5 TF-IDF算法的gensim实现.mp4 27.38M ├──6-6 TextRank算法.mp4 41.64M ├──7-1 主题模型概述.mp4 48.98M ├──7-2 主题模型的sklearn实现.mp4 76.04M ├──7-3 主题模型的gensim实现.mp4 95.95M ├──8-1 基本概念.mp4 29.22M ├──8-2 词条相似度:word2vec训练.mp4 47.75M ├──8-3 词条相似度:word2vec应用.mp4 42.71M ├──8-4 文档相似度的词袋模型实现.mp4 42.60M ├──8-5 doc2vec.mp4 48.04M ├──8-6 文档聚类.mp4 41.86M ├──9-1 文本分类概述.mp4 40.29M ├──9-2 朴素贝叶斯算法.mp4 31.99M ├──9-3 算法的sklearn实现.mp4 49.09M └──9-4 算法的NLTK实现.mp4 33.69M
评论0