-
Python数据可视化(一) matplotlib,seaborn,pandas绘制折线图和饼图
发布时间:2020-01-06 16:571.绘制饼图# coding=utf-8 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd plt.
-
Python数据分析基础(十) Numpy数组操作
发布时间:2020-01-03 20:31本节介绍有关Python数值运算的numpy模块,进而为后面章节的统计运算和机器学习打下基础,具体内容有: 数组的创建与操作; 数组的基本数学运算; 常用数学和统计函数; 线性代数的求解; 伪随机数的
-
Python数据分析小案例——红楼梦文本分析(三) KMeans聚类
发布时间:2019-12-23 10:25文本聚类分析:使用红楼梦每章分词的结果对红楼梦的章节进行聚类分析,也就是将章节分成几类,内容主题相似的章节分成一类。聚类分析使用的数据是文本的TF-IDF矩阵。TF-IDF是词频逆文档频率,即如果某个
-
Python数据分析小案例——红楼梦文本分析(二) 文本分词
发布时间:2019-12-23 10:09本文续上一篇文章,对红楼梦文本进行全文分词和每一章节分词,对分词进行统计以及根据分词频率绘制全文的词云图和每一章节的词云图 废话不多说,我们直接上代码 这里说明一下,
-
Python数据分析小案例——红楼梦文本分析(一) 文本预处理
发布时间:2019-12-20 15:59本文开始介绍一个简单的数据分析案例,分析红楼梦文本,本文主要内容是将红楼梦文本按照章节获取每一回的标题,字数,段落数并保存到csv中方便后续数据分析 红楼梦小说文本可以在这里
-
Python:使用jieba分词和wordcloud实现词云
发布时间:2019-12-17 14:21词云是对网络文本中出现频率较高的关键词予以视觉上的突出。安装结巴库和词云库pip install jiebapip install wordcloudjieba是分词工具,下面是其使用jieba.cu
-
Python数据分析基础(九) 使用Seaborn绘制图像
发布时间:2019-12-16 14:25Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。可以使得数据可视化更加的方便,美观。关于Seaborn的学习,推荐去官网,里边有详细的教程
-
Python数据分析基础(八) 使用Matplotlib实现数据可视化
发布时间:2019-12-12 14:56Python数据可视化是将数据以图形或者表格的形式展示 这里会使用到matplotlib这个库 1.点图和线图 plt.plot(x,y,format_string,
-
Python数据分析基础之Pandas(七) 简单数据分析
发布时间:2019-12-11 15:16这节介绍如何使用pandas做简单的数据分析,内容包括基本统计分析、分组分析、分布分析、交叉分析(透视表)、结构分析和相关性分析 以下实例数据文件,可以从该站内链接获取 Python数据分
-
Python数据分析基础之Pandas(六) 数据计算
发布时间:2019-12-10 14:22本节继续介绍pandas的数据操作,这里介绍数据计算,包括数据的简单计算、数据标准化以及pandas中对日期的处理。最后做一个小实例为pandas做一个综合总结。这里提供练习的文件:链接:https: