Curriculum Framework

课程大纲

Lesson 1

数据分析与统计学

课程内容:

本节课通过几个经典的历史案例了解了数据分析的应用场景,学习了如何通过观察分析统计图表得到有用的信息,并初步了解了一些生活中常见的统计学陷阱。

知识点:

1. 数据分析的应用场景
2. 可视化分析
3. 统计学陷阱
4. 数据分析的常用库
5. 数据分析的步骤

Lesson 2

Numpy库和数据结构

课程内容:

本节课初步了解Numpy和Pandas的数据结构,并初步熟悉了Spyder的编程界面操作,重点学习了ndarray这个数据结构。

知识点:

1. Numpy和Pandas的数据结构
2. Spyder的使用
3. ndarray的创建
4. ndarray的访问和修改

Lesson 3

Series和DataFrame

课程内容:

本节课了解了Series和DataFrame的内在联系,以及如何创建Series对象和DataFrame对象,重点学习掌握访问、修改、删除和根据条件筛选数据。

知识点:

1. Series和DataFrame的联系
2. Series和DataFrame的创建
3. Series和DataFrame的数据获取和修改
4. 数据的删除和条件筛选

Lesson 4

数据处理与分组

课程内容:

本节课主要了解什么是数据处理,学习了数据处理的主要步骤和方法,最后通过一个案例综合运用知识点。

知识点:

1. 数据处理
2. 数据合并:Merge
3. 数据拼接
4. 数据清洗
5. 数据分组:Goupby

Lesson 5

Matplotlib库下的pyplot模块

课程内容:

本节课主要学习matplotlib库下的pyplot模块,学习图表的基本属性,最后通过案例学会绘制一个完整的图表。

知识点:

1. Matplotlib库介绍
2. pyplot模块学习
3. 图表的基本属性
4. 绘制折线图

Lesson 6

绘制常用的图表

课程内容:

本节课在上节课的基础上学会如何选择恰当的图形,并学会绘制常见的图表。还介绍Pandas库绘图,以及与Matplotlib库的相关性。

知识点:

1. 图形的选择
2. 常用图表的绘制
3. 利用Pandas库绘图
4. Pandas库和Matplotlib库绘图的相关性。

Lesson 7

pyecharts的使用

课程内容:

使用pyecharts结合wxpy库读取微信个人信息,分析微信好友的性别比例和地域分布

知识点:

1. 漏斗图Funnel
2. 仪表盘Gauge
3. 地图Map
4. 结合wxpy绘图

Lesson 8

泰坦尼克号的秘密

课程内容:

本节课通过分析当初泰坦尼克号上乘客的存活率与性别、舱位等因素的关系,来熟悉整个数据分析的具体流程

知识点:

1. 数据分析基本步骤
2. 数据获取
3. 数据处理
4. 数据可视化

Lesson 9

三国演义文本分析

课程内容:

通过分析《三国演义》中各个人物的出场次数,判断谁是主角

知识点:

1. jieba分词
2. sort排序
3. 横向柱状图barh

Lesson 10

分析豆瓣影评

课程内容:

利用爬虫爬取豆瓣网某部电影的短评,并根据相关内容绘制词云以及数据图

知识点:

1. 爬取数据
2. wordcloud库的使用
3. 词云制作和数据可视化

Lesson 11

空气质量分析(上)

课程内容:

本节课通过复杂度更高的综合项目学习数据分析的整个流程,重点讲解了空气质量分析这个项目的数据获取和数据处理部分

知识点:

1. 问题如何定义
2. 数据获取
3. 问题数据的处理

Lesson 12

空气质量分析(下)

课程内容:

本节课重点讲解了如何从问题出发,挖掘数据里隐藏的趋势和规律,并用可视化图表直观地呈现出来

知识点:

1. 可视化分析的流程
2. 空气质量等级对比分析
3. 月度趋势对比分析

继续了解 Python Level7