2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > python3爬虫数据清洗与可视化实战pdf百度云_Python 3爬虫 数据清洗与可视化实战_PDF电子书...

python3爬虫数据清洗与可视化实战pdf百度云_Python 3爬虫 数据清洗与可视化实战_PDF电子书...

时间:2024-01-19 08:12:04

相关推荐

python3爬虫数据清洗与可视化实战pdf百度云_Python 3爬虫 数据清洗与可视化实战_PDF电子书...

因资源下载地址容易失效,请加微信号359049049直接领取,直接发最新下载地址。

前言

==============================================================

Python 是军刀型的开源工具,被广泛应用于 Web 开发、爬虫、数据清洗、自然语言处理、机器学习和人工智能等方面,而且 Python 的语法简洁易读,这让许多编程入门者不再望而却步,因此Python 在最近几年非常受欢迎,各行各业的技术人员都开始使用 Python。

本书内容来自笔者在高校授课的内容,主要介绍如何运用 Python 工具获取电商平台的页面数据,并对数据进行清洗和存储。本书简化了 Python 基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容。

本书采用的版本是 Python 3.6.2,是笔者写书时的最新版本,而且笔者习惯用的操作平台是Windows 系统。虽然目前一些高校和开发者在使用 Python 2.7,但是 Python 团队将在 年停止对Python 2.7 的支持更新, Python 2.X 转向 Python 3.X 是大势所趋。

本书第 1 章简单介绍 Python 和相关的 IDE,如果读者完全没有 Python 基础,那么建议选购一本基础书作为辅助。第 2~6 章介绍爬虫的实例,实现从最简单的爬虫到相对比较复杂的爬虫。鉴于实例的限制,本书的爬虫内容没有涉及代理服务器和验证码处理等问题。第 7 章介绍在 Python 中如何连接并操作数据库。第 8 章介绍了 NumPy 及其用法。第 9 章详细介绍 pandas 的功能,pandas 是 Python数据清洗和建模中非常重要的库。第 10 章用两个完整案例展示了从爬虫到建模的过程。第 11 章介绍 Python 的可视化,选用的库是 matplotlib 和 pyecharts,这里详细介绍了 pyecharts。

鉴于作者的水平有限,不足之处请读者不吝指教。

目录

==============================================================

作者介绍

前言

第1章 Python 基础

1.1 安装 Python 环境

1.1.1 Python 3.6.2 安装与配置

1.1.2 使用 IDE 工具——PyCharm

1.1.3 使用 IDE 工具——Anaconda

1.2 Python 操作入门

1.2.1 编写第一个 Python 代码

1.2.2 Python 基本操作

1.2.3 变量

1.3 Python数据类型

1.3.1 数字

1.3.2 字符串

1.3.3 列表

1.3.4 元组

1.3.5 集合

1.3.6 字典

1.4 Python 语句与函数

1.4.1 条件语句

1.4.2 循环语句

1.4.3 函数

第2章 写一个简单的爬虫

2.1 关于爬虫的合法性

2.2 了解网页

2.2.1 认识网页结构

2.2.2 写一个简单的 HTML

2.3 使用 requests 库请求网站

2.3.1 安装 requests 库

2.3.2 爬虫的基本原理

2.3.3 使用 GET 方式抓取数据

2.3.4 使用 POST 方式抓取数据

2.4 使用 Beautiful Soup 解析网页

2.5 清洗和组织数据

2.6 爬虫攻防战

第3章 用 API 爬取天气预报数据

3.1 注册免费 API 和阅读技术文档

3.2 获取 API 数据

3.3 存储数据到 MongoDB

3.3.1 下载并安装 MongoDB

3.3.2 在 PyCharm 中安装 Mongo Plugin

3.3.3 将数据存入 MongoDB

3.4 MongoDB 数据库查询

第4章 大型爬虫案例:抓取某电商网站的商品数据

4.1 观察页面特征和解析数据

4.2 工作流程分析

4.3 构建类目树

4.4 获取产品列表

4.5 代码优化

4.6 爬虫效率优化

4.7 容错处理

第5章 Scrapy 爬虫

5.1 Scrapy 简介

5.2 Scrapy 安装

5.3 案例:用 Scrapy 抓取股票行情

第6章 Selenium 爬虫

6.1 Selenium 简介

6.2 案例:用 Selenium 抓取电商网站数据

第7 章数据库连接和查询

7.1 使用 PyMySQL

7.1.1 连接数据库

7.1.2 案例:某电商网站女装行业 TOP100 销量数据

7.2 使用 SQLAlchemy

7.2.1 SQLAlchemy 基本介绍

7.2.2 SQLAlchemy 基本语法

7.3 MongoDB

7.3.1 MongoDB 基本语法

7.3.2 案例:在某电商网站搜索“连衣裙”的商品数据

第8章 NumPy

8.1 NumPy 简介

8.2 一维数组

8.2.1 数组与列表的异同

8.2.2 数组的创建

8.3 多维数组

8.3.1 多维数组的高效性能

8.3.2 多维数组的索引与切片

8.3.3 多维数组的属性

8.4 数组的运算

第9章 pandas 数据清洗

9.1 数据读写、选择、整理和描述

9.1.1 从 CSV 中读取数据

9.1.2 向 CSV 写入数据

9.1.3 数据选择

9.1.4 数据整理

9.1.5 数据描述

9.2 数据分组、分割、合并和变形

9.2.1 数据分组

9.2.2 数据分割

9.2.3 数据合并

9.2.4 数据变形

9.2.5 案例:旅游数据的分析与变形

9.3 缺失值、异常值和重复值处理

9.3.1 缺失值处理

9.3.2 检测和过滤异常值

9.3.3 移除重复数据

9.3.4 案例:旅游数据的值检查与处理

9.4 时序数据处理

9.4.1 日期/时间数据转换

9.4.2 时序数据基础操作

9.4.3 案例:天气数据分析与处理

9.5 数据类型转换

9.6 正则表达式

9.6.1 元字符与限定符

9.6.2 案例:用正则表达式提取网页文本信息

第10章 综合应用实例

10.1 按性价比给用户推荐旅游产品

10.1.1 数据采集

10.1.2 数据清洗、建模

10.2 通过热力图分析为用户提供出行建议

10.2.1 某旅游网站热门景点爬虫代码(qunaer_sights.py)

10.2.2 提取 CSV 文件中经纬度和销量信息

10.2.3 创建景点门票销量热力地图 HTML 文件

第11章 数据可视化

11.1 matplotlib

11.1.1 画出各省份平均价格、各省份平均成交量柱状图

11.1.2 画出各省份平均成交量折线图、柱状图、箱形图和饼图

11.1.3 画出价格与成交量的散点图

11.2 pyecharts

11.2.1 Echarts 简介

11.2.2 pyecharts 简介

11.2.3 初识 pyecharts,玫瑰相送

11.2.4 pyecharts 基本语法

11.2.5 基于商业分析的 pyecharts 图表绘制

11.2.6 使用 pyecharts 绘制其他图表

11.2.7 pyecharts 和 Jupyter

编辑推荐

==============================================================

Python爬虫技术的入门读物通过实战教初学者学习爬取数据、清洗和组织数据进行分析和可视化适合Python初学者、爱好者及高等院校的相关学生学习使用

作者简介

==============================================================

沐垚科技创始人,电商自媒体,资深数据分析师,8年电商从业经验,擅长Excel、Power BI、R、Python等工具,主要研究数据化运营、商业智能和人工智能在电商领域的应用,专注数据+电商的新零售服务。

出版

《电商数据分析淘宝实战》

《美丽的电商运营日记》

《Excel BI 之道:从零开始学Power工具应用》

《淘宝、天猫电商数据分析与挖掘实战》

联系方式:

公众号:start_data

个人号:haicheng1008

邮箱:lingyi@muyaotec

精彩书摘

==============================================================

精彩插图

==============================================================

媒体评论

==============================================================

这本书教大家如何利用Python撰写爬虫程序,清洗和组织数据,解析网页的内容,并将数据储存于数据库中。巨细无遗,帮助大家节省时间,是值得一读的好书!

——国立台湾大学资讯工程博士,铭传大学资讯工程学系教授 李御玺 (Yue-Shi Lee)

零一兄的这本Python爬虫技术是一个完整大数据应用框架:从数据收集、分析到数据可视化、数据建模。各章节以实际案例为出发点,对大数据分析、爬虫技术应用感兴趣的小伙伴们来说,这本书值得购买。

——爱数据学院创始人 数据海洋

互联网时代,信息大爆炸,爬虫技术被广泛地用于原始数据的积累。零一以自己的亲身实践,用Python 3实现了抓取、存储、清洗和可视化的数据处理操入门。作。本书语言简洁、知识点全面、图文并茂,让爬虫技术变得简单易学,非常适合新手。

——《R的极客理想》系列图书作者 张丹

内容简介

==============================================================

本书内容来自笔者在浙江某高校授课内容,主要介绍运用Python工具获取电商平台的页面数据,并对数据做清洗和存储。本书简化了Python基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容,对于Python基础,建议新手可以选购对应的基础书籍配合本书一起学习。

因资源下载地址容易失效,请加微信号359049049直接领取,直接发最新下载地址。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。