《Python数据分析与大数据处理从入门到精通》PDF免费下载

语言: | 中文 |
作者: | 朱春旭 |
出版社: | 北京大学出版社 |
发布时间: | 2019年11月 |
ISBN: | 9787301307656 |
标签: | 转换版PDF |
内容简介
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。
第1 篇首先介绍了Python 的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本的认识。
第2篇介绍了网络数据采集、数据清洗、数据存储等技术。
第3篇介绍了Python常用的数据分析工具,扩展了更多的数据消洗、插值方法,为最终的数据可视化奠定基础。
第4篇是大数据分析的重点。首先介绍了Hadoop的框架原理、调度原理, MapReduce 原理与编程模型、环境搭建,接着介绍了Spark框架原理、环境搭建方式,以及如何与Hive等第三方工具进行交互,还介绍了最新的结构化流式处理技术。
第5篇通过三个项目实例,综合介绍了如何分析网页、如何搭建分布式爬虫、如何应对常见的反爬虫、如何设计数据模型、如何设计架构模型、如何在实践中综合运用前四篇涉及的技术。
本书既适合非计算机专业的编程”小白”,也适合刚毕业或即将毕业走向工作岗位的广大毕业生,以及已经有编程经验,但想转行做大数据分析的专业人士。同时,还可以作为广大职业院校、电脑培训班的教学参考用书。
下载信息
如果上方的下载按钮无法下载,可以使用此处的备用下载地址手动跳转。
Ca2T
本站所有资源均经过人工检查,确保质量。每一个都是互联网上能收集到的质量最好的版本。对于多个版本的书籍,一般只收录最新版本。
本站所有资源均免费,如果您觉得还行,请分享给更多的人。如果您有任何问题,或者想贡献更优质的版本,可以点击下方【建议/报告问题】按钮提交。