• 可以使用搜索框,搜索指定的书籍!
  • 终于有Python的书籍了,暂时没人访问😢

Python网络数据采集

Python wanyahai 3个月前 (09-27) 108次浏览 0个评论 扫描二维码

本书采用简洁强大的 Python 语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用 Python 从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。

Ryan Mitchell

数据科学家、软件工程师,目前在波士顿 LinkeDrive 公司负责开发公司的 API 和数据分析工具。此前,曾在 Abine 公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有 Instant Web Scraping with Java。

译者序  
前言  
第一部分 创建爬虫
第 1 章 初见网络爬虫  
第 2 章 复杂 HTML 解析  
第 3 章 开始采集  
第 4 章 使用 API  
第 5 章 存储数据  
第 6 章 读取文档  
第二部分 高级数据采集
第 7 章 数据清洗  
第 8 章 自然语言处理  
第 9 章 穿越网页表单与登录窗口进行采集  
第 10 章 采集 JavaScript  
第 11 章 图像识别与文字处理  
第 12 章 避开采集陷阱  
第 13 章 用爬虫测试网站  
第 14 章 远程采集  
附录 A Python 简介  
附录 B 互联网简介  
附录 C 网络数据采集的法律与道德约束  
作者简介  
封面介绍  


本站大部分内容收集于互联网,只做学习和交流使用,版权归原作者所有。本站发布的内容若侵犯到您的权益,请联系本站处理。
喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址