
Python网络爬虫:从入门到精通
教材教辅研究生/本科/专科教材11.2万字
更新时间:2023-10-25 19:34:57 最新章节:参考文献
书籍简介
本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
吕云翔主编
最新上架
- 会员人工智能技术在新媒体领域中的应用,不仅极大地提高了新媒体的生产效率,而且让新媒体传播更加精准和智能化。越来越多的企业通过短视频、直播和图文等新媒体平台开展营销内容创作与生产、私域经营和管理、短视频直播带货、广告投放与管理等互联网组合营销活动。本书根据新媒体运营和营销岗位及其要求,聚焦抖音、视频号、小红书等主流的新媒体平台,讲解移动互联网环境下对新媒体职业领域的认知与策划、营销内容的采编与生产、以及教材教辅9.6万字
- 会员本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验教材教辅8万字
- 会员本书使用分学科、多指标综合评价,以及定量评价与定性评价相结合的研究方法,从我国正在出版的中文期刊中评选出1987种核心期刊,具有较高的学术水平和使用价值。教材教辅63.3万字
同类书籍最近更新
- 会员S7-200SMART是曾在国内广泛使用的S7-200的更新换代产品,本书根据S7-200SMART新版的固件和编程软件进行修订,全面介绍了S7-200SMART的硬件组成、工作原理、指令系统和编程软件的使用方法;介绍了数字量控制系统梯形图的顺序控制设计方法,这种设计方法易学易用,可以节约大量的设计时间。本书还介绍了PLC与PLC之间、PLC与变频器和组态软件之间的通信编程和调试的方法;PI高教教材19.1万字
- 会员大学生思想政治理论课课外读本,共七个分册,每个分册40000字左右,内容涉及温州地方革命和建设史、温州改革开放发展史、中国改革开放以来的法治建设史、大学生创业相关的法律法规和公益创业案例分析、大学生网络素养培养、唯物论与无神论等。高教教材32.6万字
- 会员本书围绕人机交互的基本理论模型、交互范式、交互设计与用户界面设计应用实践展开,教学目标明确,注重理论与实践的结合。教学方法灵活,培养学生自主学习的能力。着重针对人机交互领域飞速发展的新型交互设备、交互理念进行介绍,侧重技术讲解,配备大量丰富的实例。通过该教材的学习,读者可以较好地掌握人机交互的基本知识和相关技术,能够学以致用。高教教材8.8万字