会员
精通Scrapy网络爬虫
刘硕更新时间:2020-11-28 14:59:54
最新章节:本书特点:开会员,本书免费读 >
本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
精通Scrapy网络爬虫最新章节
查看全部- 本书特点:
- 作者简介:
- 14.4 本章小结
- 14.3 使用scrapy-redis进行分布式爬取
- 14.2 scrapy-redis源码分析
- 14.1 Redis的使用
- 第14章 分布式爬取
- 13.6 本章小结
- 13.5 项目实战:爬取豆瓣电影信息
- 13.4 实现随机代理
刘硕
主页
同类热门书
最新上架
- 会员
Python数据可视化之Matplotlib与Pyecharts实战
《Python数据可视化之Matplotlib与Pyecharts实战》以某上市电商企业的客户数据、订单数据、股价数据为基础,循序渐进地介绍Python可视化技术,重点介绍Pandas数据预处理与Matplotlib和Pyecharts在数据可视化应用中的基本功能和使用技巧。全书共分4篇,第1篇(第1~4章)主要介绍Python基础与Pandas数据预处理技术,帮助准备可视化数据;第2篇(第5~7计算机7.4万字 - 会员
C# 10核心技术指南
本书是一本C#10的技术指南,在上一版的基础上进行了全面更新,围绕概念和用例进行组织,系统、全面、细致地讲解了C#10从基础知识到各种高级特性的命令、语法和用法。本书首先介绍C#和.NET,第2—4章详细介绍C#语言的语法、类型和变量。其余各章则涵盖.NET6基础类库的功能,包括LINQ、XML、集合、并发、I/O和联网、内存管理、反射、动态编程、属性、加密和原生互操作性等主题。第5章和第6计算机38.2万字 - 会员
大模型RAG实战:RAG原理、应用与系统构建
这是一本全面讲解RAG技术原理、实战应用与系统构建的著作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。无论你是深度学习初学者,还是希望提升RAG应用技能的开发者,本书都将为你提供宝贵的参计算机8.4万字 - 会员
大数据可视化编程和应用
《大数据可视化编程和应用》从基础开始,全面介绍大数据可视化的底层原理和实现框架,并重点讲解一些常用的大数据可视化关键技术,包括Excel图表、TableauDesktop可视化组件、Web的可视化控件、Java可视化控件及Python数据可视化工具。《大数据可视化编程和应用》共分为8章,第1章着重介绍大数据的发展历程,以及在大数据发展背景下数据可视化的概念、可视化技术的使用及可视化的现实意义;第2计算机4.2万字 - 会员
R语言数据可视化:科技图表绘制
《R语言数据可视化:科技图表绘制》结合编者多年的数据分析与科研绘图经验精心编撰,旨在帮助读者利用R语言及ggplot2在内的多种可视化包绘制引人入胜的专业化图表。全书共11章,第1~3章主要讲解R语言的基础知识,包括对象与变量、数据结构、数据存取、传统及网格绘图系统的绘图函数及参数控制,尤其对ggplot2包进行了详细讲解。第4~11章结合R及其附加包的数据可视化功能,分别讲解类别比较数据、数值关计算机5.3万字 - 会员
HTML5从入门到精通(第4版)
《HTML5从入门到精通(第4版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详尽地讲解了与HTML5开发相关的知识。全书分为3篇,共22章,包括HTML简介、HTML5基础、设计网页文本内容、使用列表、超链接、使用图像、表格的应用、布局标签、全局属性、编辑表单、嵌入多媒体元素、文件操作、拖放操作、绘制图形、SVG的使用、数据存储、使用WebWorkers处理线程、HTML5消息通信计算机17.3万字 - 会员
剑指MySQL:架构、调优与运维
MySQL是世界上最受欢迎的数据库管理系统之一,广泛应用于互联网场景,作为一名开发人员,对MySQL的学习是十分必要的。本书从安装MySQL开始,逐步深入讲解更加复杂的内容,首先宏观地介绍MySQL的体系架构和各种常见的存储引擎以及它们之间的比较,然后介绍MySQL中的索引以及索引的优化,以及连接查询的执行原理,并详细分析了Explain语句的执行结果。接着又介绍MySQL中的事务和锁机制,包括事计算机21.4万字 - 会员
C#从入门到精通(第7版)
《C#从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用C#进行Windows应用程序开发方方面面的技术。全书分为4篇,共25章,包括初识C#及其开发环境、C#程序基本结构、变量与常量、表达式与运算符、字符与字符串、流程控制语句、数组和集合、面向对象编程、Windows窗体应用程序设计、Windows窗体应用程序常用控件、Windows窗体应用程序高级控件计算机17.8万字 - 会员
Django 5企业级Web应用开发实战(视频教学版)
《Django5企业级Web应用开发实战:视频教学版》精选当前简单、实用和流行的Django实例代码,帮助读者学习和掌握Django5框架及其相关技术栈的开发知识。本书系统全面、内容翔实、重点突出、通俗易懂,基本涵盖Django5框架应用开发的所有技术。《Django5企业级Web应用开发实战:视频教学版》共分为13章,内容包括Django框架基础与环境搭建、常用配置、模型、视图与路由、模计算机15.9万字
同类书籍最近更新
- 会员
Go语言Hyperledger区块链开发实战
Go语言是近年来非常流行的新兴编程语言,它不仅是以太坊客户端和HyperledgerFabric区块链平台的开发语言,而且广泛应用于区块链应用的开发。本书介绍使用Go语言开发的经典联盟链项目HyperledgerFabric,它由Linux基金会管理。国外的微软、摩根大通、世界银行和国内的华为、阿里巴巴、百度、腾讯等企业都参与了Hyperledger社区的建设。本书涵盖Hyperledger程序设计15.3万字 - 会员
C语言程序设计案例式教程(第2版)
本书在《C语言程序设计案例式教程》的基础上进行了完善、补充和修订,内容更加丰富、翔实,结构层次更加清晰、合理。本书共11章,第1章主要介绍C语言概述、C语言开发环境的搭建和C语言程序的编译机制等;第2章和第3章主要介绍C语言的基础知识,包括关键字、标识符、常量、变量、数据类型、类型转换、运算符与表达式等;第4~9章主要介绍C语言的核心知识,包括结构化程序设计、数组、函数、指针、字符串、结构体等;第程序设计16.3万字 - 会员
数据库管理与开发项目教程:MySQL(微课版·第4版)
本书以MySQL为平台,从数据库管理和开发的角度出发,介绍开发数据库应用系统所需的基础知识和技术。本书将一个贯穿全书的数据库应用系统开发实例“学生信息管理系统”融入各项目,将每个项目分解成若干任务,使读者逐步学会创建、管理、开发数据库,并掌握使用SQL进行程序设计的编程思想和技术。本书内容由浅入深,由实践到理论,再从理论到实践,通过任务驱动的方式将理论与实践密切结合,体现了高职高专和应用型本科教育程序设计12.6万字