百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

学习Python的第45天,我终于彻底明白怎么安装爬虫需要的模块了

itomcoil 2025-07-08 19:22 18 浏览

终于开始跟着老师开始一起输入代码。

没想到一上来就遇到问题。

用 # 备注,之前黑马课程讲 # 后面是要有个空格的,而这个老师全都是没有的。

咱也不知道该听谁的,而不加空格的话 萍、PyCharm 会有下划线提示,索性,那就都加上吧。

这行代码 if __name__ == "__main__: 老师称为程序的入口。

也就是在查看代码时候,一看到这句话,就知道是从这行代码开始执行的,中间不会再有其他的执行点。

引入模块

讲述模块的概念,这个在之前黑马的课程学习过,轻松加愉快了。

跟之前的课程区别在于,他是在一个文件夹下 新建py文件 进行说明。

所以代码中,不是简单的用 import 导入模块,而是 from... import 方法导入。

本次案例主要需要使用到的模块是: sys 、 bs4、 re、 urllib、 xlwt

安装模块,有个挺有意思的办法:在 PyCharm 下方,点 Terminal 竟然直接就能进入 cmd 窗口,进去之后再使用 pip 命令安装就可以了。

当然,老师最推荐的,还是在 PyCharm 中,用 setting 来安装,这个我在之前的文章有说过的。

让我更明白的一点是,原来上述两种方法是只使用后面一种就可以了,我之前一直以为是两个要同时都使用呢。

后面的办法最大的优点,就是在安装包的同时,你可以关闭窗口继续输入代码,不用去管它。

而像命令提示行的办法,就只能傻傻等着了。

现在,把所有需要的库一次性导入吧,哪个没装也都给他装上。

构建流程

一个小技巧:在 PyCharm 中,如果文字没有变色(比如灰色),说明没有被调用过;而变了颜色(如橙色、蓝色等),就是被调用过了。没有变色的代码,将其删除,不影响程序的运行。

简单来说,爬取豆瓣,分三个大步骤:爬取网页、解析数据、保存数据

事实上,每个步骤也都是个大工程,所以把每个步骤提取成一个函数,方便后期管理。

这里因为第一步和第二步可以说是交错进行,所以两个放在了一起。

第三步保存数据,需要给他指定一个路径,这里用到转义字符。

课程学到这里,还都是感觉不难。

不过,貌似明天就该应该挑战了。

加油,奥利给!


作者简介:冯十一,40岁仍然坚持学习的哏儿都老男人。多平台签约作者,日更写作践行者,每周阅读一本书。欢迎关注@天津冯十一

相关推荐

mysql中缓存开启和失效场景cache_mysql缓存机制有几种

--1.当前数据库是否支持缓存数据SHOWVARIABLESLIKE'have_query_cache';--2.当前数据库缓存数据库开关是否开启OFF/0未开启YES/...

MySQL常见错误及解决方法_mysql错误大全

MySQL是最常用的关系型数据库之一,在使用过程中也会遇到很多报错,本文列举了一些常见的错误及解决方法。1.Can'tconnecttoMySQLserver原因:MySQL服务未启...

牛哇!MySQL中的日志“binlog”的三种格式这么好玩

MySQL中的日志比较重要的有binlog(归档日志)、redolog(重做日志)以及undolog,那么跟我们本文相关的主要是binlog,另外两个日志松哥将来有空了再和大家详细介绍。1...

让我们在音乐中藏点儿东西吧_让我们在音乐的世界里

1不仅仅是音轨前阵子,新的Doom游戏中的一段音轨被人发现里面有隐藏的五角星图片以及“666”的字样,这不禁让我有了想尝试一下的想法。其实很早之前就知道可以通过多种方式将图片转换成声音,但是自己从...

《Python实现PPT转图片:高效批处理的技术路径》

Python处理PPT转图片的核心方案集中于两类库:基于COM接口的win32com.client,适用于Windows环境,通过调用PowerPoint程序API实现幻灯片逐页导出,支持指定分辨率...

实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实

号称“OpenAI迄今为止最强模型”,o3/o4-mini真实能力究竟如何?就在发布后的几小时内,网友们的第一波实测已新鲜出炉。最强推理模型o3,即使遇上首位全职提示词工程师RileyGoodsid...

如何用Python快速切割图片?_python把图片切割成固定大小的子图

安装一个叫做PIL的Python图像处理库,它可以让我们读取、裁剪和保存图片。准备一张要分割的图片,并把它放在一个文件夹里。比如这里有一张很长的漫画图片,命名为2023-07-29_100430.pn...

bmp转jpg脚本_bmp转化为jpg批量

我们在使用示波器时,经常会需要将波形通过U盘导出,一般这种导出的波形的都是bmp格式的,很多时候bmp格式的图片不方便使用,需要转换为jpg或png格式的。波形保存到U盘后,可以...

python模块安装问题汇总及解决办法

问题:pipinstallplaysound出错解决办法:pipinstallplaysound==1.2.2问题:pipinstall某个模块失败解决办法:可以去用这个模块的whl文...

Python处理图像_python怎么图像处理

入门知识颜色。如果你有使用颜料画画的经历,那么一定知道混合红、黄、蓝三种颜料可以得到其他的颜色,事实上这三种颜色就是美术中的三原色,它们是不能再分解的基本颜色。在计算机中,我们可以将红、绿、蓝三种色光...

python如何给图片添加文字水印?_python如何给图片添加文字水印

方法:方法简单粗暴,打开图片然后在合适的位置绘制文字,最后保存。python可以使用PIL库来操作图片,不过据说PIL不支持python3,使用pillow作为替代。安装pillow:pipins...

游戏外挂,用Python输过谁?_python写游戏辅助脚本教程

玩过电脑游戏的同学对于外挂肯定不陌生,但是你在用外挂的时候有没有想过如何做一个外挂呢?我打开了4399小游戏网,点开了一个不知名的游戏,唔,做寿司的,有材料在一边,客人过来后说出他们的要求,你按照菜单...

如何使用python裁剪图片?_python图片截取

如何使用python裁剪图片如上图所示,这是一张包含了各类象棋棋子的图片。我们需要将其中每一个棋子都裁剪出来,此时可以利用python的PIL库实现。一、安装PIL库如果此前没有安装过PIL库,...

Python图像处理神器!Pillow库从入门到精通,这教程太全了

Pillow是Python中一个强大的图像处理库,是PIL(PythonImagingLibrary)的分支和升级版本。本教程将介绍Pillow的基本用法和常见操作。##安装Pillow```p...

Python自动化办公应用学习笔记37—文件读写方法1

一、文件读写方法1.读取内容:read(size):读取指定大小的数据,如果不指定size,则读取整个文件。data=file.read(100)#读取前100字节readline():读取一...