百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

从全流程的角度来了解python包的使用,你也许会有不一样的认识

itomcoil 2025-03-19 13:36 11 浏览

在python中,只要我们一谈到包或模块,基本默认说的就是包的导入和使用。也就是说只要我们知道包的名字,导入后知道怎么使用基本就可以了,但本人认为,我们仅仅了解的是包的一部分,若想对包有个整体的认识,我们还需知道包的整个制作和使用流程。

在这个圆环流程图中,其实并没有严格的前后顺序,你也可以先进行包的开发、制作、上传、下载、安装,最后再到包的导入和使用,同样也可以直接导入现成包直接使用 。那么接下来我们就从最基本的包开始介绍 。

1.模块和包(包的导入和使用)

谈到包,你就不得不知道模块 ,因为很多包就是由模块构成的 。所以,接下来我们就来了解下python中的模块 。

1.1 模块

1.什么是模块

所谓的模块,其实就是一个python ,以.py结尾的文件 ,文件内包含了类、函数、方法等 。

myproject
├─ __init__.py
├─ abc.py
└─ bcd.py

其中,abc和bcd就是python的模块 ,后续模块的导入和使用也是直接这两个名字即可 。

在python中,有很多现成的模块是可以直接使用的,比如os模块 。若使用其功能时只需要完成两步即可,分别是:

  1. 模块的导入
  2. 模块内函数、函数、类的调用

2.模块的分类

python中的模块,我们可以将其分为三类,分别是:

  • 系统自带模块 ,相当于安装python包就将这些模块自动安装上了,这一类型的模块在python的整个环境中全局有效,任何地方都可导入直接使用 。其中典型的模块以os为主 .
  • 第三方模块/包 ,使用时需要先下载安装并配置环境变量,在配置的环境变量内模块可以被导入使用 。这一类型的包或模块是我们最常用的,因为大多数情况下,系统模块都不能满足我们的需求 ,需要借助于大量的第三方模块/包才能完成工作 。
  • 自定义模块 ,项目内部开发的模块 ,可以在项目内部使用 ,超出项目内即无法使用 。

3.模块导入

在上面我们已经介绍到,若想要使用现成的模块,第一个步骤就是导入,在python中导入有两种方法,分别是:

# 第一种导入方式:
import 模块名

# 需求1:导入os模块 
import os

# 需求2 :导入自己编写的模块,abc  注意 : 导入自己编写的模块时需要注意路径 。
import abc 

# 说明: 通过这种方式导入的模块,使用时也需要加入模块的名字 ,比如os模块内有个getcwd()方法,在使用这个方法时,也必须是os.getcwd()才行 。

使用上面的导入方式有一定的弊端,比如说os内部有很多方法,但我只是使用其中的几个方法,但是通过import os导入后将os内所有方法和类全部导入,占用系统资源较大 ;其次就是每次使用具体方法或类时,必须前面加模块名 ,调用起来不太便捷 。以上的这些问题该如何解决呢 ?答案就是使用第二种导入方式 :from 模块 import 方法|类

# 第二种导入方式
from 模块名 import 成员名 

# 导入 os里的getcwd方法
from os import getcwd

# 说明 :通过这种方式导入后 ,使用getcwd()方法时直接调用getcwd即可。


4.模块路径搜索

无论是后面介绍的包,还是这里要介绍的模块,直接进行了导入操作 ,它就会先去找到这个模块/包 ,如果在指定的路径下搜索该模块,如果找到,则导入成功 ,否则导入失败 。具体搜索的先后顺序依次为:

  • 程序的当前路径
  • python的环境变量路径
  • python标准链接库路径

以上的路径组合起来就是sys.path所包含的路径 ,而python会选择在搜索路径中的第一个符合导入文件名的文件作为导入模块,找到后即停止后面的搜索 。所以若你自定义的模块和其它路径下的模块重名,你又想要用到自定义模块,就可以把自定义模块放在前面 。

同时还需要注意的是,自定义模块不能和系统模块重名,否则会报错 。

1.2 包

1.什么是包

包是一个包含多个模块的特殊目录,目录里有文件和目录的组合 ,其目录下有一个特殊文件__init__.py,这也是包和目录的最主要区别 。

myproject
├─ __init__.py
├─ mypack01
    ├─ __init__.py
├─ mydir
├─ ab.py
└─ bc.py


# 说明:
① . 其中myproject就是最外层的包 ,其中每个包下都会有个__init__.py的文件,这也是区别普通目录和包的最主要区别 。其中__init__.py中可以是空也可以有python代码 。
② . mypack01是子包 ,mydir是目录
③ . ab.py和bc.py是包下的模块

其中包和模块的使用方式一样,同样需要先导入后调用(使用 ),这里就不再赘述。

2.__init__介绍

这里需要介绍下__init__这个特殊的文件,我们都知道它这个里面可以写代码,也可以不写 ?但是很多情况下我们并不知道,这个文件中到底该写什么代码 ?这个文件到底有什么作用呢 ?我们通过几段代码来展示它的作用 。

先看下两个模块(ab.py和bc.py)内的代码,

    # 文件:ab.py
    
    def div(a,b):
        return a // b
    
    def mul(a,b):
        return a * b
    # 文件 : bc.py
    
    def add(a,b):
        return a + b
    
    def min(a,b):
        return a - b

如果我想在test.py中调用以上两个文件中的函数,可以是如下的写法 :

    import mypack01.ab
    import mypack01.bc
    
    print(mypack01.ab.mul(3,4))		#输出:12
    print(mypack01.bc.add(3,4))     #输出 :7

通过以上的导入方法可以看到,能得到正确的结果 。接下来我们做个试验 ,导入时只写父包名 ,不写子包名 。具体如下图 :

只导入父包名就会报错 ,当鼠标移动到ab或bc上时, 提示了一句Cannot find reference 'bc' in __init__.py , 大体意思是在__init__.py中找不到bc . 于是我们在__init__.py中把这个模块导入 ,具体代码如下:

# mypack01包下的__init__.py 

import mypack01.bc
import mypack01.ab


以上的两个截图可以看到,test.py文件中的代码没变,而所变化的就是__init__.py . 那么这时__init__.py 到底起到了什么作用呢 ?结合着上面的提示 ,我们可以总结出:

在其它模块import后跟包名,其实导入的是init.py文件,也就是说只要你的代码导入其它包时,就会自动执行导入包下的__init__.py代码 。

那么,以上的结论在实际场景中到底有什么作用呢 ? 通过以上的代码肯定是看不出来的 ,我们可以想象一种场景, 假设我们有很多模块都要调用mypack01中的几个函数 ,是不是要在每个模块都要写几个导入语句啊 ,这个时候我们就可以将导入语句写到__init__.py代码中,这样是不是就节省了一部分代码呢 ? 这种场景不正是很多模块调用公共类库时会遇到的情形吗 ,所以 ,就可以使用__init__.py进行初始化一些导入 。

还有另外一种情况,可以用于from package import * , 这个*代表要把package包内的所有模块统统导入 。但有时候我们不希望部分模块被导入 ,因为部分模块只是被内部使用的,若被其它模块导入后,那就变为公共资源了 。这个时候怎么控制呢 ?答案就是在__init__.py中加入一个__all__变量列表 。

2.包的制作与上传

有时候我们开发的包也想供外界使用,你就可以把你的原始包制作成可供pip或者easy_install安装的包 。具体制作步骤如下:

  1. 在包对应的项目下创建必要的文件 ,分别为setup.py,LICENSE,README.md .

2.编写readme.md文件和setup.py脚本 。编写自己的README.md文件



### 1.包功能介绍

### 2.安装方法

### 3.参数说明

### 4.联系方式编写自己的setup.py

编写自己的setup.py

import os
import setuptools


# 读取readme文件
with open("README.md", "r",encoding='utf-8') as f:
 readme = f.read()

setuptools.setup(
 name="mypack", #包名称
 version="0.0.1", #版本
 author="Example Author", #包邮箱
 author_email="author@example.com", #作者邮箱
 description="A small example package", #包描述
 long_description=readme, #长描述,通常是readme ,打包到PiPy需要 。
 url="https://github.com/pypa/sampleproject", #项目URL
 packages=setuptools.find_packages(), #项目中需要的包
 classifiers=[ #程序的所属分类列表
 'Operating System :: Microsoft',
 'Operating System :: POSIX',
 'Operating System :: Unix',
 'Topic :: NLP',
 'Topic :: Software Development :: Libraries :: Python Modules',
 'Programming Language :: Python :: 3.5',
 'Programming Language :: Python :: 3.6',
 'Programming Language :: Python :: 3.7',
 'Programming Language :: Python :: 3.8',
 ],
)

3.进行打包 ,其中最常见的两种打包方式

# 以下的两个命令生成不同的格式 ,
python setup.py bdist_egg # 生成类似 mypack-0.0.1-py3.6.egg,支持 easy_install安装
python setup.py sdist # 生成类似 mypack-0.0.1.tar.gz,支持 pip 安装


以上截图分别是通过以上两个命令生成的的安装包 ,如果是本地用的话,就可以直接通过pip 或者easy_install安装 。但如果你想开源,你需要上传到PyPi

4.上传PyPi

  1. 在https://pypi.python.org/pypi上注册一个账号
  2. 在本地的用户目录下新建文件:.pypirc ,比如我的路径为:C:\Users\zhjy.pypirc 文件内容为:
[distutils]
 index-servers=pypi 
[pypi]
repository = https://upload.pypi.org/legacy/
username = yourname
password = youpassword

3.安装twine,pip install twine .

4.使用twine进行上传 ,twine upload dist/* .这样你的包就可以被全世界下载了 。

3.包的下载与安装

包的下载和安装主要用到pip ,这里就主要介绍下pip的使用 ,pip虽然使用它非常简单,但是它的参数非常多,很多情况下我们都会使用到 。

以安装pymysql为例

命令

说明

举例

pip --version

查看pip版本


pip install packagename

安装包

pip install pymysql

pip install packagename=0.9.3

安装指定版本

pip install pymysql=0.9.3

pip install packagename>=0.8.1

安装最低版本

pip install pymysql>=0.8.1

pip install --upgrade packagename

升级指定包

pip install --upgrade pymysql

pip uninstall packagename

卸载指定包

pip uninstall pymysql

pip search packagename

搜索指定包

pip search pymysql

pip show packagename

查看安装包的信息

pip show pymysql

pip list

列出以安装的包


pip list -o

列出可升级的包


pip freeze

列出以安装的包,包名==版本显示


pip freeze > 文件

导出到文件

pip freeze > a.txt

pip install -r requirements.txt

从文件中安装包


pip install packagename -i 镜像URL

指定镜像下载

pip install pymysql -i https://pypi.tuna.tsinghua.edu.cn/simple/

pip --default-timeout=600 install packagename

设置超时时间

pip install pymysql --default-timeout=600



相关推荐

selenium(WEB自动化工具)

定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

开发利器丨如何使用ELK设计微服务中的日志收集方案?

【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

高并发系统设计:应对每秒数万QPS的架构策略

当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

2025 年每个 JavaScript 开发者都应该了解的功能

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

JavaScript Array 对象

Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

动力节点最新JavaScript教程(高级篇),深入学习JavaScript

JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

「晚安·好梦」努力只能及格,拼命才能优秀

欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

JavaScript 中 some 与 every 方法的区别是什么?

大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

10个高效的Python爬虫框架,你用过几个?

小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

12个高效的Python爬虫框架,你用过几个?

实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

pip3 install pyspider报错问题解决

运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

PySpider框架的使用

PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

「机器学习」神经网络的激活函数、并通过python实现激活函数

神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...