百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

ScalersTalk 成长会 Python 小组第 9 周学习笔记

itomcoil 2025-09-13 01:13 2 浏览

Scalers 点评:在 2015 年,ScalersTalk 成长会完成 Python 小组完成了 《Python 核心编程》第 1 轮的学习。到 2016 年,我们开始第二轮的学习,并 且将重点放在章节的习题上。Python 小组是成长会内部小组,如果你想和我们 一起学习 Python,你需要是成长会成员,并且完成相关进群任务。

我们的节奏是行动是一周一章学到位,章节习题都会一个一个过。通过到位地 执行,达到实质性的提升。

本周学习情况

本周(20160314-20160320)学习第九章,章节内容为《文件》。本周复盘主 持人为 张丹荔。

本章主要内容

本章介绍了文件对象(内建函数、内建方法、属性), 标准文件, 访问文件系统的方法, 文件执行,初步认识持久存储和标准库中与文件有关的模块.

本章主要知识点

文件对象

  • 定义:连续的字节序列,通常使用流的方式传输,流可以是单个字节也可以是大数据块。

  • 文件及类文件:普通的磁盘文件, 而且也可以访问任何其它类型抽象层面上的”文件”,例如通过URL访问Web页面,或者网络通讯中的Socket.

文件内建函数

  • open: 用于打开文件的内建函数

    open(filename, access_mode, buffering)

    其中 access_mode支持r,w,a,U四种模式,buffering支持-1, 0, 1, 大于1的数字


  • file: 同open函数功能相同,仅当需要通过上下文表示访问的是文件对象时,才需要考虑使用,否则一般使用open即可。

  • UNS: 通用换行符,默认Python中打开了对于通用换行符的支持,无论是哪个系统中使用的换行符,皆可以被识别,同时Python中还提供了关闭该功能的方法——即
    --without-universal-newlines
    来关闭该功能。

文件内建方法

  • 读:

    read, readline, readlines(size=-1, 0, n), next
  • 写:

    write(str), writelines(sequences)
  • 位移:

    seek(offset, whence=0,1,2), tell
  • 关闭:

    close
  • 其它:

    fileno, truncate(size), flush, isatty

文件内建属性

  • closed: 是否关闭状态

  • encoding: 编码方式

  • mode: 打开方式

  • name: 文件名称

  • newlines: 换行符信息,若还没遇到换行符时,为None;若找到一个换行符,返回结果为字符串;若找到多个换行符,为换行符的列表

标准文件

Python中只要程序一执行,就可以访问三个标准文件,分别如下:

  • sys.stdin: 标准输入(一般是键盘)

  • sys.stdout: 标准输出(到显示器的缓冲输出)

  • sys.stderr: 标准错误(到屏幕的非缓冲输出)

    我们可以通过 sys库拿到这三个文件的句柄,即可访问以上三个文件。此外,sys.*对应的所有都是文件,都可以通过句柄来访问。

命令行参数

命令行参数即在执行Python程序时,通过命令行输入的参数,类似shell等在终端执行命令时输入的参数。这里采用了类似C语言中的表示方法,即argv.

  • argc: 命令行参数的个数

    len(sys.argv)
  • argv: 命令行参数的列表

    访问方式:sys.argv,返回一个存储了所有参数的列表,其中首个元素sys.argv[0]是程序的名称,从sys.argv[1]才开始表示输入的第一个参数,若输入只有一个参数时,推荐直接使用sys.argv[1]来获取第一个参数;若输入参数较多时,推荐使用getopt库获取命令行参数列表。

文件系统

  • 访问方式:通过 os 模块来访问

  • os模块对于文件及文件夹的操作:

    • 操作单个文件:

      mkfifo/mknod, remove/unlink, rename/renames, tmpfile, walk
    • 操作文件夹:

      chdir/fchdir, chroot, listdir, mkdir/makedirs, rmdir/removedirs
    • 调整权限:

      access, chmod, chown/lchown, umask
    • 文件描述符:

      open, read/write
  • os.path模块对于文件路径的操作:

    • 分隔:

      basename, dirname, join, ……
    • 信息:

      getatime, getctime, getmtime, getsize
    • 查询:

      exists, isabs, isdir, ……

文件持久化存储相关库

  • 序列化对象的库:

    • pickle/cPickle序列化的库:

      pickle.dump(obj, file) 序列化 pickle.load(obj) 反序列化
    • anydbm持久化存储的库:

      db = anydbm.open(filename, access_mode) //1
      db[key_str] = value_str //2
      db.close //3
      db.items //4

      通过keyvalue方式存储,仅仅支持存储字符串,即keyvalue都必须是字符串。


    • shelve库:

      结合了前两者的功能,既可以将任意Python对象序列化,同时还可以将其存储在文件或者内存中。使用方法类似anydbm

其它文件相关库

  • 编码转换:

    base64, binascii, uu
  • 压缩解压:

    gzip/zlib, bz2, tarfile, zipfile
  • 高级文件访问:

    shutil
  • 其它:

    tempfile, cStringIO

ScalersTalkID:scalerstalk

本微信公众号作者Scalers,游走在口译世界的IT从业者。微信公众号ScalersTalk,网站ScalersTalk.com,口译100小时训练计划群C 456036104

成长会是由Scalers发起的面向成长、实践行动,且凝聚了来自全球各地各行各业从业者的社群。有意入会者请和Scalers直接联系,我和其他会员会和你直接交流关于成长行动等各方面的经验教训。2016年成长会持续招募中,参见做能说会写的持续行动者:ScalersTalk成长会2016年会员计划介绍(2016.2更新)

相关推荐

python数据分析中你必须知道的陷阱和技巧

数据分析是一门既有趣又有挑战的技能,它可以帮助我们从海量的数据中提取有价值的信息,为决策提供支持。但是,数据分析也不是一件轻松的事情,它需要我们掌握一定的编程、统计、可视化等知识,同时也要注意避免一些...

python常见五大坑及避坑指南_python解决什么问题

python是一门非常流行和强大的编程语言,但是也有一些容易让初学者或者不熟悉的人掉入的坑。这里列举了一些python常见五大坑,以及如何避免或者解决它们。缩进问题。python使用缩进来表示代码块,...

收藏!2022年国家职业资格考试时间表公布

人社部14日公布2022年度专业技术人员职业资格考试工作计划,包括中小学生教师资格、会计师、精算师、建造师等各项考试日期。其中,证券期货基金业从业人员资格各次考试地点不同,具体安排以相关行业协会考试公...

苹果mac系统必须安装python3_macbook安装python3.7

苹果mac系统必须安装python3苹果mac系统口碑很好,但不能像linux系统一样同时提供python2和python3环境,对程序员来说是非常不友善的。资深程序员都知道,Python3才是P...

通过python实现猴子吃桃问题_python小猴子吃桃的问题

1、问题描述:猴子第一天摘下若干个桃子,当即吃了一半,还不过瘾,又多吃了一个,第二天早上又将剩下的桃子吃掉一半,又多吃了一个。以后每天早上都吃了前一天剩下的一半零一个。到第10天早上想再吃时,就只剩...

python 中的第一个 hello world 程序输出

程序运行:print("helloworld")我使用的是Python程序3.7.0版本介绍下print概念print字面意思打印,将文本输出内容打印出来输入:print(&...

持久化 Python 会话:实现数据持久化和可重用性

Midjourney生成R语言会话持久化熟悉或常用R语言进行数据分析/数据挖掘/数据建模的数据工作者可能对R语言的会话保存和会话恢复印象比较深刻,它可以将当前session会话持久化保存,以便分...

如何将Python算法模型注册成Spark UDF函数实现全景模型部署

背景Background对于算法业务团队来说,将训练好的模型部署成服务的业务场景是非常常见的。通常会应用于三个场景:部署到流式程序里,比如风控需要通过流式处理来实时监控。部署到批任务中部署成API服...

Python 字典l转换成 JSON_python转化字典

本文需要5分钟。如果对您有用可以点赞评论关注.Python字典到JSONJSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它基于ECMAScrip...

[python] 基于PyOD库实现数据异常检测

PyOD是一个全面且易于使用的Python库,专门用于检测多变量数据中的异常点或离群点。异常点是指那些与大多数数据点显著不同的数据,它们可能表示错误、噪声或潜在的有趣现象。无论是处理小规模项目还是大型...

总结90条写Python程序的建议_python写程序的步骤

  1.首先  建议1、理解Pythonic概念—-详见Python中的《Python之禅》  建议2、编写Pythonic代码  (1)避免不规范代码,比如只用大小写区分变量、使用容易...

ptrade系列第六天:持久化处理2_持久化的三种状态

前一次跟大家分享了利用pickle进行策略数据的持久化。但是这种方式有个问题,就是保存下来的数据无法很直观的看到,比较不方便,所以今天给大家带来另一种方式,将数据通过json保存。importjso...

Python数据持久化:JSON_python的json用法

编程派微信号:codingpy上周更新的《ThinkPython2e》第14章讲述了几种数据持久化的方式,包括dbm、pickle等,但是考虑到篇幅和读者等因素,并没有将各种方式都列全。本文将介绍...

干货 | 如何利用Python处理JSON格式的数据,建议收藏

作者:俊欣来源:关于数据分析与可视化JSON数据格式在我们的日常工作中经常会接触到,无论是做爬虫开发还是一般的数据分析处理,今天,小编就来分享一下当数据接口是JSON格式时,如何进行数据处理进行详...

Python中Pyyaml模块的使用_python模块介绍

一、YAML是什么YAML是专门用来写配置文件的语言,远比JSON格式方便。YAML语言的设计目标,就是方便人类读写。YAML是一种比XML和JSON更轻的文件格式,也更简单更强大,它可以通过缩进来表...