百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python 包存储库 PyPI 收到美国司法部三张传票后,无奈决定:提供用户数据!

itomcoil 2025-03-19 13:36 25 浏览

整理 | 苏宓
出品 | CSDN(ID:CSDNnews)

用过 Python 的开发者,想必都听过 PyPI。它是 Python 官方软件存储库,为超过 700,000 名用户和超过 450,000 个项目提供服务。

近日,PyPI 对用户隐私保护引发了不少人的担忧。事情起因于 5 月 24 日,Python 软件基金会的基础设施总监 Ee Durbin 在官方博客上发布了一篇《PyPI was subpoenaed》的公告。

在公告中,Ee Durbin 称 Python 软件基金会(PSF)2023 年 3 月和 4 月收到了美国司法部发出来的三张传票,要求 PSF 提供关于 PyPI 用户数据。

PyPI 是一个可以上传 Python 包的平台,通过在 PyPI 上发布的包可以使用"pip install"命令进行安装。为了在 PyPI 上发布包,用户需要创建一个账户,而这次司法部发出的传票要求的就是与这些用户账户相关的信息。

然而,根据 PSF 的说法,他们并没有得到任何关于为何司法部要求用户数据的法律背景信息,但是司法部要求他们提供总共五名 PyPI 用户的数据。

PSF 公告写道,「保护 PyPI 用户的隐私对于 PSF 和 PyPI 管理员来说至关重要,我们致力于尽可能地保护用户数据不被披露。」

不过,在这种情况下,他们在咨询律师之后,最终决定履行数据提供的要求,并对此事进行了公开说明。

司法部要求 PSF 提供的数据如下,PSF 官方也对此进行了说明:

1. 姓名(包括订阅者姓名、用户名和昵称)

PSF 表示,“PyPI 在其数据库中有一个元素用户名,该名称是在其中注册的。用户可以更改显示名称,但不会记录 PyPI 的用户显示名称更改历史。”

2. 地址(包括邮寄地址、居住地址、工作地址和电子邮件地址)

PSF 回应道,由于 PyPI 不要求用户注册时填写邮寄或居住地址,因此仅存储用户的电子邮件地址”,仅将电子邮件地址提供给司法部。

3. 连接记录。

PyPI 在索引中保留项目的所有更改记录。这些记录存储在数据库中,并通过 XMLRPC API 发布,用户名和 IP 地址除外。此外,账户创建、电子邮件发送、电子邮件地址更改、登录、登录失败等用户事件的记录也被保留并可以从数据库中检索到。

4. 会话时间和持续时间记录,以及与这些会话相关的临时分配的网络地址(如Internet 协议地址)。

PyPI 提供 session 时间,即登录时间作为数据,但不记录 session 时长。

5. 服务时长(包括开始日期)和使用的服务类型。

PyPI 保留用户账号创建的日期和最后一次成功登录的记录。这些记录集存储在数据库中,是 PyPI 上的私有信息。

6. 电话或设备号码(包括注册 Internet 协议地址)。

每个用户的所有 IP 地址都是共享的。这些是从数据库记录中获取的,并且是 PyPI 私有的。

7. 支付方式和来源(包括任何信用卡或银行账户号码)和账单记录。

PyPI 不设置用户使用费,因此不存在信用卡支付记录或账单记录。

8. 与给定用户名相关的所有 Python 软件包索引(PyPI)上传的记录。

提供了与每个用户名关联的所有项目的列表。这些是从数据库记录中获取的,并且是 PyPI 私有的。

9. 与给定用户名相关的任何 Python 软件包索引(PyPI)上传的 IP 下载日志。

PyPI 不保存包含 IP 地址的包下载日志。下载日志会经过一个处理流程,其中包括由 CDN 报告的 GeoIP 信息,并从 Google BigQuery 公共数据集中获取。

其实,根据公告也不难看出,虽然 PSF 不愿,但是依然还是会将数据提供给司法部门,至于此举会不会引发更多用户对 PyPI 的不信任,以及会带来哪些影响,目前尚未可知。

公告全文详见:

https://blog.pypi.org/posts/2023-05-24-pypi-was-subpoenaed/

相关推荐

编程学子看过来,竞赛刷题网站推荐

2022年编程竞赛已经公布,想要在今年取得竞赛成绩的学生,一定要把握寒假时间,学习知识的同时通过刷题,巩固所学知识,提升解题能力。小编为大家推荐几个刷题网站,想要竞赛的学生一定不要错过。USACO美国...

给大家推荐些好的c语言代码的网站

C语言,那就来推荐几个吧,部分含有C++:1、TheLinuxKernelArchives(kernel.org)Linux内核源码,仅限于C,但内核庞大,不太适合新手;2、redis(redi...

推荐几个编程入门学习网站_比较好的编程自学网站

有一些刚上大学的朋友和想对编程感兴趣的朋友经常会让我推荐学习网站,下面几个是我认为零基础学编程比较好的网站,希望大家都有收获!1.W3schoolhttp://www.w3school.com.c...

10个最值得收藏的编程学习网站_有什么学编程的网站

程序员是一个需要不断学习的职业。幸运的是,在这个互联网时代,知识就在那里,等着我们去获取。以下我列举一些免费的编程学习网站包含多个开发语言Java、php、html、javascript等多个。1、h...

6个超酷的练习算法,学习编程的网站

在不了解算法的前提下,您无法通过Google或Facebook的采访。那么为什么不现在学习。我是一位拥有15年以上经验的程序员。从高中开始的第一年,我在算法上学习和工作很多。在我毕业之前,我一直...

在线 python 编程的网站_python3在线编程,python3在线编译器,在线编辑器

以下是一些提供在线Python编程环境的网站:1.Repl.it:Repl.it提供了一个多语言在线编程平台,您可以使用它在任何地方编写、运行、共享代码。Repl.it支持多种编程语言,包括Pyth...

推荐 7 个能过招全球程序员的编程挑战网站,欢迎挑战!

作为程序员的你,是不是经常估不准自己的编程水平?下面推荐7个能过招全球程序员的编程挑战网站,助你磨练技巧,提升技能,最终问鼎代码江湖!1.HackerRank你可以参加各种编码竞赛,比如算法、数学...

盘点 20 个编程学习教程网站,建议收藏

欢迎关注@程序员柠檬橙私信回复「1024」获取海量编程学习资源!如果你想学习编程,现在互联网这么方便,不用着急报名培训班,有很多高质量的编程学习资源网站可供你学习,程序员日常浏览的技术教程网站有哪些...

Flask 数据可视化_flourish数据可视化

数据可视化是数据处理中的重要部分,前面我们了解了Flask的开发和部署,如何用Flask做数据可视化呢?今天我们来了解一下。Python语言极富表达力,并且拥有众多的数据分析库和框架,是数据...

【python 工具】selenium 浏览器操作

selenium的安装步骤:1.安装selenium,打开cmd控制台pipinstallselenium2.安装驱动程序(我这里安装的是chromedriver),用来启动chrome浏览器...

可视化爬虫工具,EasySpider软件体验

现在提起爬虫,大家可能会联想到Python语言,然后就是各种使用无头浏览器去网页上爬取数据,使用Python的过程相较于使用其他语言来说,简单了不少。但毕竟是编程语言,也需要去学习来适配各种网...

cursor+mcp+playwright,让AI给你推荐五一旅游胜地

阅读本文前提当你已了解mcp是什么,若不知,猛击:https://github.com/modelcontextprotocol/servers。最近有个小需求,根据用户输入内容,使用大模型来理解用户...

Cursor+Claude+Playwright:AI 让自动化测试效率暴涨,快到飞起!

一、引言随着AI时代的到来,软件测试变得越来越复杂,如何高效、准确地进行自动化测试成了每一个开发团队必须面对的问题。在日常工作中,测试工作常常面临各种挑战,比如功能复杂、需求频繁变更、时间紧迫等。传统...

推荐一个检测 JS 内存泄漏的神器_js内存泄漏的几种情况

大家好,我是Echa哥。作为一名Web应用程序开发者,排查和修复JavaScript代码的内存泄漏一直是最困扰我的问题之一。最近,Meta开源了一款检测JavaScript代码内存泄漏...

Python+Playwright自动化实战:高效爬虫全攻略

一、为什么选择Playwright?在信息爆炸的时代,数据获取能力直接决定内容生产效率。Playwright作为微软开源的新型自动化工具,凭借以下优势成为技术创作者的新宠:支持Chromium/Web...