百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

mongodb 数据更新性能分析

itomcoil 2025-02-24 16:48 5 浏览

之前的start_time字段是 datetime 类型,后来改成 int 类型的时间戳,因此,需要刷数据库。简单分析一下,update_onebulk_write 的性能差异,测试发现 bulk_write 速度是 update_one 的40倍。此外,mongodb 数据库创建索引,查询更快哦。

  • 7千数据,bulk_write 批量更新耗时7秒,update_one 逐个更新耗时 267秒,相差38倍
  • 3万数据,bulk_write 批量更新耗时33秒,update_one 逐个更新耗时 1214秒,相差37倍

ailx10

1952 次咨询

4.9

网络安全优秀回答者

互联网行业 安全攻防员

去咨询

逐个更新 start_time 字段,从 datetime 类型转为 int 类型

from pymongo import MongoClient
from datetime import datetime

# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client.mydatabase  
collection = db.collectionName 

# 更新文档中的 start_time 字段
for doc in collection.find({"start_time": {"$exists": True}}):
    start_time = doc.get("start_time")
    if isinstance(start_time, datetime):
        # 如果 start_time 是 datetime.datetime 对象,则将其转换为时间戳(毫秒级)
        start_time_timestamp = int(start_time.timestamp() * 1000)
        # 更新文档中的 start_time 字段为时间戳格式(NumberLong格式)
        collection.update_one({"_id": doc["_id"]}, {"$set": {"start_time": start_time_timestamp}})

批量更新 start_time 字段,从 datetime 类型转为 int 类型

from pymongo import MongoClient
from datetime import datetime
from pymongo import UpdateOne

# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client.mydatabase  
collection = db.collectionName 

# 创建批量更新操作列表
bulk_operations = []

# 更新文档中的 start_time 字段
for doc in collection.find({"start_time": {"$exists": True}}):
    start_time = doc.get("start_time")
    if isinstance(start_time, datetime):
        # 如果 start_time 是 datetime.datetime 对象,则将其转换为时间戳(毫秒级)
        start_time_timestamp = int(start_time.timestamp() * 1000)
        # 构造更新操作
        update_operation = UpdateOne({"_id": doc["_id"]}, {"$set": {"start_time": start_time_timestamp}})
        # 添加更新操作到批量更新操作列表中
        bulk_operations.append(update_operation)

# 执行批量更新操作
if bulk_operations:
    collection.bulk_write(bulk_operations)

创建索引,有助于提高性能

from pymongo import MongoClient

# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client.mydatabase
collection = db.collectionName

# 添加字段的索引
collection.create_index([("field_name", 1)])  # 1 表示升序索引,-1 表示降序索引

发布于 2024-04-03 17:42?IP 属地北京

相关推荐

MySql安装与使用

介绍mysql是目前最流行的关系型数据库管理系统,在WEB应用方面MySQL是最好的RDBMS(RelationalDatabaseManagementSystem:关系数据库管理系统)应用软件...

使用AI来搭建一个用户系统,步骤应该是怎样的呢?

我给AI的第一个问题是这样的:创建一个java21+springboot3.4+mysql21的一个用户系统,需要使用JWT,支持多语言,使用swagger,这个用户系统都应该包含哪...

Mysql 8.4数据库安装、新建用户和数据库、表单

1、下载MySQL数据库yuminstall-ywgetperlnet-toolslibtirpc#安装wget和perl、net-tools、libtirpcwgethtt...

介绍如何在 MySQL 中创建新用户并授予权限?

MySQL是一个开源的关系型数据库管理系统,常用于存储和管理大量的结构化数据。在使用MySQL进行数据管理时,为了安全和方便管理,通常需要创建新用户并授予相应的权限。本文将介绍如何在MySQL...

Mysql创建用户和权限管理

MySQL是一个多用户的数据库,最高权限管理者是root用户,它拥有着最高的权限操作。包括select、update、delete、update、grant等操作。如果有其他用户想使用MySQL,那么...

Mysql:创建用户详解

1、创建并授权用户--创建可从任何主机连接的用户CREATEUSER'myuser'@'%'IDENTIFIEDBY'mypassword'...

Python 实现【字符匹配】

defis_match(s,pattern):m,n=len(s),len(pattern)dp=[[False]*(n+1)for_inrange...

Python自动化:openpyxl工作簿、工作表相关操作

新建工作簿、工作表importopenpyxl#创建空白工作簿,会自动生成一个工作表:Sheetwb=openpyxl.Workbook()#新建工作表#create_sheet...

python每日一练之三数排序

概述今天主要分享一个三树排序的实例,大家可以自己测试玩一下~需求输入三个整数x,y,z,请把这三个数由小到大输出。方法一:如果是要练练手就随便找个排序算法实现一下#usr/bin/python#...

Python输出语句print()

Python中的输出语句主要通过内置函数print()实现,它可以灵活输出文本、变量、表达式结果等内容到控制台或其他文件。以下是详细介绍及示例:一、print()基本语法print(*object...

Python设置excel表格格式,这3个属性6个模块,要表格好看

前言:通过前面两篇文章,我们用Python处理excel数据得到了结果并保存了文件。打开文件会发现,文件里表格是没有设置格式的,还需手动调整行高列宽等样式,很麻烦。其实,通过Python库模块,能轻松...

python入门-day5-循环语句

以下是为“Day5:循环语句”设计的详细学习任务计划。这个任务旨在帮助初学者掌握Python中的循环语句(for和while),并通过实践理解它们的应用场景。Day5:循环语句学习目标...

Python基础编程必备!涵盖常见语法与操作的代码示例合集

以下是一份Python基础代码示例合集,涵盖了常见的语法和操作,适合初学者快速掌握基本编程概念:1.基础语法python#打印输出print("Hello,World!")#变...

Python循环语句实用教程

一、循环基础1.while循环基本语法:while条件表达式:循环体代码while循环流程图:应用示例:#简单计数器count=0whilecount<5:...

在 Python 中如何向一个已排序的数组(列表) 中插入一个数呢

在Python中如何向一个已排序的数组(列表)中插入一个数呢?方法有很多种,关键在于原来数组是什么样的排序,用到啥排序方法效率高,就用哪种。我们来练习其中的几种插入方法,另外也掌握下遍历数组的...