百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

掌握线性代数: 奇异值分解 (SVD)

itomcoil 2025-08-01 17:48 2 浏览



奇异值分解 (SVD)

什么是 SVD?

奇异值分解是一种矩阵分解方法,它将矩阵 A 分解为三个分量:

哪里:

  • U 是正交矩阵 (m x m)
  • Σ 是包含奇异值 (m x n) 的对角矩阵
  • V^T 是另一个正交矩阵 V (n x n) 的转置

Σ 中的奇异值揭示了矩阵的重要属性,例如其秩,并允许我们执行矩阵近似、噪声过滤和其他数据操作任务。

SVD 的特性

  • 正交矩阵:U 和 V 都是正交矩阵,这意味着它们的列是相互垂直的。
  • 奇异值:Σ 的对角线项是矩阵 A 的奇异值,始终为非负值。
  • 应用: SVD 通常用于机器学习,用于降维 (PCA)、数据压缩和协作过滤。

分步示例:手动计算 SVD

为了更好地理解 SVD,让我们手动计算一个简单的 2x2 矩阵的 SVD。

给定矩阵:

第 1 步:查找特征值和特征向量

计算 “A transpose a” 和 “a A transpose” 的特征值和特征向量

第 2 步:构建 V 和 U

“A 转置 a” 的特征向量形成矩阵 V,“a A 转置”的特征向量形成矩阵 U。

第 3 步:计算 Σ

“A transpose a” 的非零特征值的平方根给出了奇异值,这些值填充了 Σ 的对角线。

最终结果

本手册示例说明了 SVD 如何将矩阵分解为其核心组件,从而揭示其结构和秩。

Python 中的 SVD (NumPy)

Python 的 NumPy 库使计算 SVD 变得容易。以下是使用 numpy.linalg.svd 分解矩阵的方法

import numpy as np

# Define a matrix A
A = np.array([[3, 2], 
              [2, 3]])

# Perform SVD
U, S, Vt = np.linalg.svd(A)

# Display the results
print("U Matrix:\n", U)
print("Singular Values:", S)
print("V Transpose:\n", Vt)

输出:

U Matrix:
 [[-0.70710678 -0.70710678]
 [-0.70710678  0.70710678]]

Singular Values: [5. 1.]

V Transpose:
 [[-0.70710678 -0.70710678]
 [-0.70710678  0.70710678]]

重建原始矩阵

为了验证分解的正确性,我们可以使用 U、Σ 和 V^T 矩阵重建矩阵 A。

# Reconstruct the original matrix A
S_diag = np.diag(S)
A_reconstructed = U @ S_diag @ Vt

print("Reconstructed Matrix A:\n", A_reconstructed)

输出:

Reconstructed Matrix A:
 [[3. 2.]
 [2. 3.]]

这证实了:

SVD 在机器学习中的应用

  1. 降维
  • SVD 用于主成分分析 (PCA) 以降低数据集的维度。通过仅保留最大的奇异值,我们可以压缩数据,同时保留其大部分重要结构。
  • 示例:在高维数据集上应用 SVD 并将其用于图像压缩。

2. 降噪

  • SVD 可以通过消除表示噪声分量的较小奇异值来帮助减少数据集中的噪声。
  • 示例:使用 SVD 对图像进行去噪。

3. 协同过滤

  • 在推荐系统中,SVD 用于分解用户项目矩阵并预测缺失的评级。
  • 示例:Netflix 电影推荐系统。

示例:使用 SVD 进行图像压缩

让我们应用 SVD 来压缩图像。我们将仅保留前 k 个奇异值并重建图像。

# pip install scikit-image

import matplotlib.pyplot as plt
from skimage import data, color
from skimage.io import imshow

# Load a grayscale image
image = color.rgb2gray(data.astronaut())

# Perform SVD
U, S, Vt = np.linalg.svd(image, full_matrices=False)

# Retain the top k singular values
k = 50
S_k = np.zeros((k, k))
np.fill_diagonal(S_k, S[:k])

# Reconstruct the image
compressed_image = U[:, :k] @ S_k @ Vt[:k, :]

# Plot the original and compressed image
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
imshow(image)
plt.title("Original Image")

plt.subplot(1, 2, 2)
imshow(compressed_image)
plt.title(f"Compressed Image (k={k})")
plt.show()

输出:

此代码演示了如何使用 SVD 来减小图像的大小,同时保持大部分视觉信息。

相关推荐

pip 设置镜像源

pip是python必不可少的的包管理工具,但是要在国内用得爽,必须要配置镜像源。我常用的是清华镜像站。pipconfigsetglobal.index-urlhttps://pypi...

定制构建OpenWrt发行版镜像及插件安装包,升级插件到最新版本

最近Tailscale提示OpenWrt路由器上的版本太低,建议升级到最新版本。OpenWrt用的23.05的,因为23.05中带的tailscale版本比较老,之前升级都是从主线版本中下载最新的ta...

第十节 Dockerfile 核心指南:从基础概念到镜像构建实践

一、Dockerfile基础概念(一)本质与作用Dockerfile是用于定义Docker镜像构建流程的文本文件,包含一系列指令和说明,指导Docker引擎生成定制化镜像。其核心价值在于:...

Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置

你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...

Docker-镜像

1、获取镜像在Docker中,获取(下载)镜像通常使用dockerpull命令:基本用法:dockerpull镜像名称[:标签]例如:dockerpullnginx...

第十二节 Ubuntu 系统 Docker 镜像安装与容器运行指南

一、Ubuntu镜像版本选择(一)DockerHub镜像库浏览Ubuntu官方镜像在DockerHub上提供多版本支持,访问地址:https://hub.docker.com/_/ubu...

Docker-使用Dockerfile 定制镜像

一、什么是Dockerfile?Dockerfile是一个文本文件,其中包含一条条构建镜像所需的指令。Docker引擎会按顺序执行这些指令,逐步构建出最终的自定义镜像。二、Dockerfil...

在Windows的WSL环境中本地安装watercrawl和Python3.13

这段时间在折腾Dify环境调用网络爬虫工具去自动化抓取网页信息的功能,就希望在本地Windows11的WSL环境中docker方式部署watercrawl,但每次都报错如下:用命令pip--ver...

1分钟搞定!Python超速工具uv换国内镜像,下载速度飙升10倍

1分钟搞定!Python超速工具uv换国内镜像,下载速度飙升10倍作为搞运维的老手,我太清楚Python包下载速度慢是啥滋味了。今天我来教你用3行代码给uv换上清华或者阿里云的镜像,这样就...

Dockerfile 教程:构建你的第一个自定义镜像!

Dockerfile就是你自定义镜像的“说明书”,学会它,你就能打造属于自己的开发环境、部署环境,甚至可以把你的应用一键打包。一、什么是Dockerfile?Dockerfile是一个文本文件...

提升Python编程效率的10点建议

程序员的时间很宝贵,Python这门语言虽然足够简单、优雅,但并不是说你使用Python编程,效率就一定会高。要想节省时间、提高效率,还是需要注意很多地方的。今天就与大家分享资深Python程序员总结...

掌握线性代数: 奇异值分解 (SVD)

奇异值分解(SVD)什么是SVD?奇异值分解是一种矩阵分解方法,它将矩阵A分解为三个分量:哪里:U是正交矩阵(mxm)Σ是包含奇异值(mxn)的对角矩阵V^T是另一个正交矩...

用 Docker+K8s 部署模型,再也不怕流量暴增和服务器崩溃了

上周朋友公司的AI模型又出问题了——电商大促期间,预测接口突然崩溃,眼睁睁看着订单流失。老板气得拍桌子:“花了几十万训练的模型,连个大促都扛不住?”这其实是很多企业的通病:模型在实验室跑得好好...

Python 图像处理

以前照相从来没有那么容易。现在你只需要一部手机。拍照是免费的,如果我们不考虑手机的费用的话。就在上一代人之前,业余艺术家和真正的艺术家如果拍照非常昂贵,并且每张照片的成本也不是免费的。我们拍照是为了及...

一文让你掌握22个神经网络训练技巧

作者丨匡吉来源丨深蓝学院神经网络训练是一个非常复杂的过程,在这过程中,许多变量之间相互影响,因此我们研究者在这过程中,很难搞清楚这些变量是如何影响神经网络的。而本文给出的众多tips就是让大家,在神经...