当前位置: 首页 > news >正文

深入解析:低秩矩阵、奇异值矩阵和正交矩阵

低秩矩阵

低秩矩阵(Low-rank Matrix)是指秩(rank)远小于其行数和列数的矩阵,即r a n k ( M ) = r ≪ min ⁡ ( m , n ) rank(M) = r \ll \min(m,n)rank(M)=rmin(m,n)。其核心特点是信息冗余性,可经过少量独立基向量(奇异向量)近似表示整个矩阵,从而在数据压缩、去噪和补全等任务中发挥重要作用。

意义

矩阵乘法是大多数机器学习模型的核心计算瓶颈。为了降低计算复杂度,已经出现了许多方法对一组更高效的矩阵进行学习。这些矩阵被称为结构化矩阵,其参数数量和运行时间为次二次函数(对于 ? 维度,其参数数量和运行时间为 ?¹?²º)。结构化矩阵最常见的例子是稀疏矩阵低秩矩阵,以及信号处理中常见的飞快变换(傅里叶变换、切比雪夫变换、正弦/余弦变换、正交多项式)。

核心概念

  1. 秩的定义
    矩阵的秩表示其线性无关的行或列向量的最大数量。若矩阵M ∈ R m × n M \in \mathbb{R}^{m \times n}MRm×n 的秩为 r rr,则存在分解M = U V T M = UV^TM=UVT,其中 U ∈ R m × r U \in \mathbb{R}^{m \times r}URm×rV ∈ R n × r V \in \mathbb{R}^{n \times r}VRn×r,参数总量从m × n m \times nm×n 降至 ( m + n ) × r (m+n) \times r(m+n)×r

  2. SVD与低秩逼近
    奇异值分解(SVD)将矩阵分解为M = U Σ V T M = U\Sigma V^TM=UΣVT,其中 Σ \SigmaΣ为奇异值矩阵。通过保留前k kk个最大奇异值(k ≪ r k \ll rkr),可得到最优低秩近似M k M_kMk(Eckart-Young-Mirsky定理)。

应用场景

  1. 推荐系统
    用户-物品评分矩阵通常低秩,通过矩阵分解(如SVD)挖掘潜在特征,预测缺失值。
  2. 图像处理
    图像矩阵的低秩性可用于去噪(将噪声视为高秩扰动)或修复缺失像素。
  3. 深度学习微调
    LoRA(Low-Rank Adaptation)凭借低秩矩阵调整大模型参数,减少计算量。

示例说明

若矩阵 A = [ 1 2 3 2 4 6 3 6 9 ] A =[123246369]A=123246369,其秩为1,基于所有行均为第一行的倍数。此时A AA 可表示为 U V T UV^TUVT(如 U = [ 1 , 2 , 3 ] T U = [1,2,3]^TU=[1,2,3]TV = [ 1 , 2 , 3 ] V = [1,2,3]V=[1,2,3])。

为什么重要?

奇异值矩阵

奇异值矩阵(Singular Value Matrix)是奇异值分解(SVD)中的核心组成部分,通常记为Σ \SigmaΣ(或 S SS),它是一个对角矩阵,其对角线元素为矩阵的奇异值,按从大到小排列,其余元素为零。以下是详细解析:


1. 定义与数学形式

给定矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n}ARm×n,其奇异值分解为:
A = U Σ V T A = U \Sigma V^TA=UΣVT
其中:


2. 奇异值的性质


3. 计算与示例

计算方法
  • SVD分解:通过数值计算工具(如MATLAB的 svd 或 Python的 numpy.linalg.svd)直接求解。
  • 特征值分解:先计算 A T A A^TAATA的特征值,再取平方根得到奇异值。
示例

若矩阵 A = [ 1 0 1 0 1 0 ] A =[101010]A=[100110],其奇异值分解后Σ \SigmaΣ 可能为:
Σ = [ 1.732 0 0 0 1 0 ] \Sigma =[1.73200010]Σ=[1.73200100]
其中奇异值为1.732 1.7321.7321 11


4. 应用场景


5. 几何意义

奇异值表示矩阵A AA在不同方向上的“缩放因子”。例如,在图像处理中,奇异值越大,对应的特征方向对图像的贡献越大。


总结

奇异值矩阵 Σ \SigmaΣ是SVD的核心,其对角线元素(奇异值)揭示了矩阵的秩、稳定性及关键特征方向。依据控制奇异值的数量,可实现数据降维、去噪等高效操作。

正交矩阵

正交矩阵(Orthogonal Matrix)是线性代数中一类核心的实方阵,其核心特性是转置矩阵等于逆矩阵,即满足 Q T Q = Q Q T = I Q^T Q = Q Q^T = IQTQ=QQT=II II其关键内容:就是为单位矩阵)。以下


1. 定义与性质


2. 分类与例子


3. 应用领域


4. 重要定理


Python示例验证

import numpy as np
Q = np.array([[1/np.sqrt(2
)
, 1/np.sqrt(2
)]
, [-1/np.sqrt(2
)
, 1/np.sqrt(2
)]]
)
print("Q^T Q = \n"
, np.dot(Q.T, Q)
) # 应输出单位矩阵

正交矩阵因其计算高效(逆即转置)和几何保形性,成为数学与工程领域的基石工具。

http://www.zskr.cn/news/16285.html

相关文章:

  • POLIR-Society-Philosophy- Hegels 形而上学System Philosophy Dialectics 系统化哲学辩证法: 自由意志+封闭的绝对精神
  • luogu P8816 [CSP-J 2022] 上升点列 题解
  • 集成测试 maestro-我的第一个flow以及第一次云端测试 - 详解
  • 2025 年生物除臭设备厂家最新推荐排行榜:覆盖污水处理厂 / 垃圾中转站等多场景,助力企业精准挑选优质设备
  • 从理念到沙盘:用悟空博弈模拟器点亮人机共治的曙光
  • Perplexity发布搜索API,驱动下一代AI应用开发
  • 20251005 总结
  • OKR1
  • 钉钉红包性能优化之路 - 实践
  • 2025 --【J+S 二十连测】-- 第二套 总结
  • 如何将 WSL 的 Ubuntu-24.04 迁移到其他电脑 - 详解
  • 题解:Luogu P11976 [KTSC 2021] 通信网络 / communication
  • 弦振动方程
  • 理论构建尝试整理
  • 基于springboot的家政服务预约系统 - 指南
  • 05-springAOP的实现
  • 2048小游戏C++板来啦! - 指南
  • 详细介绍:vue+cesium示例:3Dtiles三维模型高度调整(附源码下载)
  • st表 + 变形的djs (好题
  • 李臻20242817_安全文件传输系统项目报告_第14周 - 指南
  • 33 ACwing 294 Count The Repetitions 题解
  • 11 ACwing 281 Coins 题解
  • 4 ACwing 274 Mobile Service 题解
  • 2 ACwing 272 LCIS 最长公共上升子序列 题解
  • 用 Haxe 实现英文数字验证码识别
  • 差分约束模板
  • QOJ7411 Bitwise Xor
  • 完整教程:SOC-ESP32S3部分:25-HTTP请求
  • 第一次使用Ttpora
  • NKOJ全TJ计划——NP11744