【Python 零基础入门】内容补充 4 Numpy 常用函数 通用函数 & 保存加载

  • 概述
  • 通用函数
    • np.sqrt 平方根
    • np.log 对数
    • np.exp 指数
    • np.sin 正弦
  • 点积和叉积
    • np.dot 点积
    • 叉积
  • 矩阵乘法
    • np.matmul
    • @
  • 保存 & 加载
    • np.save 保存单个数组
    • np.savez 保存多个数组
    • np.savez_compressed 保存
    • np.load 加载
    • npy vs npz

概述

Numpy (Numerical Python) 是 Python 编程语言的一个扩展程序库, 支持大量的维度数组与矩阵运算, 并提供了大量的数学函数库. Numpy 利用了多线程数组来存储和处理大型数据集, 从而提供了一个高效的方式来进行数值计算, 特别是对于矩阵预算和线性代数.

通用函数

通用函数 (Ufuncs) 是 numpy 的核心部分. 通用函数提供了快速的元素级运算. 这些函数都是在 C 语言级别编写的, 因此能提供 Python 所不具备的高性能. 通用函数的另一个又是是能够直接读取数据, 避免了在 Python 循环中处理数据的开销.

np.sqrt 平方根

例子:

# 原始数组array = np.array([1, 2, 3])# 平方根sqrt_array = np.sqrt(array)# 调试输出print("原始数组:", array)print("平方根数组:", sqrt_array)

输出结果:

原始数组: [1 2 3]平方根数组: [1. 1.41421356 1.73205081]

np.log 对数

np.log对数组中每个元素计算自然对数 l o ge( X )log_e(X)loge(X)

例子:

# 原始数组array = np.array([1, 2, np.e])# 对数log_array = np.log(array)# 调试输出print("原始数组:", array)print("对数数组:", log_array)

输出结果:

原始数组: [1. 2. 2.71828183]对数数组: [0. 0.69314718 1.]

np.exp 指数

np.exp对数组中每个元素计算自然指数 ex e^xex

例子:

# 原始数组array = np.array([1, 2, 3])# 平方根exp_array = np.exp(array)# 调试输出print("原始数组:", array)print("指数数组:", exp_array)

输出结果:

原始数组: [1 2 3]指数数组: [ 2.718281837.389056120.08553692]

np.sin 正弦

例子:

# 原始数组array = np.array([1, 2, 3])# 正弦 sinsin_array = np.sin(array)# 调试输出print("原始数组:", array)print("正弦数组:", sin_array)

输出结果:

原始数组: [1 2 3]正弦数组: [0.84147098 0.90929743 0.1411200

点积和叉积

np.dot 点积

点积 (Dot Product) 是线性代数中的基本运算. 点积是将两个向量的对应坐标相乘然后求和的运算.

对于两个变量 a 和 b, 他们的点积 a ⋅ b = a1b1+ a2b2+ . . . + anbn a \cdot b = a_1b_1 + a_2b_2 + … + a_nb_nab=a1b1+a2b2++anbn

例子:

# 定义两个向量a = np.array([1, 2])b = np.array([3, 4])# 计算点积dot_result = np.dot(a, b)# 1*3 + 2*4 = 11# 调试输出print("数组 a:", a)print("数组 b:", b)print("点积结果:", dot_result)

输出结果:

数组 a: [1 2]数组 b: [3 4]点积结果: 11

叉积

叉积 (Cross Product) 也是线性代数中的基本运算. 叉积是一个向量运算, 其结果是一个新的向量. 叉积的方向遵循右手定则, 大小等于两个向量构成的平行四边形的面积. 对于三味空间中的两个向量 a 和 b, 它们的叉积是 a × b = ( a2b3− a3b2, a3b1− a1b3, a1b2− a2b1)a \times b = (a_2b_3 – a_3b_2, a_3b_1 – a_1b_3, a_1b_2 – a_2b_1)a×b=(a2b3a3b2,a3b1a1b3,a1b2a2b1)

例子:

# 定义两个三维向量a = np.array([1, 2, 3])b = np.array([4, 5, 6])# 计算叉积cross_result = np.cross(a, b)# 2*6 - 3*5, 3*4 - 1*6, 1*5 - 2*4 = [-3, 6, 3]# 调试输出print("数组 a:", a)print("数组 b:", b)print("叉积结果:", cross_result)

输出结果:

数组 a: [1 2 3]数组 b: [4 5 6]叉积结果: [-36 -3]

矩阵乘法

矩阵乘法 (Matrix Multiplication) 是将 A, B 两个矩阵相乘得到一个新的矩阵 C. 其元素由 A 的行和 B 的列对应的元素相乘然后求和得到.

np.matmul

例子:

# 定义两个矩阵matrix1 = np.array([[1, 2], [3, 4]])matrix2 = np.array([[5, 6], [7, 8]])# 使用 np.matmul 进行矩阵乘法matmul_result = np.matmul(matrix1, matrix2)# 1*5 + 2*7, 1*6 + 2*8 = [19, 22]# 3*5 + 4*7, 3*6 + 4*8 = [43, 50]# 调试输出print("矩阵1:", matrix1, sep="\n")print("矩阵2:", matrix2, sep="\n")print("使用 np.matmul:", matmul_result, sep="\n")

输出结果:

矩阵1:[[1 2] [3 4]]矩阵2:[[5 6] [7 8]]使用 np.matmul:[[19 22] [43 50]]

@

例子:

# 定义两个矩阵matrix1 = np.array([[1, 2], [3, 4]])matrix2 = np.array([[5, 6], [7, 8]])# 使用 @ 运算符进行矩阵乘法operator_result = matrix1 @ matrix2# 1*5 + 2*7, 1*6 + 2*8 = [19, 22]# 3*5 + 4*7, 3*6 + 4*8 = [43, 50]# 调试输出print("矩阵1:", matrix1, sep="\n")print("矩阵2:", matrix2, sep="\n")print("使用 @:", operator_result, sep="\n")

输出结果:

矩阵1:[[1 2] [3 4]]矩阵2:[[5 6] [7 8]]使用 @:[[19 22] [43 50]]

保存 & 加载

在日常编程中, 我们经常需要将 Numpy 数组保存到文件中, 以便日后加载和食用. 下面我们来讲一下如恶化保存和加载 ndarray 对象.

np.save 保存单个数组

np.save将单个 ndarray 保存到一个二进制文件中, 文件扩展名通常为 “.npy”.

例子:

# 创建数组array = np.array([1, 2, 3, 4])# 保存数组np.save("array.npy", array)

np.savez 保存多个数组

np.savez将多个 ndarray 保存到一个二进制文件中, 文件扩展名通常为 “.npy”.

例子:

# 创建数组array1 = np.array([1, 2, 3, 4])array2 = np.array([5, 6, 7, 8])# 保存多个数组np.savez("arrays.npz", array1=array1, array2=array2)

np.savez_compressed 保存

np.savez_compressednp.savez不同, 会对数组进行压缩.

例子:

# 创建数组array1 = np.zeros(30000)array2 = np.ones(30000)# 保存多个数组np.savez("arrays.npz", array1=array1, array2=array2)np.savez_compressed("arrays_compressed.npz", array1=array1, array2=array2)# 查看文件大小arrays_size = os.path.getsize("arrays.npz")arrays_compressed_size = os.path.getsize("arrays_compressed.npz")print("无压缩大小: {} kb".format(arrays_size // 1024))print("压缩大小: {} kb".format(arrays_compressed_size // 1024))

输出结果:

无压缩大小: 469 kb压缩大小: 1 kb

np.load 加载

np.load可以帮助我们加载保存的文件, 加载 “.npy” 和 “.npz” 文件.

加载单个数组:

# 加载单个数组array = np.load("array.npy")print(array)

输出结果:

[1 2 3 4]

加载多个数组:

# 加载多个数组loaded_array = np.load("arrays.npz")array1 = loaded_array["array1"]array2 = loaded_array["array2"]print(array1)print(array2)

输出结果:

[1 2 3 4][5 6 7 8]

npy vs npz

npy 文件:

  • 单个数组: .npy 格式用于保存单个 NumPy 数组
  • 二进制: .npy 是一个二进制文件, 数据以二进制形式存储在文件中. 这样可以更快的读写数据, 并更紧凑的存储, 不会像文件那样占用额外的空间.
  • 无压缩: .npy 文件不提供压缩功能, 保存的文件大小直接对应于数组内容的大小

npz 文件:

  • 多个数组: .npz 格式用于保存多个 NumPy 数组. 通过将数组以关键字参数的形式传递给np.saveznp.savez_compressed函数来实现
  • 压缩: .npz 文件可以选择压缩与否. 使用np.savez时, 数据不会被压缩, 而使用np.savez_compressed函数时, 所有数据都会被压缩. 通过压缩可以显著减少文件的大小, 特别是对于包含大量重复数据的数组