Pytorch

PyTorch 是基于 Python 的科学计算包,目标是两类人群:

使用 GPU 强大的算力对 NumPy 的替代
深度学习研究平台提供了最大化的灵活性和速度

Tensors

Tensors 是类似于 NumPyndarrays ,除此之外, Tensors 还可以被用在 GPU 上用来加快计算。

from __future__ import print_function
import torch

一个未初始化的矩阵被定义,但是在使用之前未包含确定的已知值。当一个未初始化的矩阵被创建时,不管被分配的内存中原来的值是什么都将作为初始值。

构建一个 (5 imes 3) 的未初始化的矩阵:

x = torch.empty(5, 3)
print(x)
tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])

构建一个随机值的矩阵:

x = torch.rand(5, 3)
print(x)
tensor([[0.8347, 0.6374, 0.3601],
        [0.5775, 0.6665, 0.5684],
        [0.5200, 0.1861, 0.0146],
        [0.5582, 0.4759, 0.5131],
        [0.9387, 0.2958, 0.1055]])

构建一个数据类型为 long 值全为 0 的矩阵:

x = torch.zeros(5, 3, dtype=torch.long)
print(x)
tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])

构建一个指定值的张量:

x = torch.tensor([5.5, 3])
print(x)
tensor([5.5000, 3.0000])

或者是创建一个基于已经存在的张量的张量。这个方法将使用输入张量的属性,例如数据类型,但是除非新的值被用户指定

x = x.new_ones(5, 3, dtype=torch.double)  # new_* 方法输入大小
print(x)
x = torch.randn_like(x, dtype=torch.float)  # 将覆盖数据类型
print(x)  # 结果有着相同大小
tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)
tensor([[-0.9017,  1.0312, -1.5354],
        [ 0.2251,  1.0089,  0.0822],
        [-2.0803, -0.0471,  0.3718],
        [ 0.6297,  0.5046, -0.5284],
        [ 0.4292, -0.8012, -0.4899]])

获取它的大小:

print(x.size())
torch.Size([5, 3])

torch.Size 是一个元组,所以它支持元组的所有操作

运算符

有很多的运算符语法。在下面的例子中,我们将看一看加法运算符。

加法:语法 1

y = torch.rand(5, 3)
print(x + y)
tensor([[-0.2456,  1.9013, -0.8082],
        [ 0.9232,  1.2636,  0.7853],
        [-1.0976,  0.6851,  0.7701],
        [ 0.9949,  1.0428,  0.4364],
        [ 0.8808,  0.0351, -0.3826]])

加法:语法 2

print(torch.add(x, y))
tensor([[-0.2456,  1.9013, -0.8082],
        [ 0.9232,  1.2636,  0.7853],
        [-1.0976,  0.6851,  0.7701],
        [ 0.9949,  1.0428,  0.4364],
        [ 0.8808,  0.0351, -0.3826]])

加法:提供一个输出张量作为参数

result = torch.empty(5, 3)
torch.add(x, y, out=result)
print(result)
tensor([[-0.2456,  1.9013, -0.8082],
        [ 0.9232,  1.2636,  0.7853],
        [-1.0976,  0.6851,  0.7701],
        [ 0.9949,  1.0428,  0.4364],
        [ 0.8808,  0.0351, -0.3826]])

加法:in-place

# 将 x 加到 y 上
y.add_(x)
print(y)
tensor([[-0.2456,  1.9013, -0.8082],
        [ 0.9232,  1.2636,  0.7853],
        [-1.0976,  0.6851,  0.7701],
        [ 0.9949,  1.0428,  0.4364],
        [ 0.8808,  0.0351, -0.3826]])

任何一个在原张量的内存上修改(in-place)的运算符都有一个后缀 _ 。举个例子, x.copy_()x.t_() 都将修改在 x 上。

你可以使用标准类 NumPy 的花里胡哨的索引。

print(x[:, 1])
tensor([ 1.0312,  1.0089, -0.0471,  0.5046, -0.8012])

修改维度:如果你想重新修改张量的大小或形状,可以使用 torch.view

x = torch.randn(4, 4)
y = x.view(16)
z = x.view(-1, 8)  # -1 表示根据其它维度自动推断
print(x.size(), y.size(), z.size())
torch.Size([4, 4]) torch.Size([16]) torch.Size([2, 8])

如果你只有一个元素的张量,使用 .item() 可以获得 Python 的数值。

x = torch.randn(1)
print(x)
print(x.item())
tensor([0.9397])
0.9397323131561279

稍后阅读:还有一百多种运算符,包括转置、索引、切片、数学运算符、线性代数、随机数等等,都可以在官方文档中查看。

NumPy 桥

将 Torch 的张量转换成 NumPy 的数组是很容易的,反之亦然。

Torch 的张量和 NumPy 的数组将会共享内存(Torch 的张量在 CPU),改变其中的一个就会改变另一个。

将 Torch 的 Tensor 转换成 NumPy 数组

a = torch.ones(5)
print(a)
tensor([1., 1., 1., 1., 1.])
b = a.numpy()
print(b)
[1. 1. 1. 1. 1.]

观察 NumPy 数组如何改变值。

a.add_(1)
print(a)
print(b)
tensor([2., 2., 2., 2., 2.])
[2. 2. 2. 2. 2.]

将 NumPy 数组转换成 Torch 张量

观察 NumPy 数组的改变,Torch 的 张量自动地随之改变。

import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
np.add(a, 1, out=a)
print(a)
print(b)
[2. 2. 2. 2. 2.]
tensor([2., 2., 2., 2., 2.], dtype=torch.float64)

所有在 CPU 上的张量除了 CharTensor 都支持和 NumPy 的来回转换。

CUDA Tensors

张量可以使用 .to 方法移动到任何一块设备上。

# 将使用 torch.device 对象移动张量在 GPU 上来回进入
if torch.cuda.is_available():
    device = torch.device("cuda")  # 一个 CUDA 设备对象
    y = torch.ones_like(x, device=device)  # 直接创建在 GPU 上
    x = x.to(device)  # 也可以直接使用字符串 .to("cuda")
    z = x + y
    print(z)
    print(z.to("cpu", torch.double))  # .to 方法也可以修改数据类型