RTX 5060 配置 PyTorch CUDA 環(huán)境避坑指南:從 CPU 版到 cu132 的踩坑實(shí)錄

對新架構(gòu)的顯卡如50系列,國內(nèi)鏡像沒有pytorch的最新版本,需要進(jìn)入pytorch官網(wǎng):https://pytorch.org/去獲取安裝命令,下載命令:

一、環(huán)境背景

在 Windows 環(huán)境下配置大模型訓(xùn)練環(huán)境,硬件為 NVIDIA GeForce RTX 5060,驅(qū)動版本 595.79,CUDA 版本 13.2。項(xiàng)目基于 Python 3.10 虛擬環(huán)境,需要安裝支持 GPU 加速的 PyTorch。

通過 nvidia-smi 查看顯卡信息如下:

二、問題現(xiàn)象:PyTorch 默認(rèn)安裝的是 CPU 版本

在虛擬環(huán)境中直接通過 pip 安裝 PyTorch 后,驗(yàn)證 CUDA 可用性時(shí)發(fā)現(xiàn):

>>> import torch
>>> torch.cuda.is_available()
False
>>> torch.__version__
'2.12.0+cpu'

關(guān)鍵問題:默認(rèn)安裝的 PyTorch 版本后綴為 +cpu,表示這是純 CPU 版本,完全不支持 GPU 加速。對于 RTX 5060 這類新顯卡,必須安裝對應(yīng) CUDA 版本的 PyTorch。

三、踩坑過程

坑點(diǎn) 1:pip 的 --index-url-i 混用導(dǎo)致失效

初次嘗試安裝時(shí),命令如下:

pip install torch torchvision torchaudio \
  --index-url https://download.pytorch.org/whl/cu132 \
  -i https://mirrors.aliyun.com/pypi/simple/

問題分析-i--index-url 的簡寫)會覆蓋前面的 --index-url 參數(shù)。這導(dǎo)致 pip 實(shí)際使用的是阿里云鏡像源,而非 PyTorch 官方的 cu132 索引源。因此 pip 認(rèn)為 torch 已滿足要求(從阿里云源找到了 CPU 版本),跳過了 CUDA 版本的下載。

輸出日志顯示:

Requirement already satisfied: torch in d:\work\qz-llm-tool\env\lib\site-packages (2.12.0)

此時(shí)雖然指定了 cu132,但實(shí)際安裝的仍是已有的 CPU 版本。

坑點(diǎn) 2:未先卸載 CPU 版本

在混用鏡像源失敗后,系統(tǒng)已存在一個(gè) 2.12.0+cpu 的 torch。后續(xù)即使使用正確的官方索引,pip 也可能因?yàn)榘姹咎栂嗤ㄍ瑸?2.12.0)而不重新安裝 CUDA 版本。

四、正確解決方案

步驟 1:徹底卸載舊版本

pip uninstall torch torchvision -y

步驟 2:使用官方 cu132 索引重新安裝

pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu132

要點(diǎn)說明

  • 僅使用 --index-url 指定 PyTorch 官方 CUDA 13.2 索引源
  • 不要同時(shí)疊加 -i 或其他國內(nèi)鏡像源,避免索引被覆蓋
  • 等待下載完成(torch 約 1.9GB,torchvision 約 8.5MB)

安裝日志顯示成功獲取了 CUDA 版本:


Successfully installed torch-2.12.0+cu132 torchvision-0.27.0+cu132

版本后綴從 +cpu 變?yōu)?+cu132,說明安裝正確。

步驟 3:驗(yàn)證 CUDA 可用性

import torch

print('CUDA可用:', torch.cuda.is_available())
print('版本:', torch.__version__)

輸出:

CUDA可用: True
版本: 2.12.0+cu132

torch.cuda.is_available() 返回 True,GPU 加速已正常啟用。

五、關(guān)鍵經(jīng)驗(yàn)總結(jié)

問題 原因 解決方案
torch.cuda.is_available() 為 False 安裝了 CPU 版本 (+cpu) 卸載后通過官方 CUDA 索引重裝
指定 cu132 但仍裝 CPU 版 -i 覆蓋了 --index-url 只使用 --index-url,不加 -i
版本號相同但不替換 pip 認(rèn)為已滿足 pip uninstall 再重裝
下載速度慢 官方源在海外 可換 PyTorch 國內(nèi)鏡像,但需確保是 cu 索引

六、補(bǔ)充說明:CUDA 版本與顯卡架構(gòu)

RTX 5060 屬于 Blackwell 架構(gòu),計(jì)算能力為 sm_120。本次安裝的 cu132(CUDA 13.2)版本 PyTorch 已包含對該架構(gòu)的支持。

若后續(xù)遇到 sm_120 is not compatible 相關(guān)報(bào)錯(cuò),需確認(rèn):

  1. 驅(qū)動版本是否足夠新(建議 570+)
  2. PyTorch 版本后綴是否為 +cu128+cu132 等 CUDA 版本
  3. 是否使用了 Nightly 版本(如穩(wěn)定版尚未支持新架構(gòu)時(shí))

最終環(huán)境配置確認(rèn)

  • 顯卡:NVIDIA GeForce RTX 5060
  • 驅(qū)動:595.79
  • CUDA:13.2
  • PyTorch:2.12.0+cu132
  • CUDA 可用:? True
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容