bug全稱
- RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling cublasGemmEx( handle, opa, opb, m, n, k, &falpha, a, CUDA_R_16F, lda, b, CUDA_R_16F, ldb, &fbeta, c, CUDA_R_16F, ldc, CUDA_R_32F, CUBLAS_GEMM_DFALT_TENSOR_OP)
背景描述
ChatGLM3再進(jìn)行模型微調(diào)的時(shí)候,啟動(dòng)報(bào)錯(cuò),環(huán)境是cuda 12.0,torch2.0.1。
解決方案
可以通過(guò)conda創(chuàng)建虛擬環(huán)境,調(diào)整版本cuda 11.8,torch 2.1.0。正常啟動(dòng),問(wèn)題解決。