久久伦理二区,九九九九热视频,伊人五月天丁香

發(fā)簡信

zjun3021

6
關(guān)注
0
粉絲
27
文章
29968

字?jǐn)?shù)
1

收獲喜歡
0

總資產(chǎn)

IP屬地：香港

zjun3021

vllm+vllm-ascend本地部署QwQ-32B
1 模型下載可按照此處方法下載預(yù)熱后的模型，速度較快（推薦artget方式）或者從hugging face官方下載。 2 vllm-ascend安裝 2.1 使用vllm...

274 0 0
zjun3021

初識華為RazorAttention
論文原文：https://openreview.net/pdf?id=tkiZQlL04w[https://openreview.net/pdf?id=tkiZQlL04w]...

218 0 0

zjun3021

NPU上如何使能pytorch圖模式
1 Pytorch的compile技術(shù) PyTorch 的 torch.compile 是一個強大的功能，用于優(yōu)化 PyTorch 模型的性能。它通過將 PyTorch 的動...

124 0 0
zjun3021

NPU上運行onnxruntime
1 問題背景在Ascend環(huán)境上，使用onnxruntime推理時，報錯：顯示的是cuda的組件找不到。由于是Ascend環(huán)境，肯定是沒有GPU的，很明顯是onnxrun...

153 0 0
zjun3021

MindIE推理采樣后處理參數(shù)temperature和top_k的引發(fā)的精度問題
背景 MindIE跑Qwen系列模型推理，測試發(fā)現(xiàn)后處理參數(shù)top_k很大，temperature=2的場景，模型輸出有精度問題。現(xiàn)象經(jīng)過進一步復(fù)現(xiàn)和測試，發(fā)現(xiàn)如下現(xiàn)象。...

128 0 0
zjun3021

Ascend+FastAPI+ Uvicorn 實現(xiàn)推理
1、FastAPI & Uvicorn FastAPI FastAPI 是一個用于構(gòu)建 API 的現(xiàn)代、快速（高性能）的 Python Web 框架，專為在 Python 中...

181 0 0
zjun3021

解決Ascend上vllm運行時出現(xiàn)urllib3.exceptions.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED]
背景嘗試使用vllm模型，腳本代碼如下：運行過程中出現(xiàn)：問題分析問題就出現(xiàn)在通過python去下載文件，然后SSL的安全校驗出現(xiàn)了問題。臨時解決辦法是，可以規(guī)避該校驗...

178 0 0

zjun3021

AscendC編程中的double buffer是什么？
執(zhí)行于AI Core上的指令隊列主要包括如下幾類，即： Vector指令隊列（V） Matrix指令隊列（M）存儲移動指令隊列（MTE2、MTE3）。不同指令隊列間的相互...

134 0 0
zjun3021

AscendC從入門到精通系列（五）調(diào)用基于工程開發(fā)AscendC算子
單算子API調(diào)用方式，是指直接調(diào)用單算子API接口，基于C語言的API執(zhí)行算子。算子工程AscendC從入門到精通系列（三）基于自定義算子工程開發(fā)AscendC算子[http...

216 0 0
zjun3021

AscendC從入門到精通系列（四）使用Pybind調(diào)用AscendC算子
如果已經(jīng)通過Ascend C編程語言實現(xiàn)了算子，那該如何通過pybind進行調(diào)用呢？ 1 Pybind調(diào)用介紹通過PyTorch框架進行模型的訓(xùn)練、推理時，會調(diào)用很多算子進...

168 0 0
zjun3021

AscendC從入門到精通系列（三）基于自定義算子工程開發(fā)AscendC算子
本次主要討論下AscendC另外一種開發(fā)流程，基于自定義算子工程的算子開發(fā)。從算子工程創(chuàng)建、代碼編寫、編譯部署到運行驗證的開發(fā)全流程，讓您對算子開發(fā)工程有個宏觀的認(rèn)識，此處我...

177 0 0
zjun3021

AscendC從入門到精通系列（二）基于Kernel直調(diào)開發(fā)AscendC算子
本次主要討論下AscendC算子的開發(fā)流程，基于Kernel直調(diào)工程的算子開發(fā)。 1 AscendC算子開發(fā)的基本流程使用Ascend C完成Add算子核函數(shù)開發(fā)；使用IC...

185 0 0

zjun3021

AscendC從入門到精通系列（一）初步感知AscendC
1 什么是AscendC Ascend C是CANN針對算子開發(fā)場景推出的編程語言，原生支持C和C++標(biāo)準(zhǔn)規(guī)范，兼具開發(fā)效率和運行性能?；贏scend C編寫的算子程序，通...

269 0 0
zjun3021

如何在c++側(cè)編譯運行一個aclnn（AOL）算子？
1 AOL算子庫 CANN（Compute Architecture for Neural Networks）提供了算子加速庫（Ascend Operator Library...

181 0 0
zjun3021

Ascend推理組件MindIE LLM
MindIE LLM是MindIE解決方案下的大語言模型推理組件，基于昇騰硬件提供業(yè)界通用大模型推理能力，同時提供多并發(fā)請求的調(diào)度功能，支持Continuous Batchi...

147 0 0
zjun3021

ATB概念之：算子tiling
1 什么是算子tiling 在計算機科學(xué)和深度學(xué)習(xí)領(lǐng)域，算子 tiling（有時也被稱作操作符 tiling 或者循環(huán) tiling）是一種優(yōu)化技術(shù)，主要用于提高計算效率，尤...

260 0 0
zjun3021

如何使用Ascend的ATB加速庫？
1 前言 Ascend Transformer Boost加速庫（下文簡稱為ATB加速庫）是一款高效、可靠的加速庫，基于華為Ascend AI處理器，專門為Transform...

162 0 0

zjun3021

ATB算子實現(xiàn)原理解讀
1 前言從前文ATB是什么？[https://blog.csdn.net/xyz3120/article/details/143628522?sharetype=blogd...

154 0 0
zjun3021

ATB是什么？
1 ATB介紹 Ascend Transformer Boost加速庫（下文簡稱為ATB加速庫）是一款高效、可靠的加速庫，基于華為Ascend AI處理器，專門為Transf...

252 0 0
zjun3021

Ascend上的PageAttention
1 PageAttention引入的原因 PageAttention的引入主要是為了解決大型語言模型（LLM）在服務(wù)過程中遇到的內(nèi)存管理低效問題，具體原因如下：內(nèi)存碎片化：...

306 0 0

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av