五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【ChatGLM3 量化】python 和 C++ 兩種實(shí)現(xiàn)方式

2023-11-04 15:37 作者:AI日日新  | 我要投稿

首先介紹使用python量化的方式:

可在線運(yùn)行的notebook示例:在kaggle網(wǎng)站搜索:chatglm3-int4

第一步先安裝依賴包:

接著下載模型并進(jìn)行在線量化,這里叫在線量化是因?yàn)樗炕曛蟛]有保存量化后的模型:

最后即可使用量化后的模型進(jìn)行提問(wèn):


除了使用python方式外,還有更高效的C++量化推理方式:

可在線運(yùn)行的notebook鏈接:在kaggle網(wǎng)站搜索:chatglm3-cpp

首先需要克隆倉(cāng)庫(kù):(若該網(wǎng)址無(wú)法克隆,可在下一步的模型下載中找到對(duì)應(yīng)的壓縮包)

接著跳轉(zhuǎn)到該項(xiàng)目目錄下:

接著下載已經(jīng)轉(zhuǎn)換好的ggml型號(hào)模型:

然后我們就可以編譯該項(xiàng)目了:

下一步我們使用cpu來(lái)進(jìn)行模型推理:

然后我們考慮使用gpu來(lái)推理,再進(jìn)行一次編譯:(在這里有報(bào)錯(cuò)可以查看文章最后的問(wèn)題解決方案)

編譯完后我們就可以使用gpu來(lái)進(jìn)行推理了,速度有大幅度提升:

最后我們希望使用python包來(lái)調(diào)用C++版本的gpu推理,那么安裝對(duì)應(yīng)的python包:(在這里也常常報(bào)錯(cuò),請(qǐng)文章查看最后的問(wèn)題解決方案)

最終我們就可以使用python體驗(yàn)到快速的推理了:

問(wèn)題解決方案

  1. ?cuBlAS 編譯錯(cuò)誤(Value ‘sm_30‘ is not defined for option ‘gpu-name‘):可能是因?yàn)殡娔X中有安裝重復(fù)的CUDA工具包,需要卸載掉:

2. 提示沒有 CMAKE_CUDA_ARCHITECTURES 參數(shù):在命令行中添加 -DCMAKE_CUDA_ARCHITECTURES 參數(shù),參數(shù)值是一個(gè)數(shù)字,具體的值需要上 N 卡網(wǎng)址查找

3. 找不到對(duì)應(yīng)的CUDA型號(hào),或者CUDA版本不匹配:添加-DCMAKE_CUDA_COMPILER=/usr/local/cuda-12.1/bin/nvcc? 參數(shù),這里注意修改下路徑


【ChatGLM3 量化】python 和 C++ 兩種實(shí)現(xiàn)方式的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
湾仔区| 聂荣县| 米易县| 类乌齐县| 霸州市| 新巴尔虎左旗| 类乌齐县| 静乐县| 察隅县| 霍州市| 仁怀市| 临沭县| 武夷山市| 安达市| 大姚县| 射阳县| 临夏县| 上饶市| 舟曲县| 闽侯县| 通海县| 浮山县| 杭州市| 临颍县| 兴仁县| 天气| 吴江市| 泾川县| 临江市| 安仁县| 云南省| 海淀区| 婺源县| 洪湖市| 尉犁县| 顺平县| 乌审旗| 新巴尔虎右旗| 全椒县| 紫云| 盐山县|