最近新手小白想要在Python上試試使用gpu運算 但CUDA 一直灌不好

這問題在最近困擾了我快一個月了

在網路上也找不到可以完全幫助我的解法

但在經歷了多次嘗試和重灌之後 終於讓我灌成功了

為了避免大家也跟我一樣灌到快發瘋 特發此文

我先說說 我灌相關程式的流程  

安裝Visual Studio => 安裝Anaconda及建立虛擬環境 => 安裝CUDA => 安裝cuDNN => 安裝TensorFlow-gpu及使用GPU

有可能大家安裝的順序稍有不同 但我都會說說每一步的小技巧 

你可能在哪邊失敗了 但都可以彌補的

but 如果你只想試試 我解決CUDA安裝失敗的方法有沒有效 可以直接跳到 安裝CUDA 那邊

1.安裝Visual Studio 2017 (或2015 , 看網路上的文章要看CUDA版本的搭配) 

這是最新的網址 不過軟公司的常會跑掉 不行的話就自己 估一下載點囉

https://imagine.microsoft.com/zh-tw/Catalog/Product/530

在下來會有這個 安裝的話我想對大家都不是難事

2018-05-15_143348.png

只是記得一定要安裝 C++工具箱就是了(預設好像沒有)

2018-05-15_143348.png

Visual Studio是微軟自己開發的 所以WINDOW下不會遇到啥毛病 只是它套件還蠻多的 沒事不要亂勾....會跑很久.....

有一個小技巧是  安裝的路徑都用預設的 

預設的好處是大家裝的路徑都一樣 所以你會遇到的錯誤比較好找人一起討論 


2.安裝Anaconda及建立虛擬環境

Anaconda是非常方便的東西 只是有些老手會覺得它太笨重了一些 但對新手小白而言是非常好用的

同樣的載點給你囉~~ 載不到還是自己估一下

https://www.anaconda.com/download/

直接裝Anaconda的好處是.....他連Python都幫你裝好了.......

注意安裝的時候 會有兩個勾勾問你要不要勾 一樣如果你是新手小白的話 就勾吧 

因為他會幫你加到環境變數 以後要安裝或開啟一些東西會比較方便 

2018-05-15_143348.png

虛擬環境!!這邊很重要 很重要 很重要 

因為我有在這邊卡了很久  因為我們在安裝套件的時候 往往Python會好心幫你裝相關的套件

but 那可能不是我想要裝的套件或版本 !! 這樣就會出事阿~~哥

所以新手小白們 我們在測試安裝新東西的時候 請開一個虛擬環境吧

開法如下 

左圖是剛登入ANACONDA的地方 圈起來的那裏 點一下

 然後點進去就是右圖了  按creat 然後打一個你喜歡的名字 在按creat  這樣就完成囉

2018-05-15_143348.png2018-05-15_153238.png

 


3.安裝CUDA(重頭戲)

CUDA的版本會一直更新

我安裝的是9.0版的 一樣 給個載點

https://developer.nvidia.com/cuda-toolkit-archive

下載下來後 通通用預設 如果你灌成功的話 會出現以下畫面

那恭喜你  你是CUDA 安裝勝利組

v2-8371ee19e5e554d4f5410594d48026de_r.jpg

如果不是 那他就會出現 CUDA 安裝失敗 

失敗有很多種啦 但我今天要講的是這個

2018-05-15_153238.png

你可以看到 他是Visual Studio Integration Failed

而其他的則是沒有安裝  所以呢! 我就試試看不要裝 Visual Studio Integration (選自訂安裝 然後把不想裝的勾取消)

2114_APt9iF_7R2YENZ.jpg!r1024x0.jpg

神奇的事情發生了 他居然沒跑錯誤訊息!! 也就是我要的他裝進去了

你可以檢查一下 真的有CUDA這個資料夾囉~~~~~

2018-05-15_160056.png

不過事情當然不是新手小白們想的這麼簡單

因為我沒裝Visual Studio Integration 所以當然需要一點彌補

所以在環境變數這邊我加了很多東西

我作業系統是 window10 設環境變數的地方 就直接搜尋就環境變數就好了

將以下路徑新增至PATH中
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\CUPTI\libx64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\demo_suite   ##5/22 更新 網友提醒要加這個路徑

還有其他跟NVIDIA有關 和Drivers有關的變數都加進來

就完成了~~~~

2018-05-15_175514.png

小技巧: 剛裝好DUDA的時候你可以進行測試

在CMD裡面打deviceQuery.exe 這可以知道CUDA到底有沒有抓到你的顯卡

2018-05-15_160056.png

 

 


4.安裝cuDNN

這應該是整個流程最簡單的步驟了

cuDNN 載點 (下載之前要先註冊)

https://developer.nvidia.com/rdp/cudnn-download

 

我是載9.0版 沒測過別的

開啟下載檔後將cuda裡的三個資料夾(bin, include, lib) 複製並取代原資料夾

所以說這裏的小技巧就是!!!~~~~~

記得把CUDA裡面本來的這三個檔案  備份起來

這樣裝錯還可以退版XD

2018-05-15_160056.png

 


5.安裝TensorFlow-gpu及使用GPU

最後一步呢 就是安裝tensorflow_gpu

還記得我們之前有先設了虛擬環境吧

打開你的 Anaconda Prompt

輸入activate ggggg

注: ggggg是我亂取的名  其實就是我剛建立的虛擬環境名稱

輸入pip install tensorflow-gpu==1.7.0  ##5/24 日更新, 目前要裝 1.7.0版的CUDA才可以用

 

小技巧1 : 你要安裝的是tensorflow-gpu 而不是tensorflow 喔 這兩個有差 如果裝錯的話

                我是沒有辦法執行GPU運算的

小技巧2 : 若真的裝錯  那你還是重開一個虛擬環境  然後再重裝吧~~~ 

最終的試煉~~~~

在下面的這目錄裡面 (我按照自己的電腦找的) 有一個 fully_connected_feed.py 的檔案

C:\ProgramData\Anaconda3\Lib\site-packages\tensorflow\examples\tutorials\mnist

然後再去載一個較GPU-Z的程式 它可以監測GPU有沒有在跑

載點如下

https://www.techpowerup.com/gpuz/

載完之後 執行在CMD下執行: python fully_connented_feed.py

這是tensorflow的一個例子 所以可以用來測試GPU

左邊是還沒跑腳本的情況(沒用GPU)  右邊是有的

你會看到右邊的圖 前兩格好像多了一些東西 

那恭喜你!!! 已經成功可以使用GPU幫你運算囉~~~~~~~~~~~~

2018-05-15_143348.png2018-05-15_143348.png

 

 

arrow
arrow
    全站熱搜

    Markjong001 發表在 痞客邦 留言(3) 人氣()