最近新手小白想要在Python上試試使用gpu運算 但CUDA 一直灌不好
這問題在最近困擾了我快一個月了
在網路上也找不到可以完全幫助我的解法
但在經歷了多次嘗試和重灌之後 終於讓我灌成功了
為了避免大家也跟我一樣灌到快發瘋 特發此文
我先說說 我灌相關程式的流程
安裝Visual Studio => 安裝Anaconda及建立虛擬環境 => 安裝CUDA => 安裝cuDNN => 安裝TensorFlow-gpu及使用GPU
有可能大家安裝的順序稍有不同 但我都會說說每一步的小技巧
你可能在哪邊失敗了 但都可以彌補的
but 如果你只想試試 我解決CUDA安裝失敗的方法有沒有效 可以直接跳到 安裝CUDA 那邊
1.安裝Visual Studio 2017 (或2015 , 看網路上的文章要看CUDA版本的搭配)
這是最新的網址 不過軟公司的常會跑掉 不行的話就自己 估一下載點囉
https://imagine.microsoft.com/zh-tw/Catalog/Product/530
在下來會有這個 安裝的話我想對大家都不是難事
只是記得一定要安裝 C++工具箱就是了(預設好像沒有)
Visual Studio是微軟自己開發的 所以WINDOW下不會遇到啥毛病 只是它套件還蠻多的 沒事不要亂勾....會跑很久.....
有一個小技巧是 安裝的路徑都用預設的
預設的好處是大家裝的路徑都一樣 所以你會遇到的錯誤比較好找人一起討論
2.安裝Anaconda及建立虛擬環境
Anaconda是非常方便的東西 只是有些老手會覺得它太笨重了一些 但對新手小白而言是非常好用的
同樣的載點給你囉~~ 載不到還是自己估一下
https://www.anaconda.com/download/
直接裝Anaconda的好處是.....他連Python都幫你裝好了.......
注意安裝的時候 會有兩個勾勾問你要不要勾 一樣如果你是新手小白的話 就勾吧
因為他會幫你加到環境變數 以後要安裝或開啟一些東西會比較方便
虛擬環境!!這邊很重要 很重要 很重要
因為我有在這邊卡了很久 因為我們在安裝套件的時候 往往Python會好心幫你裝相關的套件
but 那可能不是我想要裝的套件或版本 !! 這樣就會出事阿~~哥
所以新手小白們 我們在測試安裝新東西的時候 請開一個虛擬環境吧
開法如下
左圖是剛登入ANACONDA的地方 圈起來的那裏 點一下
然後點進去就是右圖了 按creat 然後打一個你喜歡的名字 在按creat 這樣就完成囉
3.安裝CUDA(重頭戲)
CUDA的版本會一直更新
我安裝的是9.0版的 一樣 給個載點
https://developer.nvidia.com/cuda-toolkit-archive
下載下來後 通通用預設 如果你灌成功的話 會出現以下畫面
那恭喜你 你是CUDA 安裝勝利組
如果不是 那他就會出現 CUDA 安裝失敗
失敗有很多種啦 但我今天要講的是這個
你可以看到 他是Visual Studio Integration Failed
而其他的則是沒有安裝 所以呢! 我就試試看不要裝 Visual Studio Integration (選自訂安裝 然後把不想裝的勾取消)
神奇的事情發生了 他居然沒跑錯誤訊息!! 也就是我要的他裝進去了
你可以檢查一下 真的有CUDA這個資料夾囉~~~~~
不過事情當然不是新手小白們想的這麼簡單
因為我沒裝Visual Studio Integration 所以當然需要一點彌補
所以在環境變數這邊我加了很多東西
我作業系統是 window10 設環境變數的地方 就直接搜尋就環境變數就好了
將以下路徑新增至PATH中
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\CUPTI\libx64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\demo_suite ##5/22 更新 網友提醒要加這個路徑
還有其他跟NVIDIA有關 和Drivers有關的變數都加進來
就完成了~~~~
小技巧: 剛裝好DUDA的時候你可以進行測試
在CMD裡面打deviceQuery.exe 這可以知道CUDA到底有沒有抓到你的顯卡
4.安裝cuDNN
這應該是整個流程最簡單的步驟了
cuDNN 載點 (下載之前要先註冊)
https://developer.nvidia.com/rdp/cudnn-download
我是載9.0版 沒測過別的
開啟下載檔後將cuda裡的三個資料夾(bin, include, lib) 複製並取代原資料夾
所以說這裏的小技巧就是!!!~~~~~
記得把CUDA裡面本來的這三個檔案 備份起來
這樣裝錯還可以退版XD
5.安裝TensorFlow-gpu及使用GPU
最後一步呢 就是安裝tensorflow_gpu
還記得我們之前有先設了虛擬環境吧
打開你的 Anaconda Prompt
輸入activate ggggg
注: ggggg是我亂取的名 其實就是我剛建立的虛擬環境名稱
輸入pip install tensorflow-gpu==1.7.0 ##5/24 日更新, 目前要裝 1.7.0版的CUDA才可以用
小技巧1 : 你要安裝的是tensorflow-gpu 而不是tensorflow 喔 這兩個有差 如果裝錯的話
我是沒有辦法執行GPU運算的
小技巧2 : 若真的裝錯 那你還是重開一個虛擬環境 然後再重裝吧~~~
最終的試煉~~~~
在下面的這目錄裡面 (我按照自己的電腦找的) 有一個 fully_connected_feed.py 的檔案
C:\ProgramData\Anaconda3\Lib\site-packages\tensorflow\examples\tutorials\mnist
然後再去載一個較GPU-Z的程式 它可以監測GPU有沒有在跑
載點如下
https://www.techpowerup.com/gpuz/
載完之後 執行在CMD下執行: python fully_connented_feed.py
這是tensorflow的一個例子 所以可以用來測試GPU
左邊是還沒跑腳本的情況(沒用GPU) 右邊是有的
你會看到右邊的圖 前兩格好像多了一些東西
那恭喜你!!! 已經成功可以使用GPU幫你運算囉~~~~~~~~~~~~