適用對象:在做機器學習/數(shù)據(jù)科學相關(guān)事情,不用online Jupyter,堅持在本地搭建環(huán)境的人..
在過去的一段時間,我一直在研究數(shù)據(jù)科學包括深度學習的相關(guān)內(nèi)容。然而需要學習的知識似乎并不總是像你期望的那樣順利。
目前這個領(lǐng)域最常見的編程語言和事實上的標準是Python和R。
與任何其他編程語言和工具一樣,總是需要學習和熟悉的眾多工具和框架,以便充分利用它們。
你可以花費和浪費無數(shù)時間來學習如何安裝和配置各種數(shù)據(jù)科學包,如Numpy,Matplotlib,TensorFlow等,試圖解決各種包依賴關(guān)系。
如果你遇到Anaconda,它會成為你最好的朋友,因為它會幫你減輕入門的挫敗感。
Anaconda發(fā)行版附帶1000多個數(shù)據(jù)包,包括 conda和虛擬環(huán)境管理器。
在這篇文章中,我們將探討如何使用Anaconda安裝Jupyter Notebook并開始使用Tensorflow和Keras來開始深度學習。Jupyter Notebook非常有助于您熟悉數(shù)據(jù)科學項目中想要實現(xiàn)的任何內(nèi)容。并幫你再AI時代脫穎而出(可以參考《分享你的Jupyter Notebook,在AI時代脫穎而出》)。
一個小問題
雖然大家都覺得Anaconda很好,但是,一個個小問題:
目前官網(wǎng)最新的Anaconda是集成Python 3.7的環(huán)境,注意是
Python 3.7。而Python 3.7和當前最新的TensorFlow 穩(wěn)定版是不兼容的!
所以這里我將以今天新鮮出爐的經(jīng)驗分享于你,
介紹如何在集成Python 3.7的Anaconda安裝Python 3.6和TensorFlow-GPU。
電腦配置(供參考)
這里是我的電腦配置,供參考。
當然這只是一個入門級的配置。
- Windows 10 Pro (Version 1803)
- Intel(R) Core(TM) i7-8700 CPU @ 3.20 GHz (6核心/12超線程)
- 16 GB Memory
- 1 TB Hard Disk
- NVIDIA GeForce GTX 1070
下面進入正題,建議按照這個順序來安裝是比較合理的。
一、創(chuàng)建Python 3.6環(huán)境
右鍵管理員啟動anaconda Prompt
創(chuàng)建python36這個環(huán)境:
conda create --name python36 python=3.6
進入python36這個環(huán)境
conda activate python36
如果有需要回到 Python 3.7
如下:
conda deactivate
二、安裝 tensorflow-gpu
確認已經(jīng)安裝顯卡驅(qū)動
如果沒裝,請先到NVIDIA官網(wǎng)下載(本文是針對NVIDIA顯卡,如果是Intel或者AMD顯卡,請先哭一會...)
開始裝TensorFlow-gpu
先確保是在python36這個環(huán)境下:
conda activate python36
開始安裝:
conda install tensorflow-gpu
需要裝很多文件的,如果網(wǎng)速慢的話,估計需要幾十分鐘到幾小時的。請耐心,這個沒法,獲取去找一個更好的源(已經(jīng)超出本文范圍..)
檢查TensorFlow是否已安裝好
在python36里,進入python,然后輸入:
import tensorflow as tf
hello = tf.constant('Hello , Tensorflow! ')
sess = tf.Session()
print(sess.run(hello))
預期輸出
b'Hello , Tensorflow! '
如果OK就對啦,當然,你可以能回到如下問題:
遇到mkl_intel_thread.dll無法找到的問題
解決辦法(這也是Anaconda官方推薦的方案):
在conda prompt:
conda update python
再一次,需要裝很多文件的,如果網(wǎng)速慢的話,估計需要幾十分鐘。
設(shè)置環(huán)境變量的值(可以在conda prompt設(shè)置,但下次就無效了;如需永久,在電腦環(huán)境變量設(shè)置)
set CONDA_DLL_SEARCH_MODIFICATION_ENABLE = 1
Disable GPU的Log信息
可能會有一堆的Warning,例如
2019-03-07 17:25:51.878252: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX AVX2
2019-03-07 17:25:52.221768: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1432] Found device 0 with properties:
name: GeForce GTX 1070 major: 6 minor: 1 memoryClockRate(GHz): 1.683
pciBusID: 0000:01:00.0
totalMemory: 8.00GiB freeMemory: 6.64GiB
2019-03-07 17:25:52.227274: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1511] Adding visible gpu devices: 0
2019-03-07 17:25:52.655576: I tensorflow/core/common_runtime/gpu/gpu_device.cc:982] Device interconnect StreamExecutor with strength 1 edge matrix:
2019-03-07 17:25:52.658983: I tensorflow/core/common_runtime/gpu/gpu_device.cc:988] 0
2019-03-07 17:25:52.660728: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1001] 0: N
2019-03-07 17:25:52.662681: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1115] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 6396 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1070, pci bus id: 0000:01:00.0, compute capability: 6.1)
解決辦法:
在Python Code前設(shè)置log等級:
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
查看TensorFlow和Keras版本:
import tensorflow as tf
from tensorflow.keras import layers
print(tf.VERSION)
print(tf.keras.__version__)
輸出
1.12.0
2.1.6-tf
三、配置Jupyter Notebook
進入python36:
conda activate python36
需要先安裝ipykernel
命令如下:
conda install ipykernel
python -m ipykernel install --user --name python36 --display-name "Python (Python 3.6)"
輸出:
Installed kernelspec python36 in C:\Users\***\AppData\Roaming\jupyter\kernels\python36
修改Jupyter的根目錄
Jupyter個根目錄默認在當前用戶的Home路徑。
這里示例將其改為D:\Jupyter路徑
找到Jupyter Notebook的啟動快捷方式,默認路徑在:
C:\Users\******\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Anaconda3 (64-bit)
找到它的屬性 -> 快捷方式,默認為(這里我是將Anaconda3安裝在了D盤的根目錄的):
D:\Anaconda3\python.exe D:\Anaconda3\cwp.py D:\Anaconda3 D:\Anaconda3\python.exe D:\Anaconda3\Scripts\jupyter-notebook-script.py %USERPROFILE%
把里面的%USERPROFILE% 替換為 D:\Jupyter,即可。
以后再通過Jupyter Notebook的快捷方式啟動,根目錄就在D:\Jupyter了。
四、配置PyCharm
雖說有了Jupyter Notebook,已經(jīng)可以很方便的調(diào)試和查看Code,但是對于大一點的程序,還是直接在PyCharm里面編寫比較方便。
- 在PyCharm中新建Project
- 在“Project Interpreter”中選擇“Existing interpreter”
- 選擇Python36這個路徑下的python.exe作為interpreter
當然,除了PyCharm還有很多其他Python IDE是很推薦的,可以看這篇《推薦AI必備語言Python的幾款I(lǐng)DE》。
在PyCharm中測試一下
創(chuàng)建一個.py文件,還是用TensorFlow的例子,當然這次高級一點,來比較一下CPU和GPU的時間差異:
import tensorflow as tf
import timeit
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
# See https://www.tensorflow.org/tutorials/using_gpu#allowing_gpu_memory_growth
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
with tf.device('/cpu:0'):
random_image_cpu = tf.random_normal((100, 1000, 100, 3))
net_cpu = tf.layers.conv2d(random_image_cpu, 32, 7)
net_cpu = tf.reduce_sum(net_cpu)
with tf.device('/gpu:0'):
random_image_gpu = tf.random_normal((100, 1000, 100, 3))
net_gpu = tf.layers.conv2d(random_image_gpu, 32, 7)
net_gpu = tf.reduce_sum(net_gpu)
sess = tf.Session(config=config)
# Test execution once to detect errors early.
try:
sess.run(tf.global_variables_initializer())
except tf.errors.InvalidArgumentError:
print(
'如果出了這個Error表示GPU配置不成功!\n\n')
raise
def cpu():
sess.run(net_cpu)
def gpu():
sess.run(net_gpu)
# Runs the op several times.
print('Time (s) to convolve 32x7x7x3 filter over random 100x1000x100x3 images '
'(batch x height x width x channel). Sum of ten runs.')
print('CPU (s):')
cpu_time = timeit.timeit('cpu()', number=10, setup="from __main__ import cpu")
print(cpu_time)
print('GPU (s):')
gpu_time = timeit.timeit('gpu()', number=10, setup="from __main__ import gpu")
print(gpu_time)
print('GPU speedup over CPU: {}x'.format(int(cpu_time / gpu_time)))
sess.close()
輸出:
Time (s) to convolve 32x7x7x3 filter over random 100x1000x100x3 images (batch x height x width x channel). Sum of ten runs.
CPU (s):
25.24234085335886
GPU (s):
1.5711942943447745
GPU speedup over CPU: 16x
不錯~ 這個GPU和6個i7的CPU相比快了16倍??!
總結(jié)
為了安裝使用TensorFlow-GPU,Anaconda提供簡單、快速的安裝方式。非常推薦!
最后,工具是前提,配置好了之后還是要更多的專注在算法、模型和原理上。
- 推薦機器學習和深度學習的書單 《人工智能2018 深度學習最佳書單》
- Kaggle比賽入門:如何在Kaggle排行榜取得好成績——Kaggle新人參加Digit Recognition的經(jīng)歷