在線PDF數(shù)據(jù)處理服務(wù)器搭設(shè):linode + anaconda + jupyter + camelotpy

linode環(huán)境設(shè)置

選擇linode作為VPS服務(wù)提供商。可以在Linode注冊賬號。注冊完成后,登入linode賬號選擇設(shè)立最便宜的linode方案:

  • 1CPU,25G SSD,5$/month。
  • 服務(wù)器所在地選擇新加坡(也可以選擇Fermont或者其他地區(qū))。

選擇建立新的linode節(jié)點。

Create New Linode Node

選擇最新的Ubuntu LTS版本。

選擇最新Ubuntu LTS版本

選擇新加坡為服務(wù)器所在地。

選擇服務(wù)器所在地

選擇最便宜的linode方案:

  • Nanode 1GB = 1CPU+ 25G SSD + 1GB RAM。
  • 5 US$/month。
選擇最便宜的Linode方案

設(shè)定root密碼及ssh public key。

設(shè)定root密碼及ssh public key
  • 參考linode手冊產(chǎn)生RSA Public Key創(chuàng)建ssh public key。
  • 注意:下面的步驟假設(shè)在本地linux機器上產(chǎn)生rsa key pair。
  1. 檢查是否已經(jīng)存在rsa key,如果已經(jīng)存在可以直接使用。
    ls ~/.ssh/id_rsa*.
  2. 如果不存在,可以生成新的key。
    ssh-keygen -b 4096
  3. 跟隨指令建立rsa key,最好選擇一個pass phrase。
  4. 把ssh key 保留下來,準備拷貝到linode vps server上。
  5. 從本地服務(wù)器把本地產(chǎn)生出來的rsa key pair拷貝到遠程服務(wù)器上。
    scp ~/.ssh/id_rsa.pub your_username@192.0.2.0:~/.ssh/authorized_keys

把linode生成的vps服務(wù)器IP地址拷貝下來,在ssh terminal中使用建立連接。

參考截圖中圈出的ssh命令行、IP地址及域名信息。


拷貝生成的Linode服務(wù)器地址

建立管理和運行anaconda環(huán)境的用戶

跟隨以下步驟

  1. 通過root user 建立新用戶
    adduser poweruser
  2. 用新用戶登陸并用sudo更新系統(tǒng)到最新
    sudo apt-get update
  3. 下載最新anaconda package
    點擊查看最新anaconda版本
  4. 此處下載的是201910版
    wget https://repo.anaconda.com/archive/Anaconda3-2019.10-Linux-x86_64.sh
  5. 檢查下載文件完整性
    sha256sum /path/filename
  6. 輸入以下命令以安裝最新的Anaconda for Python 3.7:
    bash ~/Downloads/Anaconda3-2019.10-Linux-x86_64.sh
  7. 把conda的環(huán)境變量加入當前用戶的profile
    source <path to conda>/bin/activate
  8. 初始化conda
    conda init
  9. 設(shè)置在每次啟動shell session時(即用戶登錄時)自動激活conda的環(huán)境
    conda config --set auto_activate_base True

安裝jupyter notebook

跟隨以下步驟設(shè)置:

  1. conda install jupyter notebook
  2. 生成配置文件
    jupyter notebook --generate-config
  3. 使用python中的passwd()創(chuàng)建密碼,終端輸入ipython打開ipython
    ipython
  4. 然后輸入:
    In [1]: from notebook.auth import passwd
    In [2]: passwd()
    Enter password: ******
    Verify password: ******
    Out [2]: 'sha1:...'
  5. 修改jupyter notebook的配置文件
    vim ~/.jupyter/jupyter_notebook_config.py
  6. 在該文件中做如下修改或直接在文件尾端添加:
c.NotebookApp.ip='*' #設(shè)置所有ip皆可訪問
c.NotebookApp.password = u'sha:..'  #之前ipython中Out[2]輸出的密碼
c.NotebookApp.open_browser = False #禁止自動打開瀏覽器
c.NotebookApp.port =8888 #任意指定一個端口```

SSL加密配置

  1. 自己建一個文件夾或者干脆在~/.jupyter/ 文件夾下面執(zhí)行下面命令:
    openssl req -x509 -nodes -days 365 -newkey rsa:2048 -keyout mycert.pem -out mycert.pem
  2. 編輯 jupyter_notebook_config.py
c.NotebookApp.certfile = u'路徑名/mycert.pem' 

安裝處理PDF文件的camelot-py模塊

  1. 首先嘗試conda install
    conda install -c conda-forge camelot-py
  2. 如果不成功,那么換pip
    pip install camelot-py[cv]
  3. 啟動jupyter notebook
    jupyter notebook &
  4. 瀏覽器打開jupyter notebook服務(wù)器指定端口的,開始運行jupyter notebook。
    http://linode_vps_ip:port/
  5. 輸入此前安裝jupyter notebook第3步時設(shè)定的密碼登入。


    Jupyter Notebook Login
  6. 嘗試在jupyter notebook運行camelot import
    In [1]: import camelot
    Jupyter Notebook Runtime
  7. 如果提示有缺失package,那么安裝對應(yīng)的包,一般會缺失下面的包:
    libSM.so.6, opencv等,通過如下命令安裝:
    apt-get update
    apt-get install -y libsm6 libxext6 libxrender-dev
    pip install opencv-python

重新啟動jupyter notebook

jupyter notebook &

如果你覺得有用,不妨贊賞鼓勵一下哦。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容