Puppeteer 應用容器化

Puppeteer 應用容器化

Intro

Puppeteer是谷歌官方出品的一個通過DevTools協(xié)議控制headless Chrome的Node庫??梢酝ㄟ^Puppeteer的提供的api直接控制Chrome模擬大部分用戶操作來進行UI Test或者作為爬蟲訪問頁面來收集數(shù)據(jù)。
更多的介紹,可以參考這里

項目中使用到了 Puppeteer 來做一些爬蟲項目,最后需要把應用容器化部署在 docker 上,于是就有了這篇文章。

自定義 docker image

谷歌官方還沒有推出一個官方的 docker 鏡像,Github上有一個 issue,有需要的話可以關(guān)注下,但是官方有一個 dockerfile 示例

參見官方文檔: https://github.com/GoogleChrome/puppeteer/blob/master/docs/troubleshooting.md#running-puppeteer-in-docker

于是自己在官方的 dockerfile 基礎(chǔ)上加以修改,制作了一個 image,docker hub 鏡像地址:https://hub.docker.com/r/weihanli/puppeteer/

Dockerfile 內(nèi)容詳見: https://github.com/WeihanLi/docker-env/blob/master/docker-puppeteer/Dockerfile

怎么使用

  • 在 docker-compose 中使用

    示例 docker-compose 文件:

    version: '2'
    services:
      puppeteer-crawler:
        image: weihanli/puppeteer:latest
        container_name:  puppeteer-crawler
        ports:
          - 10240:3000
        volumes:
          - ./src:/app
    

    我的項目結(jié)構(gòu)是這樣的

    - src (具體的項目代碼)
    Dockerfile
    docker-compose.yml
    
  • 基于此鏡像構(gòu)建新的鏡像

    示例 Dockerfile:

    FROM weihanli/puppeteer:latest
    
    COPY --chown=pptruser:pptruser ./src .
    
    EXPOSE 3000
    

    這里指定了 --chown=pptruser:pptruser 是因為官方建議不用使用 root 用戶,新建了一個 pptruser 的用戶組以及用戶,使用pptruser這個用戶去執(zhí)行要執(zhí)行的代碼,這里是為了防止出現(xiàn)用戶權(quán)限相關(guān)問題。

如果可以使用 docker-compose 的話,建議還是使用 docker-compose

docker 鏡像啟動之后默認執(zhí)行的命令是 yarn start,你只需要在 app 目錄下可以執(zhí)行 npm run start 或者 yarn start 都是可以的,當然你也可以自定義要執(zhí)行的命令來覆蓋默認的 Command 命令

Reference

End

最后如果你在考慮容器化一個 Puppeteer 應用,希望你可以使用這個鏡像,如果有什么問題也歡迎和我聯(lián)系,我會盡我所能去解決問題。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容