一般分類: 暢銷精選 > 科學科普 > 電腦 
     
    Python網路爬蟲:大數據擷取、清洗、儲存與分析:王者歸...
    編/著者: 洪錦魁
    出版社:深智數位
    出版日期:2019-11-01
    ISBN:9789865501020
    參考分類(CAT):
    參考分類(CIP): 電腦科學

    優惠價:9折,585

    定價:  $650 

    無法訂購
    分享
      買了此商品的人,也買了....
    定價:480 元
    特價:90折!432
     
    定價:450 元
    特價:90折!405
     
    定價:380 元
    特價:85折!323
     
    定價:400 元
    特價:90折!360
     
    定價:660 元
    特價:90折!594
     
      | 內容簡介 |
    內容簡介
      這是一本使用Python從零開始指導讀者的網路爬蟲入門書籍,全書以約350個程式實例,完整解說大數據擷取、清洗、儲存與分析相關知識,下列是本書有關網路爬蟲知識的主要內容。


      # 認識搜尋引擎與網路爬蟲

      # 認識約定成俗的協議robots.txt

      # 從零開始解析HTML網頁

      # 認識與使用Chrome開發人員環境解析網頁

      # 認識Python內建urllib、urllib2模組,同時介紹好用的requests模組

      # 說明lxml模組

      # Selenium模組

      # XPath方法解說

      # css定位網頁元素

      # Cookie觀念

      # 自動填寫表單

      # 使用IP代理服務與實作

      # 偵測IP

      # 更進一步解說更新的模組Requests-HTML

      # 認識適用大型爬蟲框架的Scrapy模組


      在書籍內容,本書設計爬蟲程式探索下列相關網站,讀者可以由不同的網站主題,深入測試自己設計網路爬蟲的能力,以適應未來職場的需求。


      # 金融資訊

      # 股市數據

      # 人力銀行

      # 交友網站

      # 維基網站

      # 主流媒體網站

      # 政府開放數據網站

      # 社群服務網站

      # PTT網站

      # 電影網站

      # 星座網站

      # 小說網站

      # 台灣高鐵

      # 露天拍賣網站

      # httpbin網站

      # python.org網站

      # github.com網站

      # ipstack.com網站API實作

      # Google API實作

      # Facebook API實作


      探索網站成功後,本書也說明下列如何下載或儲存不同資料格式的數據。


      # CSV檔案格式

      # JSON檔案格式

      # XML、Pickle

      # Excel

      # SQLite資料庫


      本書沿襲作者著作的特色,程式實例豐富,相信讀者只要遵循本書內容必定可以在最短時間精通Python網路爬蟲設計。