適合本篇閱讀的人: 剛接觸Python 剛入門爬蟲 範例流程: 爬取python Taiwan FB社團,在社團內部自動垂直瀏覽頁面。爬取貼文時間,併計算貼文數量。 https://gist.github.com/dreamline2/6df1c4ff4e00e36404669b1437b45820 第一部分:介紹各種python內建套件模塊 1. Selenium:程序可以直接驅動瀏覽器進行各種網站操作。 2. Webdriver:真實的模擬人對於瀏覽器的操作行為。 3. BeautifulSoup:最主要的功能是從網頁抓取數據。 4. numpy:多維數據集數學函式庫。 5.time:獲取當前的時間,操作時間和日期,從串行讀取時間及格式化時間為字符串。 …
celiaFebruary 18, 2020