Python網路爬蟲與大數據師生研習營



開課日期 授課老師 上課地點 報名人數 報名網址
2017/11/03 48 / 45 我 要 報 名

課程目標:

Python 是一種易學、功能強大的程式語言也是快速開發應用的理想語言。在大數據時代中,最具代表性的即是網頁爬蟲、它是從Python開始出發是最好的開始。

Python運用在資料處理技巧,瞭解資料處理的基礎工作,包括資料結構、資料匯入匯出、資料預處理、統計分析、以及探索式資料分析等,課程將透過王品案例示範與操作練習以增進學習效果。

未來,針對AI機器學習實做,使用的 Python 機器學習套件是 scikit-learn,它建構於 NumPy、SciPy 與 matplotlib 之上,是開源套件並可作為商業使用。進行學習監督式學習含分類、迴歸深度學習的類神徑等

課程設計理念

1.      網路技術及HTML

2.      Python 基礎環境建立

3.      Git 版本控制

4.      爬蟲套件功能介紹

5.      基礎/進階爬蟲建構

6.      Webdriver IDE

7.      網頁自動化測試:TDD functional test

8.      OOP爬蟲專案設計

9.      Scrapy framework

10.    PySpider framework

課程對象:

學齡:建議大學、專科以上

基礎技能:

1.      基礎Coding能力 (程式設計1的課程)

2.      基本網頁知識

3.      OOP程式設計

4.      API概念

上課地點及時間與日程表:

上課地點:圖資大樓八樓 8819 電腦教室

上課日期:2017/11/03 - 2017/12/29 每週五下午 1:00 - 5:00
 

課程內容說明

106上學期課日程表:(本日程表視當時進度狀況做彈性微調)

 

重要教學行事曆、課程內容

W7

11

 

 

 

 

3

 

 

基礎簡介、架構介紹、Python環境建立、爬蟲套件(1)。專題:牛刀小試基礎爬蟲

W8

11

 

 

 

 

10

 

 

爬蟲套件(2)、OOP爬蟲架構、Python檔案讀寫。專題:基礎爬蟲框架

W9

11

 

 

 

 

17

 

 

爬蟲套件(3)、資料洗滌、正規表達式、Python資料統計。專題:爬取資料進行分析。

W10

11

 

 

 

 

24

 

 

一般專題教室8905,如要練習操作,請自備筆記型電腦

Selenium介紹。專題:爬自己的網站-網頁自動化測試(TDD)

W11

12

 

 

 

 

1

 

 

Scrapy框架介紹及實戰應用(1)。

W12

12

 

 

 

 

8

 

 

Scrapy框架介紹及實戰綜合應用(2)。

W13

12

 

 

 

 

15

 

 

進階爬蟲-深入暗網。

W14

12

 

 

 

 

22

 

 

大數據資料收集Node.JS

W15

12

 

 

 

 

29

 

 

大數據資料收集Node.JS

 

教學行政業務說明:

上課員必須遵守承辦單位對本課程之各項規定(上課秩序、準時出席與不遲到早退、按時完成作業、測驗……等),對於學習態度不佳或干擾課程進行而情節嚴重者,任課教師有權向系主任報備後予以退訓。 



有任何問題歡迎來信或致電,我們將請專人回覆您!