前言
大家好,我是Teresa,前陣子因為一場線上小聚,讓我開始正式接觸機器學習,參與前和參與後都順手寫了一篇文章,連結在此附上,在開始閱讀此篇之前,可以先看看你有沒有理解文章中提到的概念。
機器學習從零開始-簡單認識基礎概念 | Teresa初學者筆記
總之,在這場線上小聚過後,Teresa就決定要更深入的接觸機器學習,於是在Coursera上找了一堂基礎的機器學習線上課程,之後的筆記都會環繞在這堂課上,那就讓我們開始吧!
每一個機器學習的使用者應該要知道什麼?
- 哲學上機器學習的思想
- 數學上的工具
- 演算法的設計
- 它們的使用:包含什麼時候可以使用、為什麼可以使用、如何使用、如何會變得更好
什麼時候可以使用機器學習?
在了解什麼時候可以使用機器學習之前,不妨先思考看看什麼是「學習」?
以人類的角度,學習會從「觀察」出發(通過我們的五感)進而學習「轉化」成一項技巧
因此機器學習便是用電腦做為「學習主體」來「模擬」人類學習的過程
Note:觀察(資料)->機器學習(演算法)->技巧
技巧指的是「增進」某一方面的表現。
結論:機器學習的過程是從資料出發經過電腦的計算最終得到某種表現的增進。
若你想達成上述的目的,便可以使用機器學習。
為什麼要使用機器學習?
當我們遇到一個問題想要用程式解決的時候,有些問題單靠人力試圖將規則一項一項的條列出來是非常困難的。
舉例來說:如何辨識一棵樹?我們很難用語句完整地把每一項樹的特徵描述出來。
因此,我們讓機器透過「觀察」來分析辨識。
機器學習的應用
以下三種狀況,常會使用到機器學習:
- 複雜的計算系統:當我們不了解環境,如:外太空,我們便無法將規則條列化。
- 不容易寫出規則的時候,如:上述提到的例子是機器學習中的視覺辨識。
- 人沒有想過的領域:如:快速的決策或是大量且客製化的服務,都是因為我們無法定義規則
Note:機器學習就像是給電腦釣竿,而非直接給電腦魚吃
機器學習的關鍵
有以下三種要素時,較適合使用機器學習:
- 有淺藏模式與規則:因為表現可以增進、目標可以達成,有指標能夠衡量。
- 不知道如何定義規則時:這就是為什麼我們需要機器學習。
- 有資料時:資料是機器學習的觀察環境。
機器學習的生活應用
- 食:餐廳的衛生狀況
- 衣:個人化穿搭建議
- 住:建築的耗能狀況
- 行:無人駕駛號誌辨識的準確率
- 育:線上教學系統的答題正確率
- 樂:推薦「你可能喜歡的…..」系統
在樂的部分,你可能會好奇機器如何學習到人類的喜好?
將電影的某些特色設計成特徵數字,如:電影類型、演員等
再將電影內容的特徵數字列出來。
上述兩者內積高的話,代表某人對該部電影的喜好程度可能較高。
機器學習案例
接下來要正式進入到機器學習的實際案例了!
顧客申請信用卡時,銀行應不應該發給顧客?
input:x ∈ X,這裡指的是顧客的申請資料
output:y ∈ Y,這裡指的是發卡或不發卡
target function(目標函數):f = X→Y,指的是經過輸入的過程會得到輸出的結果
資料(訓練例子):D = { (x1, y1), (x2, y2),….(xn, yn)},這裡指的是銀行的歷史資料
hypothesis(假說):g: X→Y,觀察資料後,電腦會出現一種假說來讓銀行判斷該不該發卡給客戶
{(xn, yn)} from f -> 機器學習 -> g ∈ H(假說集合)= {hk},判斷依據可能包含年收入條件、負債狀況、工作經歷
A:演算法,後續筆記中會再提到
結論:機器學習會從資料出發,算出一個假說,此假說必須接近目標函數。
機器學習與相關領域的差別
機器學習與資料探勘
機器學習的定義是用資料找出接近目標函數的假說。
資料探勘的定義是用(大量的)資料找出某領域中有趣的事情。
如果這裡指的有趣的事情是從資料中找出假說,那表示資料探勘和機器學習的目標是一致的;
如果這裡指的有趣的事情和假說有關,則機器學習和資料探勘可以互相幫助。
機器學習與人工智慧
人工智慧的目標是期望電腦做出聰明的表現:會預測。
機器學習是實現人工智慧的一種方法。
機器學習與統計
統計的核心是使用資料來推論我們不知道的事情。
假說是推論的結果,但我們不知道假說會是什麼,因此統計的工具也是實現機器學習的方法。
重點回顧
後記
在上課的過程中,Teresa一碰到有點像數學的部分就有一點點頭昏眼花,因為太久沒有接觸數學了,哈哈,但數學在這個領域中會是重要的,所以還是得努力去搞懂,這也是我寫學習筆記的初衷:督促自己和分享知識。
那麼,機器學習EP. 1就到此結束囉~如果喜歡這次的主題,下一篇這裡我們來看看感知器是什麼吧!另外,快樂學程式也在Udemy上上架不同的程式語言,跟我一起走在工程師的路上吧。
如果你的入門還在單打獨鬥,歡迎來到快樂學程式找到志同道合的夥伴,你的自學之路不孤單。