fbpx

前言

嗨~我是Teresa,會有這篇筆記的產出是因為 10/29 會有一場蝦皮直播的線上小聚,主題是機器學習,這是 Teresa在正式開始學習Python前不斷重複聽到的應用領域之一,雖然印象很深,但對於這個熱門詞彙可以說是非常陌生,因此在聽蝦皮專家的分享前,想先對機器學習等相關知識架構先做一點基本功課。

活動資訊:https://pse.is/vk4jv

常見三大詞彙之間的關係

圖片來源:技術論壇

機器學習一詞常和人工智慧、深度學習一同出現甚至是混為一談,那三者之間的關係是什麼呢?

如果用一句話來解釋我想會是:「藉由深度學習等演算法技術可以建構出機器學習的手段以達到人工智慧的目的。」

什麼是機器學習Machine Learning?

機器學習通常可以這樣定義:「透過從過往的資料和經驗中學習並找到其運行規則,最後達到人工智慧的方法。」

白話來說機器學習是一種達到人工智慧的手段。透過程式讓電腦能夠從大量資料中學習到一個模式並讓它能對未接收過的資料做預判。

機器學習的根據?

從定義來看,機器學習需要很多過往的資料和經驗,大量資料也就是現在很熱門的話題之一:大數據。

很多時候光靠人力是看不出數據之間有什麼關聯性,數據中可能包含各種現象、事實與數字,但這些事實與數字是不需要提前被整理好的。而這些數據如果被輕易放掉是很可惜的,因此必須將數據轉為資料。

資料是能夠被「客觀」運算的最小單位,可用來作推論與計算。將資料有系統、有邏輯的整理過後就成為資訊,而資訊最後會被轉化成知識。這樣的過程可以被簡單分為五個階段:擷取資料、分析資料、洞察資訊、理解資訊、做決策(知識)。

大數據有4V的特性:

  • 大量Volume:數據量越大,經過轉換所得出的模式越有根據,就如同做實驗時,樣本數越大,在相同的信賴區間下,可信度越高。
  • 快速Variety:數據量大,且蒐集的資訊不斷的被更新,如果處理資料的速度不夠快,所得出的知識也會是過時的。
  • 多樣Velocity:資料的種類是多樣的,可能包含基本資料、數據格式等等。
  • 真實Veracity:不論你所用的技術多先進、過程做得再嚴謹,如果一開始的數據本身就不可信,那做出來的機器學習與得到的人工智慧都是空談,因此資料的真實(確)性是至關重要的。

從大數據演進到人工智慧,可以套用到狀況覺察理論

該理論的五大階段是:察覺→理解→預測→決策→行動(執行)

套用到演進過程:電腦感知器→算法模型(監督、非監督式學習)→目標函式、最佳化→自動化、人機協同

深度學習Deep Learning-機器學習的一種技術

圖片來源:有關機器學習的 5 個問題

在算法模型中所提及的監督式學習Supervised Learning與非監督式學習Unsupervised Learning

兩者皆屬於機器學習(類神經學習)的其中一種方法,兩者最大的差異是訓練資料中是否有標記資料。

  1. 監督式學習比擬為人在學習時,配有一個認真教學的老師,當題目出現,你根據你所認知到的經驗與學習過的知識答出的答案與正解不同時,老師就會告訴你正解與思考路徑,因此不斷去修正你的認知與知識。換成較專業的術語就是Training data並會提供desired output(期望的正解)並會根據機器學習所提出答案之間的落差,來調整鏈結的強度,這些正解需要透過人為的標記。
  2. 非監督式學習,學習樣本只跟輸入資料有關,沒有要求目標(正確解答),與叢聚演算法有關。

想了解更多機器學習的方法可以參考此網站

人工智慧Artificial Intelligence

如同程式語言的命名一般,越接近人類語法的程式語言便被稱做高階語言,人工智慧簡單解釋就是以「人工」編寫的程式去模擬人類的「智慧」行為。

人工智慧其實離我們並不遙遠,它的應用領域很廣,人手一機中的語音辨識功能便是很經典的案例;只要有使用網路便會有廣告投放、演算法推薦的經驗,這些也都屬於人工智慧的範疇。

案例分享

Teresa曾聽過一場講座是將人工智慧應用於紅外線熱影像診斷的研究,會有這樣的研究出現是因為機器都會有維修保養的需求,可以分為修復性維修保養(壞了才修)以及預防性維修保養。

傳統的方式是透過人力定期檢測,不過這樣的缺點會是如果在檢測的週期之間故障的話,沒辦法即時被發現,這樣可能會引發非預期的損失。因此將這樣的檢測轉為影像辨識,透過線上的方式去觀看它的趨勢變化,並預測它是否有要故障的可能,這樣不但可以在耗材耗損前及時更換也能避免上述提到的非預期的損失。

統整上述的需求,只要透過熱影像感測器,可以將資料傳輸到遠端的監測單元(資料庫),並分析資料庫數據分析來預測異常,接著由簡易的程式警告使用者。但要建構資料庫需要先由使用者提供機器資料,例如:機器溫度達到幾度需要發出警告、它常態的溫度為多少等等的。

光靠數據有時候也不足以判別,因此需要再加上影像辨識(數據資料)來教(機器學習)會人工智慧。

最重要的是需要有足夠的影像樣本,但當真實樣本不足的時候,便必須由人工製造樣本(人工經驗認知的瑕疵),如何製造人工瑕疵在這裡就成為了很重要的關鍵。這裡面就包含了很多知識背景,便不在此贅述。

總結

看到這裡,對機器學習等熱門詞彙有沒有一點點基本的概念呢?Python提供了很多機器學習的套件,如果想要了解更多機器學習的在Python上的實際應用,歡迎報名10/29的線上主題小聚,活動是免費的!如果填完報名表單,還會收到直播後的筆記整理~快來聽聽蝦皮的專家會怎麼分享吧!

活動資訊:https://pse.is/vk4jv

如果想追蹤我更多文章的話,可以加入程式小白的 JS Python 學習群的社團,和我還有其他學習夥伴一起討論、交流、互動哦~我們下次見~

 

參考資料

  1. https://medium.com/@drjackeiwong/%E6%95%B8%E6%93%9A%E7%9A%84%E8%BD%89%E6%8F%9B%E5%B7%A5%E7%A8%8B-4ceb17f205cd
  2. https://www.marketersgo.com/market/202007/bigdata-%E5%A4%A7%E6%95%B8%E6%93%9A/#_4V

Leave a Reply