「機器學習」究竟是什麼?定義、四大類型一次看
機器學習是熱門趨勢,受到各行各業的歡迎。圖:取自123RF
近年來,「機器學習」成為極其火熱的名詞,不僅在科技領域獲得廣泛運用,各行各業也都希望透過相關技術,提供客戶更好的服務體驗,然而「機器學習」的定義究竟是什麼?它主要分為哪些類型?與「人工智慧(AI)」又有什麼樣的關聯?此文將帶領讀者一次了解。
機器學習是人工智慧(AI)的其中一個分支,主要訓練電腦從龐大資料中不斷學習,透過經驗改善而逐步提升預測正確率,並將獲得的資訊運用至當下的情況,藉此做出完善且明智的決策,應用實例像是Netflix會根據用戶過往的喜好,推薦他們可能會喜歡的影片等。
機器學習主要可以分為四大類型,其一是「監督式學習(Supervised Learning)」,所有資料都會事先經過人為標註(label),例如想要教電腦區分蘋果和橘子,就提供電腦100張蘋果和橘子的照片,每張照片都先人工標註好是蘋果或橘子,電腦再依據這些標註好的照片偵測蘋果和橘子各自的特徵,按照這些特徵就能夠辨識出蘋果和橘子並進行預測。這個方式對於人類來說最為費工,對於電腦來說則最為簡單,因此預測正確率也相對高。
其二是「非監督式學習(Unsupervised Learning)」,所有資料都不會事先經過人為標註,而是電腦自行偵測資料特徵並將其分類,若以上述例子而言,就是提供100張水果的照片,但這次不會先標註好哪張是蘋果、哪張是橘子,讓電腦去尋找它們之間特徵的不同,未來以此為依據做出判斷。這個方式對於電腦來說最為困難,因此預測正確率也相對低。
其三是「半監督式學習(Semi-supervised Learning)」,部分資料會事先經過人為標註,電腦依據有標註的資料尋找特徵,再對剩下的資料進行辨識和分類,這是第一、二種方式的結合。若以同樣的例子來說,就是提供100張水果的照片,其中20張先標註好哪張是蘋果、哪張是橘子,電腦依據這20張標註好的照片偵測特徵,再去辨識和分類剩下的80張照片。
其四是「強化式學習(Reinforcement Learning)」,這是非監督式學習的延伸,所有資料同樣不會事先經過人為標註,而是電腦自行偵測資料特徵並將其分類,但與非監督式學習不同的是,當電腦分類不正確時,系統就會告訴電腦這是錯誤的,引導電腦修正並重新辨識,透過每次正確與錯誤的經驗去改善,逐步提升預測正確率,若以同樣的例子來說,就是提供100張未標註的水果照片,當電腦把蘋果辨識為橘子時,系統就會給予電腦錯誤的訊息。
延伸閱讀:
他金融業年薪近百萬想轉科技業 網狂勸退:別有迷思
原文出處:
http://m.myqueenbquilts.com/news/jobns/146205
#機器學習#ML#人工智慧#AI#電腦#預測正確率#資料#標註#辨識#分類
機器學習ML人工智慧AI電腦預測正確率資料標註辨識分類