什麼是機器學習(ML)?

探索機器學習是什麼、運作方式,及其如何用於翻轉產業和日常生活。

機器學習的定義

  • 機器學習是一種人工智慧方法,使用演算法和資料模仿人類的思路。

  • 機器學習應變能力強,因此已廣泛採用並快速成長。

  • 視資料與任務的複雜度而定,AI ML 解決方案可以從中等系統擴充為多層神經網絡。

author-image

作者

機器學習是什麼,為什麼重要?

機器學習這種 AI 方法論,用於讓系統透過資料分析與模式辨識的方式完成任務。

機器學習的目標是讓使用 AI ML 模型的系統,在不需要額外的程式設計或其他人為干預的情況下,即可動態回應新資料。這種應變能力結合持續的迭代,讓系統的回應與動作與時俱進。

機器學習應用正快速普及,對諸多產業產生深遠的影響,包括醫療保健教育汽車,以及日常生活與通訊。

傳統機器學習

直到最近為止,機器學習還是依賴資料建模與分析技術,包括迴歸、支援向量、決策樹和其他統計方法。這種方法屬於古典機器學習

在古典機器學習,必須仰賴人類專業知識,從資料集設計和挑選相關特徵,並且將用於將訓練機器學習演算法的資料標記或結構化。

古典機器學習對於結構化的小型資料集格外有效,而且相較於深度學習等進階機器學習方法,運算資源需求通常較低。

古典機器學習的特性之一是它可解釋。這表示開發者通常可以理解 AI 機器學習模型做出某些決策或預測的理由,並且能更輕鬆適時調整參數或流程。

機器學習 vs. 深度學習

較廣泛的機器學習類別還包含現代方法,這類方法較複雜且需要處理大量資料,而且較無法解釋。

深度學習是機器學習的分支,可以針對複雜資料集中的多層次模式建模。深度學習演算法可偵測原始資料中的特徵並加以分類,因此開發者不需要運用人類領域的專業知識,即可識別或標記每個特徵。

深度學習通常需要大量資料,才能獲得良好的效能。這是因為演算法必須識別許多參數並加以分類,而且資料集必須有大量的這些參數,才能訓練模型。具有三層以上的深度學習系統稱為神經網路,因為它們模仿人類神經系統互連的節點。

深度學習模型(尤其是深度神經網路)看似不透明,猶如「黑盒子」,因為演算法極為複雜,難以理解模型究竟如何導出特定決定。稱為可解釋 AI(XAI)的過程和方法,正用於提升深度學習模型決策的透明度,這對於在這些 AI 系統建立信任和問責機制非常重要,對於受監管的產業尤其如此。

機器學習的優勢

機器學習是所有 AI 使用案例的基本元件,其功能正在轉變人們工作、創作和互動的方法,以及企業的運作方式。

機器學習可以促進自動化的個人化的互動,例如聊天機器人和推建系統,協助顧客蒐集資訊,更快根據資訊做出決定。

機器學習將過去需要人為干預的例行性任務自動化,有助於節省時間並提高效率。在許多情況,ML 驅動的流程比人工處理的流程快,也更精確,不僅可以產生更好的結果,還可讓員工轉而投入更具挑戰性與創意的工作,完成這類電腦無法完成的任務。

機器學習也可以用於識別模式與趨勢,偵測異常狀況或預測未來事件。這些功能讓各式各樣的創新解決方案能夠簡化或自訂流程,例如在製造業,或是在能源產業,為規劃提供資訊,根據預測的需求調整電網。

機器學習運作方式

機器學習仰賴統計技術識別資料中的模式,並且據以採取行動,不需人工介入。ML 演算法接受訓練時接觸過相關資料集,可完成特定任務。訓練期間可透過迭代方式將演算法最佳化,改善其預測和決策的準確性。資料的品質和數量,以及演算法的應變能力,是最終 AI 模型成功與否的重要關鍵。

機器學習方法

機器學習有四種主要方法或類型:

 

  • 監督式學習:演算法訓練時使用標記的資料集,意味著每個訓練範例都搭配輸出標記。演算法會學習從輸入資料預測輸出。
  • 非監督式學習:系統在沒有明確指令下輸入無標記的資料。系統必須從資料本身學習模式和結構。
  • 半監督式學習:這種方法同時使用標記和未標記的資料進行訓練。通常,少量的標記資料會與大量未標記的資料配對。
  • 強化學習:演算法會在動態環境中嘗試達成目標時學習。例如駕駛汽車或玩互動式遊戲。系統在探索問題空間的過程中,收到關於其動作的意見反應。

機器學習演算法

機器學習演算法是指用於資料,負責辨識模式、分類和預測的一系列指令。各種機器學習演算法範例如下:

 

  • 線性迴歸:這個演算法根據先前資料點的線性關係預測未來資料點。
  • 邏輯迴歸:這道程序根據獨立變數估計未來資料點的機率。
  • 叢集演算法:這種演算法可根據資料點的相似性將資料點分組。
  • 決策樹︰決策樹使用一系列條件測試將資料分類為不同的子類別。
  • 隨機森林:這個演算法彙總諸多決策樹的回應。

機器學習工具和架構

AI 開發者運用各種工具、框架和預先編寫程式碼的程式庫建立機器學習軟體。機器學習以程式設計語言(例如 Python 和 C++),以及專為統計分析所設計的 R 執行。TensorFlow 和 PyTorch 都是機器學習框架的範例,包含整合成一套的資料庫與工具。

機器學習的使用方式

AI 機器學習用於一系列運算任務中,這些任務太複雜,無法透過明確的規則型演算法管理。這類複雜的應用範例包括語音辨識、電腦視覺、推薦系統和詐騙偵測。

機器學習使用案例

客戶服務
機器學習方法用於簡化和改善客戶服務的各層面,尤其是線上服務供應商。

大型語言模型(LLM)是為瞭解、翻譯和生成類似人類撰寫之語言的深度學習模型,也是支撐語言和文字導向工具(如語音轉文字、語音助理、聊天機器人及生成式 AI(GenAI)應用程式)的基礎動力,協助將客戶服務功能自動化。

線上零售業和服務供應商也部署推薦系統改善客戶服務與互動。推薦系統仰賴機器學習和資料過濾技術,所以能夠根據使用者過去的選擇、意見反應、互動,以及其他個人檔案相似使用者的類似模式,針對使用者想要的內容類型做出正確的預測。

製造
製造業的品質控制系統由電腦視覺輔助,而電腦視覺則仰賴機器學習和深度學習。電腦視覺在許多工業環境解讀視覺資料,以偵測瑕疵與異常、監控流程、加速回應,並且產生寶貴的深入解析,而且經常以近乎即時的方式進行。

金融服務
機器學習方法在金融業銀行業利用模式辨識簡化和改善多種活動,例如詐騙偵測、法規遵循、個人化銀行業務、付款處理,甚至是自動股票交易。

機器人流程自動化(RPA)
AI ML 驅動 RPA,或是將一向由人類完成的例行和重複性任務自動化。各行各業都有許多 RPA 的應用。舉例而言,在辦公室環境中,RPA 解決方案可以填寫表單、移動檔案、處理交易或生成報告。

如何導入機器學習

若要導入機器學習,組織需要有訓練有素的專家團隊,包括:

 

  • 側重於資料準備與模型開發的資料科學家和資料工程師
  • AI 開發者和機器學習工程師,負責撰寫演算法驅動機器學習及處理部署和擴充
  • 領域專家運用專業知識,在訓練、微調與部署後期階段,協助稽核機器學習結果,驗證 AI 模型的準確性

此外,組織需要 AI 硬體,協助訓練及執行機器學習解決方案。

然而,各種機器學習的導入方式隨使用案例而異。舉例來說,大公司可能為了支援業務分析,在資料中心執行機器學習,而零售商店則可能在邊緣伺服器執行機器學習程序。

機器學習的挑戰

部分機器學習解決方案可借助預先訓練模型和開源工具導入。然而,在大多數情況下,即使是最小規模的導入也需要自訂。對於剛剛開始採用 AI 的組織而言,可能也不易招募擁有必要技能的團隊成員。

人員到位後,下一個難題是設計或自訂高效的模型。為了防止過度擬合(即模型對訓練資料的解釋過於精確,無法涵蓋新資料)或欠擬合(即模型過於簡單,無法掌握潛在的資料模式),可能需要經過多次反覆調整。在某些情況,模型需要大量資料,才能提高預測的準確性,而額外資料則可能不易取得,而且代價高昂或耗時。

資料安全性則是另一個挑戰。有些機器學習應用程式,例如推薦系統,仰賴使用者的瀏覽器和購買記錄,以及人口統計資料。多層安全性解決方案,包括運用 AI 的解決方案,有助於保護使用者的隱私和個人資訊,以及組織的機密資料和智慧財產。

新的 AI ML 實作也應符合負責任的 AI 實務,才能確保以安全、值得信賴且符合倫理的方式使用系統。

機器學習的未來

AI 的採用尚處於初期階段。AI ML 與支援技術進步迅速,更便於企業採用,進而為其應用與全球影響力開啟了無限的可能性。機器學習未來可望應用於新的使用案例和新的情境。