機器學習

機器學習的未來:預測性分析與 AI 的下一步

利用大數據改善預測與行動。

機器學習、資料與預測性分析的未來

  • 機器學習與進階分析可讓原本採用回溯式描述性分析的組織,改為採用前瞻性的自主決策支援。

  • 機器學習與進階分析幾乎可以嘉惠任何產業。凡是需要定期調整大量資料與預測性模型的時候,機器學習都能派上用場。

  • 機器學習提供了競爭優勢,可開發不依賴人類感知、描述、介入或互動的機器,解決新的決策類型。

  • 矛盾的是,機器學習應用程式可取得新型的深入解析,但是相較於其他類型的進階分析,執行成本卻更低。

author-image

作者

1.預測分析的新特點

在現今的經濟環境中,所有業務都正轉變為資料業務。Forrester Consulting 進行的一項研究顯示,98% 的組織表示,分析是推動業務優先事項的重要因素,但利用進階分析或人工智慧的工作負載卻不到 40%。公司行號利用機器學習這個方法,可以從資料挖掘更大的價值,進而增加收益、獲得競爭優勢,以及降低成本。

機器學習是一種預測分析的形式,可讓組織的商業智慧(BI)成熟度更上層樓、擺脫完全依賴側重過去的描述性分析,加入前瞻性的自主決策支援。這項技術已經存在數十年,但是對於新方法與產品的興奮之情,正加速許多公司重新審視它。

以機器學習為基礎的分析解決方案通常即時作業,為 BI 增加了一個全新的特點。雖然舊模型會繼續為高階決策者提供關鍵報告與分析,但即時分析可為「前線」員工提供資訊,以小時為單位改善績效。

機器學習是人工智慧的分支,其系統經過「訓練」,使用專門的演算法,以龐大的資料庫為研究、學習及預測與推薦的基礎。接觸新資料的預測性模型不需要人為介入即可調整,以先前的迭代為學習對象,產生更可靠且可重複的決策與結果。

這種迭代可讓系統在經過時間洗禮之後變得「更聰明」,越來越能發現隱而未現的深入解析、歷史關係與趨勢,並且顯露各方面的新機會,包括購物者偏好、供應鏈最佳化,以及油藏發現。最重要的是,機器學習讓公司行號能利用大數據成就更多,以及採用新功能,例如物聯網分析。

機器學習是目前可用的強大分析技術。許多新的機器學習商業開放原始碼解決方案現已問世,開發者也有豐富的生態系統。貴組織很有可能已經在某方面運用這個方法,例如用於垃圾郵件篩選。擴大機器學習與分析的應用範圍,可讓您更快速回應瞬息萬變的情況,並且從快速成長的資料庫獲得更豐富的價值。

2.預測分析無所不在

以機器學習為基礎的進階分析日益普及,其中一個重要原因是它幾乎可以在每個產業實現商業效益。凡是有需要定期調整的大量資料與預測性模型的地方,機器學習都能派上用場。

為書籍、電影、服裝和其他數十種類別提供推薦,是大家熟知的機器學習實際範例。但是還有許多其他類別。

在零售業,機器學習與 RFID 標記可大幅改善庫存管理。光是追蹤商品的位置就是一大難題,比對實體庫存與帳面庫存也是。有了機器學習,用於解決這些問題的資料,也可以改善產品的展示位置,並且影響客戶行為。舉例來說,為了找到產品,系統可以掃描實體商店是否有放錯位置的庫存,或是識別銷量好的商品,然後將它們移至店內較明顯的位置。

機器學習與語言規則結合時,公司可以掃描社群媒體,確定客戶對自家品牌與產品的看法。它甚至能找到隱而未現的潛在模式,而且可能透露對於特定產品是感到興奮或不滿。

這項技術已經在採用感應器的應用扮演關鍵角色。機器學習對於自動駕駛汽車也至關重要,因為必須即時協調多部感應器的資料,才能確保決策安全無虞。

機器學習可協助分析地理資料,發現模式,更準確預測特定場所成為產生風力或太陽能電力合適地點的可能性。

這些是機器學習諸多實際範例的幾個實例。這項技術經過實證,目前正締造極富價值的成果。

3.獨特的競爭優勢

機器學習比傳統分析更快速容易解決問題及發現深入解析,賦予公司行號競爭優勢。它尤其擅長在三種情況實現價值。

問題的解決方案隨時間改變:透過社群媒體追蹤品牌聲譽就是個好例子。個別平台的人口結構發生變化;新平台出現。這類變化對於使用規則型分析,會對行銷人員造成混亂,而且不得不持續修改,才能向正確的目標族群傳達正確的訊息。相較之下,機器學習模型可輕鬆調整,經年累月提供可靠的結果,並且釋放資源,解決其他問題。

解決方案因情況而異:以醫學界為例,患者的個人或家族史、年齡、性別、生活方式、對特定藥物的過敏反應,以及許多其他因素,都會導致每個情況都不一樣。機器學習可將這所有因素都納入考量,提供個人化的診斷與治療方式,並且將醫療保健資源最佳化。

解決方案超越人類的能力:人有能力識別很多東西,例如聲音、朋友的臉、某些物體等,但可能無法解釋原因。問題在哪呢?變數太多。透過篩選及分類許多實例,機器學習能以客觀的方式學會識別與辨識特定的外部變數,舉例而言,賦予聲音特徵。(音調、音量、泛音等)

開發不仰賴人類感知、描述、介入或互動的機器,可解決新的決策類型,帶來競爭優勢。這項功能為許多領域開創了新機會,包括醫學(癌症篩檢)、製造業(瑕疵評估)與運輸業(使用聲音作為駕駛安全的額外線索)。

4.更快且費用更低

相較於其他分析方法,機器學習為 IT、資料科學家、各行各業團體與組織提供了諸多優勢。

機器學習可靈活彈性處理新資料。規則型系統可以在靜態的情況順利運作,但機器學習在資料不斷變化或持續新增時表現卓越。原因在於機器學習無需持續調校系統,也不需要新增規則,即可獲得預期的效果。這樣一來,既可節省開發時間,還可大幅減少大規模變更的需要。

長期而言,相較於傳統分析,機器學習的人事成本通常較低。當然,公司一開始必須僱用經驗豐富的專家,領域包括機率、統計、機器學習演算法,以及 AI 訓練方法等。但機器學習一旦順利運作,預測模型就可以自行調整,也就是說,為了提高準確度與可靠性調校所需的人力較少。

另一個優勢是可擴充性。機器學習演算法以平行化作業為建構理念,因此可擴充性更佳,最終意味著更快解決業務問題。依賴人類互動的系統也無法擴充。機器學習可儘量減少為了決策而不斷找人問意見的需要。

最後,機器學習應用的執行成本比其他類型的進階分析更低。許多機器學習技術可輕鬆至多部機器,而非單一昂貴的高階平台。

5.開始使用機器學習

順利移轉至機器學習的第一步,就是識別出技術可對哪些業務問題產生明確可衡量的影響。找到合適的專案後,組織必須部署專家,並且選擇合適的技術,指導系統如何思考及行動。其中包括:

監督式學習:系統會先收到範例輸入與輸出,然後負責形成一般的行為規則。範例:各大品牌的推薦系統多半使用監督式學習,以大幅提高建議的關聯性,並且增加銷售量。

半監督式學習:系統通常會收到少量的標記資料(有「正確答案」),以及更大量未標記的資料。這種模式與監督式學習的使用案例相同,但由於資料成本較低,因此成本也較低。預期輸入資料會隨時間變化時,這通常是最佳選擇,例如商品交易、社群媒體,或是天氣相關情況。

無監督式學習:系統可單純檢查資料,尋找結構與模式。無監督式學習可用於找出原本隱而未現的模式,例如可驅動產品展示方式調整,進而帶動銷售量的店內購買行為。

強化式學習:這種方法將系統置於不斷變化的互動式環境,在被指派工作時,以「懲罰」與「獎勵」的形式提供意見反應。這項技術已成功運用於訓練工廠機器人識別物體。

無論您的計畫為何,組織有效利用機器學習進行分析的進展,取決於能否掌握這些基礎實務。

6.Intel:強大的處理器只是起點

Intel 可協助公司讓機器學習在需要高速效能的真實使用情境應用發揮效用。方法是採用系統方法,包含處理器、最佳化的軟體與開發者支援,以及龐大的產業合作夥伴生態系統。

機器學習需要強大的運算能力。Intel® Xeon® 處理器提供可擴充的基準線,而 Intel® Xeon Phi™ 處理器則是專為機器學習常見的高度平行工作負載而設計,符合機器學習的記憶體與網狀架構(網路)需求。Intel 硬體技術還採用可程式化的固定加速器、記憶體、儲存裝置與網路功能。

此外,Intel 提供的軟體支援,可讓 IT 組織以有效且高效的方式從業務問題轉向解決方案。這類支援包括:

  • 採用經過 Intel Xeon 處理器最佳化建置區塊的程式庫和語言。其中包含 Intel® 數學核心程式與 Intel® Data Analytics Acceleration Library (Intel® DAAL),以及 Intel Distribution for Python*。
  • 簡化開發的最佳化架構,包括 Apache Spark*、Caffe*、 Torch* 與 TensorFlow*。Intel 可支援開放原始碼與商業軟體,讓公司可以在最新處理器與系統功能一上市就使用這些功能。
  • 軟體開發套件(SDK),包括 Intel® Nervana™ 技術、TAP 與 Intel® Deep Learning SDK。這提供了一套應用程式介面,讓開發者可以立即利用最優異的機器學習演算法。

在最佳化方面,Intel 採用多種方法。包括指導客戶與廠商合作夥伴,如何讓機器學習程式碼在 Intel 硬體加速執行,以及在晶片實作幾種學習功能,因為這個作法一向更快。

最後,Intel 工程師經常在現場與 IT 和業務單位經理溝通,深入瞭解以機器學習為基礎的預測性分析,可以如何解決真實使用情境的業務問題。