什麼是電腦視覺?
電腦視覺這種 AI 能訓練電腦模擬人類視覺、理解所見,並依據經處理與分析的資訊採取行動。採用電腦視覺的組織可達成各種業務成果,包括簡化流程、改善效能、提升顧客體驗,以及在市場中脫穎而出。
電腦視覺通常用於耗時、容易出錯,或是人類幾乎不可能完成的任務,例如缺陷和異常辨識與分類、機器狀況監控、自動化醫療影像分析以及疾病偵測。這類任務需要組織從多個接觸點監控作業、流程或業務其他部分,從而建立大量收集的視覺資料,必須近乎即時從中擷取深入解析,並據此採取行動。
電腦視覺的使用
電腦視覺系統利用機器學習和深度學習模型,訓練系統辨識影像或影片各種元素,並對此做出預測。電腦視覺模型的類型包括:
- 影像分類,用於檢查影像,然後根據內容為它指派分類標籤。舉例來說,影像分類模型可用於預測哪些影像內有狗、貓或憤怒的顧客。
- 影像分割,用於辨識物件,以及從背景擷取物件,例如將 X 光結果中的腫瘤與周圍的腦組織分離。
- 物件偵測,用於掃描影像或影片,以及尋找目標物件。物件偵測模型通常會同時醒目提示多個物件,可用於處理各種工作,例如辨識貨架上的商品,改善庫存管理,或是識別生產線物品的異常狀況。
- 物件追蹤,用於追蹤在環境中移動的偵測物件。例如,物件追蹤可用於自動駕駛中,追蹤人行道上或正在過馬路的行人。
- 特徵萃取,用於將影像或影片擷取到的實用特徵分離,然後用第二種 AI 演算法分享,例如搜尋與擷取影像比對。舉例來說,特徵萃取可用於自動化交通監控與事故偵測。
- 光學字元辨識,用於從影像中擷取並轉換文字為機器可讀的格式。這項技術經常用於銀行業和醫療保健領域,處理重要文件與病患紀錄。
各行各業的電腦視覺應用
電腦視覺實現各種全新使用案例,協助各行各業的公司降低營運成本、策進業務自動化,以及創造新的服務或收益來源。以下是採用電腦視覺的主要產業,及其中應用這項技術的精彩方式。
工業自動化與製造
製造商利用電腦視覺促進自動化,有助於提升製程效率、減少人為錯誤、增強員工安全性,並以更低的成本實現更高的產量。電腦視覺在製造業的常見應用包括:
- 自動產品檢驗:視覺產品檢驗對品質控制至關重要。透過利用生產線攝影機、缺陷分類與異常偵測 AI 模型以及邊緣運算來自動化光學檢測,製造商可以提升品質保證的準確度與速度。
- 安全監控:電腦視覺可用於監控廠房,協助確保員工安全。舉例來說,分析即時影片可協助辨識並提醒人員事故、洩漏,或是偵測進入限制危險區域的行為。
醫療
從預防照護到癌症治療規劃,醫療保健機構以各種方式利用電腦視覺技術,協助改善病患療效、提高準確性、加速疾病偵測等。電腦視覺在醫療保健領域的應用範例包括:
- 醫療影像:為斷層掃瞄器、X 光系統、內視鏡攝影機和其他醫學影像技術配備電腦視覺系統,有助於快速處理大量資料、簡化工作流程,並實現準確高效的影像評估。深度學習技術應用於輔助病理學的全切片影像。
- 遠端病患監控:搭載電腦視覺應用程式的攝影機與感應器可用於收集和分析病患的動作資料,例如步態或身體姿勢,辨識標準偏差的情況,並提醒照護團隊人員可能的緊急需求。
零售
從瞭解產品擺放位置、補貨庫存的最佳時機,到店內顧客行為追蹤,電腦視覺可以協助零售商發掘營運中有力的深入解析,從而做出更明智的業務決策。電腦視覺在零售業的應用包括:
- 預防損失:電腦視覺可分析現有店內攝影機或自助結帳機的資料,辨識可疑行為並向管理人員發出即時警報,以便進行介入,協助防止欺詐行為。
- 非接觸自助式結帳終端機:零售商如欲希望提升效率並增強顧客體驗,可利用 3D 智慧掃描技術和電腦視覺模型擷取、偵測及辨識無條碼的食品,實現快捷便利的結帳,並將人員介入降至最低。
智慧城市
智慧城市技術有助收集街道攝影機影片內容的資料,讓城市領導者做出更明智的營運決策,協助改善市民安全、交通便利性與生活品質。以下是電腦視覺在智慧城市中的幾種應用方式:
- 交通管理:市政府可採用電腦視覺系統,監控和分析街道十字路口與交通模式,並偵測及追蹤車輛和行人,最佳化交通流量並且提升十字路口的安全性。
- 基礎設施維護:電腦視覺可用於訓練,辨識整個縣市的道路和橋樑問題,例如坑洞或路面裂縫,並通知維修人員需要維護的地點。
電腦視覺運作方式
電腦視覺結合邊緣運算、雲端運算、軟體和 AI 深度學習模型,讓電腦「觀看」攝影機與影片的資料,快速辨識特定物件、人群及模式並對此做出預測,必要時可採取行動。
卷積神經網路的作用
電腦視覺系統利用演算法家族中稱作卷積神經網路(CNN)的深度學習模型,指導影像處理與分析。這些深度學習模型分析數位影像像素內嵌的 RGB 值,偵測可識別的模式。可以開發 CNN 根據各種功能(包括色彩分佈、形狀、紋理和深度)評估像素,從而準確辨識及分類物件。
訓練電腦視覺模型
在電腦視覺系統投入運作前,資料科學家與開發者必須針對特定使用案例訓練系統的深度學習模型。過程需要輸入大量特定應用資料,使模型能夠辨識開發目標的對象。舉例來說,如果電腦視覺應用程式專為辨識狗而設計,模型必須先學習狗的外觀。利用數千甚至數百萬張不同品種、大小、顏色和特徵狗的影像來訓練,模型得以實現這項功能。
訓練通常在資料中心或雲端環境中進行。特別複雜的訓練計畫可以應用 GPU 和 AI 加速器加速流程,並更妥善處理增加的涉及參數數量。模型完成訓練階段後,就具備了解讀和推斷數位影像資訊所需的知識。模型也可能隨著時間近一步微調或重新訓練。
同時值得注意的是,如果希望打造電腦視覺解決方案,也可以利用現成的基礎模型作為微調的起點,加速開發時間,避免從頭開始。
部署電腦視覺模型
電腦視覺模型訓練後即可部署至電腦系統,進行推斷以及解讀現場狀況,持續評估影像和影片資料來擷取深入解析和資訊。雖然電腦視覺解決方案可在雲端或資料中心執行推斷工作負載,但現今許多組織都在探索邊緣 AI 應用程式,讓電腦視覺模型在輕量、最佳化硬體或嵌入式裝置上更靠近資料產生的位置執行。
將 AI 推斷能力移近邊緣可帶來諸多關鍵優勢:
- 提升速度並降低延遲:將資料處理與分析移至生成位置有助於加速系統回應,從而實現更快速的交易與更優異的體驗,對許多電腦視覺應用來說至關重要。
- 改善網路流量管理:將傳送至雲端的資料降至最低,有助於減少傳輸和儲存大量資料的頻寬與成本。
- 提高可靠性:網路能同時傳輸的資料數量有限。若為網路連線能力欠佳的地區,在邊緣儲存與處理資料可提升可靠性。
- 增強安全功能:邊緣運算解決方案若實作得宜,能夠透過限制網路傳輸資料,協助提升資料安全性。
- 隱私合規要求:部分政府、顧客或產業可能要求電腦視覺應用的資料必須保留在其建立的司法管轄區內。邊緣運算可以協助企業遵守此類規則和法規。
開始使用電腦視覺
如同其他形式的 AI,電腦視覺對業務的各個面向產生了影響。這項技術協助各行各業的公司降低營運成本、開啟業務自動化機會,以及發掘潛在的新服務或收益來源。能夠利用電腦視覺力量開創全新使用案例、功能與創新技術的企業將會崛起,成為業界領導者。
在您企業的電腦視覺 AI 旅途中,Intel 將一路相伴,協助 AI 計畫成功實現。