RPA與人工智慧技術相結合——智慧自動化階段

RPA與人工智慧技術的結合

人們在果樹上摘果子的時候,總會發現一些果子結在較低位置,伸手可得,這在經濟學上稱為“低垂的果實”,目前也泛指那些工作難度不大,只需付出較小努力便能辦成的事情。如果說 RPA 是人工智慧領域一顆低垂的果實,那麼在人工智慧領域那些更復雜,更難的技術能輔助 RPA 做什麼呢?這就是在所謂的“智慧自動化階段”需要考慮的問題。

IPA 中需要解決的問題仍然還是上面談到的資料獲取問題和決策判斷問題。因為 OCR 還只是能解決影象中文字的識別,而如果需要對照片或影像進行識別,就需要採用計算機視覺技術。自然語言處理只能夠處理靜態掃描件,如果涉及機器人和人的交流過程,還需要用到對話機器人。對於自動化流程中更高難度的決策判斷,我們則需要採用專家系統。

RPA與人工智慧技術相結合——智慧自動化階段

1。計算機視覺

計算機視覺(Computer Vision)是一門研究機器如何“看”的科學,是指用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等,並用計算機進一步對影象做出處理,最終將目標處理成更適合人眼觀察或符合儀器檢測的影象。

計算機視覺由硬體、軟體等元素組成,比如影象採集裝置、鏡頭控制及相應演算法(基礎演算法是深度學習)。流程自動化領域通常與計算機視覺裡的影象分類和影象檢測識別技術相輔相成。

影象分類

影象分類通常是與OCR 技術結合使用。

因為影象在 OCR 識別之前必須要明確影象的類別,比如在一堆發票中需要分辨出哪些是增值稅發票、哪些是計程車票,然後利用 OCR 技術識別票面中的要素。計算機實現分類時並不能像人眼一樣直接對影象本身分類,因為演算法只能對資料分類,所以需要將某一類影象所擁有的獨有屬性作為影象特徵,然後依據人工智慧演算法利用影象特徵進行分類。目前,較為流行的影象分類架構是卷積神經網路(CNN),它是將影象送入 CNN 網路,然後由網路對影象資料進行分類,這樣處理之後方便 OCR 對分類後的影象進行文字識別。

影象檢測

影象檢測是指對影象中的物件進行識別,以識別各種不同模式的目標和物件。

影象分類關心的是影象的整體,給出的是整張圖片的內容描述,而檢測則關注特定的物體目標,要求同時獲得這一目標的類別資訊和位置資訊。影象檢測在自動化領域用於 RPA 機器人自動操作行為的觸發,如在影片或影象中檢測到目標物體,則觸發機器人的自動化處理。

目前,計算機視覺技術主要的應用領域是物理機器人行業,如機器人按照路線行進和躲避障礙物等。相信隨著人工智慧技術的進一步成熟,計算機視覺技術能夠順利地融入更多人工智慧產品中,也會與流程自動化領域結合得更緊密。因為計算機視覺技術是把物理世界轉換為數字化世界的重要一環,也是 RPA 從虛擬的軟體環境連線到真實環境的重要手段,如路標的識別、汽車牌照的識別、商家招牌的識別,以便於後續統計和分類的自動化。

2。對話機器人

對話機器人(Chatbot)其實也是一種軟體機器人,其核心技術就是自動問答,即利用計算機自動回答使用者所提出的問題以滿足使用者知識需求。

它不同於現有搜尋引擎,不再是基於關鍵詞匹配排序的文件列表,而是精準的自然語言答案。在自然語言處理研究領域,問答系統被認為是驗證機器是否具備自然語言理解能力的四個任務之一,其他三個任務是機器翻譯、複述輸人文字和自動生成文字摘要。

根據目標資料來源的不同,自動化領域的機器人主要採用檢索式問答和知識庫問答。

檢索式問答

檢索式問答是從一系列可能的回答中選出一個與問句最相關的答句,很多為兒童講故事的陪伴型機器人都屬於此類。

知識庫問答

知識庫問答採用的是知識圖譜或知識庫,對話機器人的任務就是要根據使用者問題的語義直接在知識庫查詢、推理出相匹配的答案。因此,如何把使用者的自然語言問句轉化為結構化的查詢語句是知識庫問答系統的核心所在,關鍵在於對自然語言問句進行語義理解。

RPA與人工智慧技術相結合——智慧自動化階段

對話機器人中一項技術就是語音互動,這項技術不管是中文還是英文互動都已經非常成熟。

語音互動主要包括語音識別(Speech Recognizer)、語言生成(Language Generator)和語音合成(Speech Synthesizer)模組。

語音識別是實現語音輸入到文字識別的轉換,即把使用者說的語音轉成文字;語言生成是根據解析模組得到的內部表示,在對話管理機制的作用下生成自然語言,即把回答的機器語言再轉換成口語;語音合成是將模組生成的句子轉換成語音輸出,即把口語再轉化成語音。這種語音互動能力最適合的載體是個人移動裝置,而不是桌面電腦,因為個人移動裝置距離人最近,也最容易產生互動。但是,RPA 機器人卻可以在桌面電腦上為你服務。所以,比較好的結合方式就是,利用移動裝置上的對話機器人與桌面電腦中 RPA 機器人進行互動。

目前,我們並不相信所謂的通用對話機器人會出現,也就是那種可以與你隨時對話、交流各種話題的全能對話機器人。但是,各種專業化領域的對話機器人卻會逐漸出現,如負責售後、財務報銷、採購答疑等機器人,它們諳熟於所擅長的領域,專心成長為某一領域的問答專家。這種專業型對話機器人也會與專業型 RPA 機器人相互配合工作。

本文部分內容參考王言 著 《RPA流程自動化引領數字勞動力革命》