利用機器學習模型計算的結果應用有三個主要方面:
傳統行業應用場景
結果報告輸出說明
系統的自動化執行
傳統行業應用場景
同時還可以進行類似相關預測的業務
結果報告輸出說明
在日常利用機器學習演算法應用實際工作中經常會發現一個好的演算法模型應用到某個業務領域,並且會呈現很好的結果。這個時候需要給利益相關者呈現才會產生價值,這個利益相關正有可能是自己、客戶或者企業。
很多人都會使用PPT(PowerPoint)來表達結果給利益相關者,會包含的內容有:
背景(Why):
定義問題存在的環境,並說明研究問題的動機。
問題(Question):
簡明扼要地把問題描述為回答的問題。
解決方案(Answer):
將解決方案簡明扼要地描述為在上一節中提出的問題的答案。
發現:
在闡述觀點的時候讓利益相關者產生興趣,並且接受他們發出的任何疑問。
限制:
考慮模型對利益相關者的提問的問題無法完成的內容,重新定義修改模型或者給與解決方案,會增加信任度。
結論(Why + Question + Answer):
重新審視為什麼,研究問題和在一個緊湊的小專案中發現的答案。
如果有可能的話,長期基於上述內容監督迴圈的方式完善你的專案。
系統的自動化執行
如果已經開發了一個模型,並且該模型足以解決所面臨的問題,並希望將其投入實際生產,有可能會移植到現成的系統應用程式中,那麼應該仔細考慮的三個方面是
演算法實現、模型的自動化測試以及隨時間跟蹤模型效能
。這三個問題很可能會影響選擇的模型型別。
演算法實現
可能在模擬環境下的模型演算法非常的優秀,但是還是要仔細考慮將這樣的實現直接投入生產可能會產生的依賴關係和技術能力。考慮找到一個支援所有使用方法的生產環境,否則回來調整測試的時候會很麻煩。
模型測試
編寫自動化測試來驗證模型是否可以構建並重復達到最低水平的效能。還要為任何資料準備步驟編寫測試。可能希望控制每個單元測試執行的演算法(隨機數種子)使用的隨機性,以便測試是 100% 可重現的。
效能追蹤
新增基礎設施以隨著時間的推移監控模型的效能,並在準確度低於最低水平時發出警報。跟蹤可以實時進行,也可以在單獨的環境中使用重新建立的模型上的實時資料樣本進行。發出的警報可能表明模型在資料中學習到的結構已經改變(概念漂移)並且模型可能需要更新或調整。
有一些模型型別可以執行線上學習和自我更新。仔細考慮允許模型在生產環境中自我更新。在某些情況下,管理模型更新過程和切換模型(它們的內部配置)可能更明智,因為它們被驗證為更高效能。