透過機器學習的方法,訓練好一個二項式分類模型後,我們可以檢視一個由驗證測試產出的混淆矩陣,並觀察性能指標,例如準確度、精準度、召回率、F1_value 等。
如果希望進一步將其與商業利益聯結起來,一個簡單作法是先制定一個成本矩陣,其格式類似於混淆矩陣,由真陰性、偽陽性、偽陰性和真陽性實例的權重組成,然後將它與混淆矩陣按元素相乘,最後就可以算出所有驗證實例的總成本。
不過這種方法趨於被動,您可能更想知道是否有一種比較積極的作法,可以在模型訓練期間就摻入商業成本的考量,即使只是加在判定預測結果的最終階段。也就是說,我們是否可能建立一個不同的機器學習模型,來優化業務成本,而非典型的性能指標?
例如,一個工廠經常需要加入額外的化學品來遏止化學桶的沸溢,我們是否可以不再針對預測的準確性,而是根據成本效益,訓練出一個更好的預測模型?
答案是肯定的,在本次網絡研討會中,我們將與您分享兩種方法:一種根據分界線(點)的調整,另一種則透過一個新的信心度(或概率)的計算方法。我們將在 RapidMiner 中演示,但我們也會用 Python 展示第一種方法,從不同的角度說明所涉及的概念。
活動時間 : 2022/09/29 (四) 14:00-15:30
活動地點 : 本活動採網路 Live 直播
講師 : 李永嘉博士
原廠認證RapidMiner Grand Master,曾經在密西根大學安那堡校區教了六年的計算機課程,也在紐澤西的 AT&T Labs 帶過數十人的研發團隊,回來台灣後擔任過明基西門子手機的亞洲研發總監,這些年來專注於雲端運算,大數據分析與機器學習方面的顧問工作。
* 本活動免費需事先報名,報名完成後將於活動前一天寄發活動登入連結,歡迎業界先進及專家學者報名參加。
2022.09.29
14:00-15:30
本研討會採網路 Live 直播