隨機森林演算法

首頁

>

產品新知

> 內文

2020.12.29


近年來,社會科學中統計或機器學習演算法的使用有所增加,隨機森林 (Breiman, 2001, Machine Learning 45: 5–32) 是一種用於預測的統計或機器學習演算法;隨機森林容易適應資料的非線性,因此與線性迴歸相比有更好的預測,更具體地說,像隨機森林這樣的集成學習演算法非常適合中型到大型資料集。

加拿大滑鐵盧大學Matthias Schonlau教授建立全新Stata社群貢獻指令rforest, 可配適隨機森林分類與迴歸演算法模型。本文概述隨機森林演算法,並用兩個範例說明其用法。第一個範例是分類問題,該問題可預測信用卡持有人是否會拖欠其債務。第二個範例是一個迴歸問題,預測網路新聞的文章分享數(受歡迎程度)。

來源:The random forest algorithm for statistical learning