Lasso功能簡介

首頁

>

產品新知

> 內文

2021.03.02


在大數據時代,變數的數目呈現爆炸性的增長,有時甚至遠遠超過樣本數。再加上自變數與應變數間的關係可能以非線性方式呈現,傳統的統計方法可能會面臨左支右絀的窘境。此時Lasso等帶有特徵選擇功能的模型就能派上用場。
當變數數目超過樣本數時,普通線性迴歸會因為秩條件(rank condition)而無法進行估計。但Lasso模型可以從為數眾多的自變數中挑出真正對模型有影響力的少數變數。若是變數有複雜的非線性關係,則線性模型的估計可能都會與實際情況大相逕庭。但Lasso並不需要線性假設,也不需要任何先驗的猜測,故可以避開此類的錯誤。
更多Lasso在Stata中的指令與操作請閱讀原廠說明文章。


來源:New in Stata: Lasso