Stata/Python整合:支援向量機的機器學習

首頁

>

產品新知

> 內文

2020.10.30


機器學習、深度學習和人工智慧是用於識別數據模式的演算法集合;這些演算法具有奇特的名稱,例如「隨機森林」、「神經網路」。

本文使用美國健康與營養體檢調查 (NHANES) 研究資料,先以Stata清理資料,整理成需用到的變數;接下來在Stata中整合Python, 實行機器學習演算法之一的 「支援向量機 (SVM)」,並使用年齡和糖化血色素 (HbA1c) 水準來區分可能患有糖尿病的人和那些沒有糖尿病的人。圖形中的紅點表示患有糖尿病、藍點則是沒有糖尿病。

SVM模型預測,在紅色陰影區域,HbA1c較高的老年人更有可能患糖尿病;在藍色陰影區,HbA1c較低的年輕人患糖尿病的可能性較小。

來源:Stata/Python integration part 7: Machine learning with support vector machines