RapidMiner資料庫內處理擴充套件

首頁

>

產品新知

> 內文

2020.11.30


資料庫內處理( In-Database Processing)是指將資料前處裡或資料準備工作利用SQL語法交由商用資料庫進行。其相對的概念就是將原始資料從資料庫中複製到個人的工作電腦上,然後再用個人電腦的資源進行資料處理。將資料處理的工作交給資料庫伺服器進行可避免因個人電腦配備不足而造成處理速度低落,也可減輕龐大資料從資料庫複製到個人電腦的冗長時間。
要如何在RapidMiner 中實現在資料庫中進行前處理呢? 安裝In-Database Processing Extension擴充套件後,它就會自動將RapidMiner 的Operator轉換為SQL語法並送至資料庫中進行處理,使用者不須要會寫SQL也能享受上述便利。目前支援的資料庫有Postgres, MySQL, MSSQL 和Google BigQuery,而Oracle資料庫也即將上線。
來源:In-Database Processing: Preprocessing Data Like A Pro