延續上一篇:利用Airbnb來更了解臺北,這篇我們就要來把自己當成是Airbnb的資料科學家,嘗試建立房屋的訂價模型。 先說說流程: 檢查變數-價格相關性,好讓我們對影響變量有個了解 處理類別資料,轉換為Python的機器學習套件:Sklearn看得懂的東西 清理缺失值 切分資料成訓練、驗證集 利用交叉驗證建模,Baseline(基礎比較)我選擇L1、L2 Regression 建立Random Forest、XGboost Regressor 利用model畫出變數重要性,方便我們優化模型 反覆迭代,持續優化模型 結語,談如何優化與比較好的建模姿勢 (more…)
學程式助教November 28, 2019