fbpx
資源整理

利用Airbnb來更了解居住城市,以臺北為例 Python實作(下)

延續上一篇:利用Airbnb來更了解臺北,這篇我們就要來把自己當成是Airbnb的資料科學家,嘗試建立房屋的訂價模型。 先說說流程: 檢查變數-價格相關性,好讓我們對影響變量有個了解 處理類別資料,轉換為Python的機器學習套件:Sklearn看得懂的東西 清理缺失值 切分資料成訓練、驗證集 利用交叉驗證建模,Baseline(基礎比較)我選擇L1、L2 Regression 建立Random Forest、XGboost Regressor 利用model畫出變數重要性,方便我們優化模型 反覆迭代,持續優化模型 結語,談如何優化與比較好的建模姿勢 (more…)
學程式助教
November 28, 2019
資源整理

利用Airbnb來更了解居住城市,以臺北為例 Python實作(上)

導論 這幾年共享經濟興起,外送平臺穿梭在大街小巷協助美食傳送、Uber也成為人們便利的代步工具、而其中Airbnb更是創造了「到別人家住與讓陌生人來自己家住」的嶄新概念。共享經濟的本質就是「更有效率地推動經濟」,在經濟學原理中,我們知道當供給量 = 需求量,就會達到市場均衡,而長期來看,市場會走向一個市場均衡點,市場均衡點其實不能說好、也不能說壞。但有一個可以肯定的點就是: 它讓人們的慾望有效得到滿足,而有效滿足的情況下,人們更容易發現經濟進步的方法。 而共享經濟其實就是在動態的創造市場均衡,讓現金流多了流通的管道、combine不同的需求。既然閒置資源是浪費的,那我們就好好利用它。 包括現在很夯的雲端運算,概念其實也是興起於「共享經濟」,結合規模經濟與處理閒置資源的本質,甚至還有結合區塊鏈的分布式運算系統,讓閒置頻寬得以被充分利用,目前被應用在直播、實況等串流巨大的系統中。 (more…)
學程式助教
November 28, 2019
資源整理

以Weka對資料集進行分群與分類分析之實作

前言 : 以下內容皆使用Weka 3.8.2去做演算法的分析,並且文章會根據分群分析、分類分析,按照這個排序分成兩大部分做探討。 兩個部分皆採用兩種不同類型的Datasets ,「現有Dataset」與「創意Dataset」;此外,每一個Dataset都會用兩種屬於該分群分析或分類分析的演算法。 分群分析會使用的演算法為① K-Means(K-平均法)與② Expectation Maximization, EM(期望最大化法);分類分析會使用的演算法為① Decision Tree(決策樹)與② REPTree(快速決策樹)。 (more…)
學程式助教
November 28, 2019
資源整理

網頁不是漂亮、上線就好 !一些你要知道的大小事

網站搜尋迷思:我的網站已經改好了,上網看看結果吧! 其實這裡有一個蠻重要的觀念,影響網站排名的結果,有兩個重要的因素 時間 內容 可能有些人會以為網站一修改完或是新的網站上線,馬上就可以被搜尋引擎找到,但是其實Google是靠著自動爬蟲機器人去爬去網路上的數十億的網站,縱使他的動作在快,效能再強,都會需要一定的時間,有時快則兩三天,慢則三至六個月都有可能,快或慢會根據不同的情況而決定。 (more…)
學程式助教
November 28, 2019
資源整理

網頁速度好慢?你真的知道什麼是網頁速度嗎

前言 對於使用者而言,當你在開啟一個網頁時,如果需要等上一段時間,或是每次在開啟某個網頁時就是比其他網頁來得慢,那麼你是不是下次就會不太願意再來造訪這個網頁了呢。那麼為什麼有些網頁的開啟速度總是比較慢,當然有時候可能跟使用者所處環境的因素導致訊號不佳,但是對於網頁經營者而言,網站若要長久經營,便要考慮使用者的感受。 (more…)
學程式助教
November 28, 2019