【視頻】R語(yǔ)言用線性回歸預(yù)測(cè)共享單車的需求和可視化|數(shù)據(jù)分享
全文鏈接:https://tecdat.cn/?p=33350
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
分析師:Shuli Wang
自行車共享系統(tǒng)是新一代的傳統(tǒng)自行車租賃,從會(huì)員,租賃到歸還的整個(gè)過程已經(jīng)自動(dòng)化。通過這些系統(tǒng),用戶可以輕松地從特定位置租用自行車,然后在另一個(gè)位置返回。目前,全球約有500多個(gè)自行車共享計(jì)劃,其中包括500多萬輛自行車。今天,由于這些系統(tǒng)在交通、環(huán)境和健康問題中的重要作用,人們對(duì)它們產(chǎn)生了極大的興趣。
除了自行車共享系統(tǒng)有趣的現(xiàn)實(shí)世界應(yīng)用外,這些系統(tǒng)生成的數(shù)據(jù)特征使它們對(duì)研究具有吸引力。與公共汽車或地鐵等其他運(yùn)輸服務(wù)相反,旅行的持續(xù)時(shí)間,出發(fā)和到達(dá)位置明確記錄在這些系統(tǒng)中。此功能將自行車共享系統(tǒng)轉(zhuǎn)變?yōu)榭捎糜诟兄鞘幸苿?dòng)性的虛擬傳感器網(wǎng)絡(luò)。因此,預(yù)計(jì)通過監(jiān)測(cè)這些數(shù)據(jù)可以檢測(cè)到城市中的大多數(shù)重要事件。
本文幫助客戶探索如何利用R語(yǔ)言中的線性回歸模型來準(zhǔn)確預(yù)測(cè)共享單車的需求。線性回歸是一種基于統(tǒng)計(jì)學(xué)原理的預(yù)測(cè)模型,通過建立變量之間的線性關(guān)系,以及使用歷史數(shù)據(jù)和其他相關(guān)因素,可以對(duì)未來共享單車需求進(jìn)行預(yù)測(cè)。
數(shù)據(jù)介紹

相關(guān)分析
correlation analysis 相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。
具體來說,我們可以運(yùn)用相關(guān)分析方法,探究共享單車需求與各種可能影響因素之間的相關(guān)性。這些影響因素可以包括天氣條件、時(shí)間、地理位置、季節(jié)性變化等等。通過收集大量的歷史數(shù)據(jù),并應(yīng)用相關(guān)分析技術(shù),我們可以發(fā)現(xiàn)其中的模式和趨勢(shì),揭示出哪些因素對(duì)共享單車需求影響較大,哪些因素影響較小。例如計(jì)算相關(guān)系數(shù)、繪制相關(guān)圖表等。同時(shí),還可以強(qiáng)調(diào)相關(guān)分析的重要性,如通過了解需求與各個(gè)因素之間的相關(guān)關(guān)系,共享單車企業(yè)可以更好地進(jìn)行調(diào)度和管理,提供更滿意的服務(wù)。此外,我們也可以說明相關(guān)程度的解釋,例如相關(guān)系數(shù)的取值范圍以及其所代表的相關(guān)強(qiáng)度。
相關(guān)分析在揭示共享單車需求與其他因素的關(guān)系方面具有廣泛的應(yīng)用價(jià)值。通過深入探索和運(yùn)用相關(guān)分析,我們可以為共享單車行業(yè)的決策和發(fā)展提供更為可靠的數(shù)據(jù)支持。

直方圖

多元線性回歸
在回歸分析中,如果有兩個(gè)或兩個(gè)以上的自變量,就稱為多元回歸。 計(jì)算公式:
使用最小二乘法來估計(jì)回歸系數(shù)
假設(shè)我們要探究共享單車需求與天氣條件、時(shí)間和地理位置之間的關(guān)系,可以利用多元線性回歸模型來分析這些因素對(duì)共享單車需求的影響。

上述代碼首先創(chuàng)建了一個(gè)數(shù)據(jù)框data,其中包含了三個(gè)自變量:天氣條件、時(shí)間,以及一個(gè)因變量:共享單車需求。然后利用lm函數(shù)建立了一個(gè)多元線性回歸模型。最后,通過summary函數(shù)輸出回歸模型的摘要信息,包括回歸系數(shù)、顯著性水平、擬合優(yōu)度等指標(biāo)。
模型評(píng)估
R-square 擬合優(yōu)度,又稱為可決系數(shù)(coefficient of determination)是指回歸直線對(duì)觀測(cè)值的擬合程度.

關(guān)于分析師

在此對(duì)Shuli Wang對(duì)本文所作的貢獻(xiàn)表示誠(chéng)摯感謝,?她在上海大學(xué)完成了信息管理學(xué)位,專注數(shù)據(jù)采集、分析領(lǐng)域。擅長(zhǎng)R語(yǔ)言、Python。

最受歡迎的見解
1.R語(yǔ)言多元Logistic邏輯回歸 應(yīng)用案例
2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語(yǔ)言泊松Poisson回歸模型分析案例
5.R語(yǔ)言混合效應(yīng)邏輯回歸Logistic模型分析肺癌
6.r語(yǔ)言中對(duì)LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)
7.R語(yǔ)言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機(jī)森林算法預(yù)測(cè)心臟病
8.python用線性回歸預(yù)測(cè)股票價(jià)格
9.R語(yǔ)言用邏輯回歸、決策樹和隨機(jī)森林對(duì)信貸數(shù)據(jù)集進(jìn)行分類預(yù)測(cè)