Python當(dāng)中的實(shí)用小案例源代碼分享：銷(xiāo)量預(yù)測(cè)

案件

1，現(xiàn)有冰激凌店一年的歷史銷(xiāo)售數(shù)據(jù)

2，數(shù)據(jù)包括單日的銷(xiāo)售量、氣溫、周幾（問(wèn)題：如何用這些數(shù)據(jù)預(yù)測(cè)冰激凌的銷(xiāo)量？）

模擬實(shí)驗(yàn)與分析

將數(shù)據(jù)存儲(chǔ)為csv格式，導(dǎo)入python。并畫(huà)出散點(diǎn)圖，觀察氣溫和銷(xiāo)售量的關(guān)系。

[Python] 純文本查看復(fù)制代碼

import pandas as pd
icecream = pd.read_csv("icecream.csv")
import matplotlib.pyplot as plt
import pylab
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.scatter(icecream.iloc[:,1],icecream.iloc[:,0])
plt.xlabel("氣溫")
plt.ylabel("銷(xiāo)售量")
pylab.show()

計(jì)算兩者間的相關(guān)系數(shù)。

[Python] 純文本查看復(fù)制代碼

1	`icecream.iloc[:,0:2].corr()`

結(jié)果為：

[Python] 純文本查看復(fù)制代碼

1

2

3

4

銷(xiāo)售量       氣溫[/align]
銷(xiāo)售量 1.000000   0.844211
氣溫     0.844211   1.000000

銷(xiāo)售量和氣溫的相關(guān)系數(shù)為0.84，結(jié)合散點(diǎn)圖，認(rèn)為兩者相關(guān)。下面用回歸分析的方法，通過(guò)氣溫來(lái)預(yù)測(cè)冰激凌銷(xiāo)量。

[Python] 純文本查看復(fù)制代碼

from sklearn.linear_model import LinearRegression
model = LinearRegression()
feature_cols = ['氣溫']
X = icecream[feature_cols]
y = icecream.銷(xiāo)售量
model.fit(X,y)
plt.scatter(icecream.氣溫, icecream.銷(xiāo)售量)
plt.plot(icecream.氣溫, model.predict(X) , color='blue')
plt.xlabel('氣溫')
plt.ylabel('銷(xiāo)售量')
plt.show()
print("截距與斜率:",model.intercept_,model.coef_)

[Python] 純文本查看復(fù)制代碼

1	`截距與斜率:` `57.1673282152` `[` `5.21607823]`

于是，散點(diǎn)圖中的線函數(shù)式為y＝5.2X＋57.2。所以，當(dāng)氣溫為25度時(shí)，預(yù)測(cè)的銷(xiāo)售量為5.2*25+57.2=187.52，約188個(gè)。
幾個(gè)小概念回歸分析：預(yù)測(cè)數(shù)據(jù)時(shí)的簡(jiǎn)便手法。在此例中，銷(xiāo)售量為反應(yīng)變量，也叫因變量，氣溫為解釋變量，也叫自變量。雖然影響銷(xiāo)售量的因素除了氣溫外還有很多，但回歸分析中我們要把現(xiàn)實(shí)情況簡(jiǎn)化并公式化，這個(gè)過(guò)程叫做建模。本例中只用1個(gè)解釋變量進(jìn)行模型化稱(chēng)為一元線性回歸，如果反應(yīng)變量同時(shí)受到多個(gè)解釋變量的影響，稱(chēng)為多元線性回歸。

全國(guó)校區(qū)

熱門(mén)課程

Python當(dāng)中的實(shí)用小案例源代碼分享：銷(xiāo)量預(yù)測(cè)

最新資訊

相關(guān)閱讀

熱門(mén)課程推薦