文章詳情頁(yè)

Python 線性回歸分析以及評(píng)價(jià)指標(biāo)詳解

瀏覽：2日期：2022-07-31 13:30:29

廢話不多說(shuō)，直接上代碼吧！

'''# 利用 diabetes數(shù)據(jù)集來(lái)學(xué)習(xí)線性回歸 # diabetes 是一個(gè)關(guān)于糖尿病的數(shù)據(jù)集，該數(shù)據(jù)集包括442個(gè)病人的生理數(shù)據(jù)及一年以后的病情發(fā)展情況。 # 數(shù)據(jù)集中的特征值總共10項(xiàng), 如下: # 年齡 # 性別 #體質(zhì)指數(shù) #血壓 #s1,s2,s3,s4,s4,s6 (六種血清的化驗(yàn)數(shù)據(jù)) #但請(qǐng)注意，以上的數(shù)據(jù)是經(jīng)過(guò)特殊處理， 10個(gè)數(shù)據(jù)中的每個(gè)都做了均值中心化處理，然后又用標(biāo)準(zhǔn)差乘以個(gè)體數(shù)量調(diào)整了數(shù)值范圍。 #驗(yàn)證就會(huì)發(fā)現(xiàn)任何一列的所有數(shù)值平方和為1. ''' import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets, linear_modelfrom sklearn.metrics import mean_squared_error, r2_score # Load the diabetes datasetdiabetes = datasets.load_diabetes() # Use only one feature # 增加一個(gè)維度，得到一個(gè)體質(zhì)指數(shù)數(shù)組[[1],[2],...[442]]diabetes_X = diabetes.data[:, np.newaxis,2]print(diabetes_X) # Split the data into training/testing setsdiabetes_X_train = diabetes_X[:-20]diabetes_X_test = diabetes_X[-20:] # Split the targets into training/testing setsdiabetes_y_train = diabetes.target[:-20]diabetes_y_test = diabetes.target[-20:] # Create linear regression objectregr = linear_model.LinearRegression() # Train the model using the training setsregr.fit(diabetes_X_train, diabetes_y_train) # Make predictions using the testing setdiabetes_y_pred = regr.predict(diabetes_X_test) # The coefficients # 查看相關(guān)系數(shù) print(’Coefficients: n’, regr.coef_) # The mean squared error # 均方差# 查看殘差平方的均值(mean square error,MSE) print('Mean squared error: %.2f' % mean_squared_error(diabetes_y_test, diabetes_y_pred)) # Explained variance score: 1 is perfect prediction # R2 決定系數(shù)（擬合優(yōu)度）# 模型越好：r2→1# 模型越差：r2→0print(’Variance score: %.2f’ % r2_score(diabetes_y_test, diabetes_y_pred)) # Plot outputsplt.scatter(diabetes_X_test, diabetes_y_test, color=’black’)plt.plot(diabetes_X_test, diabetes_y_pred, color=’blue’, linewidth=3) plt.xticks(())plt.yticks(()) plt.show()

對(duì)于回歸模型效果的判斷指標(biāo)經(jīng)過(guò)了幾個(gè)過(guò)程，從SSE到R-square再到Ajusted R-square, 是一個(gè)完善的過(guò)程：

SSE(誤差平方和)：The sum of squares due to error

R-square(決定系數(shù))：Coefficient of determination

Adjusted R-square：Degree-of-freedom adjusted coefficient of determination

下面我對(duì)以上幾個(gè)名詞進(jìn)行詳細(xì)的解釋下，相信能給大家?guī)?lái)一定的幫助！！

一、SSE(誤差平方和)

計(jì)算公式如下：

Python 線性回歸分析以及評(píng)價(jià)指標(biāo)詳解

同樣的數(shù)據(jù)集的情況下，SSE越小，誤差越小，模型效果越好

缺點(diǎn)：

SSE數(shù)值大小本身沒(méi)有意義，隨著樣本增加，SSE必然增加，也就是說(shuō)，不同的數(shù)據(jù)集的情況下，SSE比較沒(méi)有意義

二、R-square(決定系數(shù))

Python 線性回歸分析以及評(píng)價(jià)指標(biāo)詳解

數(shù)學(xué)理解：分母理解為原始數(shù)據(jù)的離散程度，分子為預(yù)測(cè)數(shù)據(jù)和原始數(shù)據(jù)的誤差，二者相除可以消除原始數(shù)據(jù)離散程度的影響

其實(shí)“決定系數(shù)”是通過(guò)數(shù)據(jù)的變化來(lái)表征一個(gè)擬合的好壞。

理論上取值范圍（-∞，1], 正常取值范圍為[0 1] ------實(shí)際操作中通常會(huì)選擇擬合較好的曲線計(jì)算R²，因此很少出現(xiàn)-∞

越接近1，表明方程的變量對(duì)y的解釋能力越強(qiáng)，這個(gè)模型對(duì)數(shù)據(jù)擬合的也較好

越接近0，表明模型擬合的越差

經(jīng)驗(yàn)值：>0.4，擬合效果好

缺點(diǎn)：

數(shù)據(jù)集的樣本越大，R²越大，因此，不同數(shù)據(jù)集的模型結(jié)果比較會(huì)有一定的誤差

三、Adjusted R-Square (校正決定系數(shù)）

Python 線性回歸分析以及評(píng)價(jià)指標(biāo)詳解

n為樣本數(shù)量，p為特征數(shù)量

消除了樣本數(shù)量和特征數(shù)量的影響

以上這篇Python 線性回歸分析以及評(píng)價(jià)指標(biāo)詳解就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持好吧啦網(wǎng)。

Python 編程

上一條：python簡(jiǎn)單的三元一次方程求解實(shí)例下一條：Python Numpy中數(shù)據(jù)的常用保存與讀取方法

相關(guān)文章：

1. python爬蟲(chóng)實(shí)戰(zhàn)之制作屬于自己的一個(gè)IP代理模塊2. python實(shí)現(xiàn)在內(nèi)存中讀寫(xiě)str和二進(jìn)制數(shù)據(jù)代碼3. Python編寫(xiě)nmap掃描工具4. .Net Core和RabbitMQ限制循環(huán)消費(fèi)的方法5. HTML 絕對(duì)路徑與相對(duì)路徑概念詳細(xì)6. 解決ajax請(qǐng)求后臺(tái),有時(shí)收不到返回值的問(wèn)題7. python實(shí)現(xiàn)PolynomialFeatures多項(xiàng)式的方法8. .NET6打包部署到Windows Service的全過(guò)程9. python 利用toapi庫(kù)自動(dòng)生成api10. python 寫(xiě)函數(shù)在一定條件下需要調(diào)用自身時(shí)的寫(xiě)法說(shuō)明

排行榜

					
					python爬蟲(chóng)實(shí)戰(zhàn)之制作屬于自己的一個(gè)IP代理模塊
Python編寫(xiě)nmap掃描工具
python實(shí)現(xiàn)在內(nèi)存中讀寫(xiě)str和二進(jìn)制數(shù)據(jù)代碼
IDEA部署Docker到WSL2的詳細(xì)過(guò)程
IntelliJ IDEA刪除類的方法步驟
HTML 絕對(duì)路徑與相對(duì)路徑概念詳細(xì)
python 利用toapi庫(kù)自動(dòng)生成api
.Net Core和RabbitMQ限制循環(huán)消費(fèi)的方法
Java程序的編碼規(guī)范（6）
解決ajax請(qǐng)求后臺(tái),有時(shí)收不到返回值的問(wèn)題
python實(shí)現(xiàn)PolynomialFeatures多項(xiàng)式的方法