前言
網際網路消費時代,讓使用者足不出戶就能夠將商品拿到手裡。目前,消費者在網上消費成為了主流。國家統計局自2018年開始,公佈了全國網際網路消費的情況。接下來,我們依據國家統計局官方公佈的資料,整體回顧一下近兩年網際網路消費成果。期間使用python對資料的進行讀取、處理與分析。透過計算與分析可知,
2019年消費者網上消費金額10.63242萬億元,同比2018年增長了18.05%,其中食品消費佔比80.17%
(百分比計算保留了兩位小數,進行了四捨五入的運算)。
python應用案例:如何使用python進行資料處理與分析
1。資料來源
本文使用的資料均來自國家統計局官網,但是分析的角度有所不同,主要透過國家統計局官網公佈的網上零售額資料來看消費者網上消費情況,也就是說從消費者的角度,對資料進行來重新解讀。
(1)下載資料:格式。csv
從國家統計局官網上下載了近36個月的網上零售額資料,發現該項資料從2018年開始公佈,所以實際獲取的資料為近兩年。經分析發現,每年的1月份資料未公佈,最終有效的資料為2018年2月到2018年12月以及2019年2月到2019年12月,共計20個月的有效資料。
小編選擇下個數據的格式是。csv,除此之外還支援下載excel等多種格式,可根據需要進行選擇。網址和官網介面如下圖所示:
2。使用python讀取資料
讀取。csv檔案格式的資料方法很多,我們這裡使用python語言庫pandas的pd。read_csv方法。
python程式碼:
data=pd。read_csv(r‘/Users/lupeitao/Desktop/資料/國家統計局網上消費資料。csv’, encoding=‘gb18030’,index_col=‘指標’)
生成的資料結構如下:
大家可以看到,因為欄位太多,當前螢幕可視範圍內無法檢視完整內容,同時現在的結構也不利於後續的分析,所以,我們接下來需要對其進行行列轉換。
3。使用python進行行列轉換
基於目前對資料情況,行列轉換後對後續對分析更為方便。
python程式碼:
data_T=data。T
生成新的物件data_T,返回的資料結果如下:
4。濾除缺失值
python程式碼:
data_T_1=data_T。dropna(how=‘any’)
生成新物件data_T_1,返回的資料結果如下:
大家可以詳細對比一下,缺失值處理後,2019年1月和2018年1月的記錄被刪除了。
5。資料計算
19年同比18年增幅=(2019年網上零售額累計值-2018年網上零售額累計值)/2018年網上零售額累計值
python程式碼:
#選取2019年12月網上零售額累計值,生成新物件data_T_1_1data_T_1_1=data_T_1[‘網上零售額累計值(億元)’][‘2019年12月’]#選取2018年12月網上零售額累計值,生成新物件data_T_1_2data_T_1_2=data_T_1[‘網上零售額累計值(億元)’][‘2018年12月’]#計算19年同比18年增幅,生成新物件data_T_1_3data_T_1_3=(data_T_1_1-data_T_1_2)/data_T_1_2
data_T_1_3物件返回的資料結果為0。18052739688003105,我們保留兩位小數且進行四捨五入的運算,最終
19年同比18年增幅百分比為18.05%
。
結論
透過計算與分析可知,
2019年消費者網上消費金額10.63242萬億元,同比2018年增長了18.05%,其中食品消費佔比80.17%
(百分比計算保留了兩位小數,進行了四捨五入的運算)。網上消費已然成為當下主流的消費渠道。使用python對上述資料的讀取、處理、計算與分析,簡便快捷易用,大家可以著手操作一下,有問題歡迎留言。
記得關注、轉發和評論哦!感謝支援!