重磅乾貨,第一時間送達
作者:CrescentAI,華南理工大學,Datawhale優秀學習者
前言
本文對課程資料集及泰坦尼克號資料集進行了例項講解,一步一步帶你繪製資料視覺化中常用的五種圖形,並對資料間可能存在的相關性做出了闡述。
繪製常用圖形
常用圖形有:
plt。scatter() 散點圖
plt。plot() 折線圖
plt。bar() 直方圖
plt。pie() 餅圖
plt。boxplot() 箱型圖
接著我們還可以檢視其資料結構:
以及檢視各學科的缺失值情況:
對於這些缺失值,我們可以選擇使用函式刪除:
再使用函式進行簡單的統計描述:
散點圖
得到結果:
得到,且散點圖結果如下:
折線圖
得到輸出:
接著:
得到輸出:
可以嘗試刪除序號列,並且重設索引列:
再按照索引排序,可得到相應結果:
接著檢視一共有多少行資料作為x軸資料
再將各科成績資料進行繪圖,得到折線圖結果:
直方圖
再將語文成績資料進行繪圖,得到直方圖結果:
再將數學平均成績資料進行繪圖,得到直方圖結果:
將多個學科成績畫到一副圖中
餅圖
箱型圖
泰坦尼克號資料
男女中生存人數分佈情況
女性比男性生存人數多。
男女中生存人與死亡人數的比例
男女性生存與死亡人數的佔比偏差比較大。
不同票價的人生存和死亡人數分佈情況
不同的票價所反映出來的生存人數是非常明顯的,票價低的人死亡數量高是因為離甲板遠,且逃生機會大大降低。
不同倉位等級的人生存和死亡人員的分佈情況
不同年齡的人生存與死亡人數分佈情況
不同倉位等級的人年齡分佈情況
下載1:OpenCV-Contrib擴充套件模組中文版教程
下載2:Python視覺實戰專案52講
下載3:OpenCV實戰專案20講
交流群