嗨咯大家好,我是亮仔
今天我們來虛擬一個任務或者專案來作為製作資料視覺化圖表的例項,逐步製作資料視覺化分析報表,如果小夥伴沒有基礎也沒關係,製作過程中用到的知識點我都會進行說明,知識點較多,製作的週期會比較長
首先我們假設領導要你做一個銷售分析,我們接到這個任務時,首先和領導確認以下事項:
1、瞭解分析的目的,是面向哪些人,比如彙報給總裁和彙報給客戶的報表是完全不同的
2、分析的大致板塊、主要方向,避免資料分析的方向錯誤導致返工
3、完成時間,這個直接關係到自己下班是到點跑路還是決戰到天明
所有的東西確認完之後,我們就開始著手準備報表製作的資料
我們的資料一般來源於3個地方:
系統匯出、公司內部收集及自制、網上獲取。
因為資料來源的不同,資料的格式、欄位表頭也不一致,所以我們需要對資料來源進行處理,今天先聊聊資料獲取中存在的一些常見問題及處理辦法
我們從公司ERP系統中匯出的常見格式一般有3種檔案:
1.Excel檔案(檔案字尾名xlsx、xls)
2.逗號分隔值檔案(檔案字尾名CSV)
3.文字文件(檔案字尾名TXT)
其他格式日常辦公中不常用,如有需要可自行了解
1、Excel檔案
目前系統匯出基本是採用這種格式,檔案匯出後直接使用Excel開啟
【亮仔提示】
因資料為系統直接匯出,Excel表格內單元格格式可能會全部為文字格式,可使用分列功能進行處理
2、逗號分隔值檔案、文字文件
這兩種檔案相對於Excel來講出現的次數會少一點,不過我們還是需要了解下
CSV格式是檔案我們可以直接使用Excel開啟,然後另存為xlsx檔案,
TXT檔案使用記事本開啟,有2種辦法匯入到Excel中
①直接複製貼上進Excel中,所有資料會在1個單元格中,我們可以使用分列對文字進行分列,從而達到將資料匯入Excel的作用
Excel高版本中複製到Excel中可自動識別,無需分列
②使用Excel中資料匯入功能
因為系統匯出的資料比較規範,在這不過多的闡述,主要聊聊公司內部收集和製作的資料,這部分是問題最大的板塊。
因為每個人對資料的理解認知不同,操作習慣也不同,我們收集的資料錯誤會非常多,我整理了5個常見的錯誤,看看你有沒有經歷過
示例一
【問題場景】
二維表資料表
,這種表格資料看起來非常的直觀,一般用於報表展示,但是不利於資料分析、透視(可以試試將這類資料插入透視表,會得到什麼結果)
【解決方法】
正確的做法是使用Power Query轉換功能,將二維錶轉換為一維表,操作方法如圖
最終結果如下圖
【亮仔提示】
Power Query在office2013版本以上才有,2013版本需要下載安裝檔案,2016版本以上自帶無需下載
示例二
【問題場景】
在我們的資料中經常看到資料中為了方便而進行合併單元格,但這個合併單元格在資料分析中可以說是萬惡之首
【解決方法】
我們可以使用
批次填充
的辦法解決
這個合併單元格的解決辦法很多,這隻介紹其中一種最簡單的
關於合併單元格後期我會單獨介紹
示例三
【問題場景】
示例三是關於資料缺失、資料含有非列印字元,這個是比較細小的問題,但是如果不注意,對於資料分析的結果也是很大的影響
各位小夥伴們看下圖,你會發現什麼問題?
這份資料可以說是很完美,因為是一維表,但是有個細節需要注意
1、在客戶姓名中存在空值;
2、客戶姓名中存在空格
【解決方法】
空值
先用顏色標記,然後再進行逐個解決
空格
可採取替換法
示例四、五
【問題場景】
我們很多時候向分公司、向其他部門收集報表,經常會出現這種情況,
1、一個檔案(工作簿)裡面有很多很多個子表,每個表的表頭都是一樣的
2、每個月/人一個檔案,收集的壓縮包裡有N多個檔案
對於這種分散的資料,我們是不利於資料統計分析的,需要將資料整合到一個工作表中。
【解決方法】
對於需要使用多表合併的場景,我將分享3種解決方法:
1、Power Query法;2、WPS合併;3、VBA程式碼
,由於文章知識點較多且篇幅有限,多表合併我將單獨寫一期
原創不易,希望多多支援