Python資料分析沒有資料怎麼辦?用faker

本文給大家介紹一個模擬資料生成模組faker的使用。先看效果,生成的模擬資料如下圖所示。包括姓名、身份證號碼、地址、公司、電話、郵箱等。這些資料都是假的,供機器學習或資料分析使用。

Python資料分析沒有資料怎麼辦?用faker

faker提供了面向Python的介面,使用非常簡單。pip安裝命令為:

pip install faker

支援中文模擬資料生成的官網是:

https://faker。readthedocs。io/en/master/locales/zh_CN。html

當然,faker還支援其它許多國家的語言,官網上提供了相應的連結。

要生成上面圖中的資料,可以使用以下命令:

from faker import Fakerfaker = Faker(“zh_CN”)for i in range(10): print(faker。name(), faker。ssn(), faker。address(),faker。city(),faker。company(),faker。phone_number(), faker。ascii_free_email())

上面程式碼中,faker。name()用於生成隨機的人名,faker。ssn()生成隨機的身份證號碼,faker。address()生成隨機的地址,faker。city()生成隨機的城市名稱,faker。company()生成隨機的公司名稱,faker。phone_number()生成隨機的手機號碼,faker。ascii_free_email()生成隨機的電子郵箱。當然,這些資訊都不是真的。

faker支援許多型別的資料,下面再舉幾個例子。例如,生成隨機文字:

print(‘文字:’, faker。text())

輸出結果為:

Python資料分析沒有資料怎麼辦?用faker

當然,每次執行輸出的文字不一致。這些文字是沒有什麼意義的,只是一些詞的組合。

下面的指令輸出一些句子的列表:

for i in range(10): print(faker。sentences())

Python資料分析沒有資料怎麼辦?用faker

可以指定列表中句子的數量,如:

for i in range(10): print(faker。sentences(nb=8))

Python資料分析沒有資料怎麼辦?用faker

下面的指令生成詞的列表:

for i in range(10): print(faker。words(nb=8))

輸出結果為:

Python資料分析沒有資料怎麼辦?用faker

是不是很有趣?更多方法,請檢視faker官網。用這些資料組合在一起,可以儲存為資料檔案。在進行資料分析、機器學習練習時,就不愁沒有資料了。趕快試試吧。