Explorasi Data Secara Otomatis Dengan Pandas-Profiling
Saat kita melakukan eksplorasi data secara manual menggunakan Python, seringkali kita menghabiskan waktu untuk menulis berbaris-baris kode. Terkadang itu memakan banyak waktu. Dan di tulisan ini, saya ingin menunjukkan bagaimana mengeksplorasi data secara otomatis menggunakan Pandas Profiling dan ini hanya butuh beberapa baris.
Dalam tulisan ini, kita akan menggunakan dataset mpg:
import seaborn as snsmpg = sns.load_dataset('mpg')
mpg.head()
Mengeksplorasi data secara manual
Pertama-tama saya akan menunjukkan beberapa standar yang dilakukan, kalau semisalnya, kita mengeksplorasi data secara manual:
Informasi data:
mpg.info()
Deskripstif statistik data:
mpg.describe()
Atau yang lainnya. Misalnya lagi, matriks korelasi:
sns.heatmap(mpg.corr(), annot=True)
Dan masih banyak lainnya, mengingat masih banyak methods lainnya yang tersedia di Pandas DataFrame.
Pandas-Profiling
Untuk melakukan eksplorasi data secara otomatis, kita memerlukan library pandas_profiling, setelah itu import ProfileReport
from pandas_profiling import ProfileReport
# pip install pandas_profiling
Dan setelah itu, kita tidak perlu repot-repot menulis banyak kode. Kita hanya perlu satu baris kode:
mpg.profile_report()
Dan inilah pekerjaan terbesarnya. Menunggu. Setelah selesai,
Dan inilah beberapa hasil-hasil yang akan saya tunjukkan:
Dan untuk lengkapnya lagi, dapat dilihat dengan mengikuti kode-kode di atas. Terima kasih telah membacanya sampai selesai…