Hướng Dẫn Exploratory Data Analysis – Phân Tích Khám Phá Dữ Liệu Kaggle Project Titanic (Phần 2)

Hướng Dẫn Exploratory Data Analysis – Phân Tích Khám Phá Dữ Liệu Kaggle Project Titanic (Phần 2)

EDA (Exploratory Data Analysis – Phân tích Khám phá Dữ liệu) là một bước quan trọng trước khi làm bất kỳ một bài toán ML với dữ liệu dạng bảng nào.

Bước EDA này giúp chúng ta có cái nhìn đầu tiên về dữ liệu. Bạn cần có một cảm giác nhất định về những gì mình có trong tay trước khi có những chiến lược xây dựng mô hình. EDA giúp bạn mường tượng được độ phức tạp của bài toán và vạch ra những bước đầu tiên cần làm.

Việc khám phá dữ liệu không chỉ dừng lại ở lần đầu tiên trước khi xây dựng đặc trưng mà còn cần được thực hiện trong suốt quá trình phát triển hệ thống. Sau khi xây dựng xong các đặc trưng, bạn cũng cần làm lại EDA một lần nữa để xem dữ liệu đã qua xử lý đó đã thực sự sạch chưa. Ngoài ra, sau khi xây dựng và phân tích mô hình, ta cũng thường xuyên cần quay lại EDA để tiếp tục khám phá những điều còn ẩn giấu trong dữ liệu bài toán. Càng hiểu sâu về dữ liệu, bạn sẽ càng sớm giải thích được những hành vi của mô hình và đưa ra những thay đổi phù hợp.
Source: Machine Learning Cơ Bản Blog
Link:

Jupyter Notebook:
Kaggle Titanic – Machine Learning from Disaster:

► Full Series “Lập Trình Python Cơ Bản”:
► Full Series “Học Lập Trình Python qua Project”:
► Full Series “Tự Học Data Science Cho Người Mới Bắt Đầu”:

Group Hỏi Đáp:

————- ✪ About CodeXplore Channel ✪ ————
CodeXplore là một platform chia sẻ kiến thức về Lập Trình và Trí Tuệ Nhân Tạo (AI) dành cho các bạn trẻ Việt Nam.

Channel CodeXplore sẽ focus vào các chủ đề sau:
► Machine Learning (Máy Học) và Data Science (Khoa Học Dữ Liệu)
► Interview Preparation (Cấu Trúc Dữ Liệu và Thuật Toán & LeetCode Solutions)
► Lập Trình Python (Cơ Bản, Lập Trình Hướng Đối Tượng, Lập Trình Game)
——————
✪ Business inquiries: codexplore.channel@gmail.com
✪ Subscribe:

➥ CodeXplore Social Links:
Fanpage:
GitHub:

———————————————-/————-
© Bản quyền thuộc về CodeXplore
© Copyright by CodeXplore & Do not Reup

#EDA #Kaggle #Titanic

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *