Tìm kiếm (search)

Thứ Bảy, 25 tháng 8, 2018

DATA VISUALIZATION- PHÂN TÍCH DỮ LIỆU BẰNG HÌNH ẢNH_GGPLOT2-DENSITY PLOT

Bài này giới thiệu với các bạn về Density Plot với ggplot2 và phần mềm R

1. Tải dữ liệu tại đây:  https://www.kaggle.com/fossouodonald/titaniccsv


2. Một sô câu hỏi

Độ tuổi của hành khách phân bố ra sao?
Độ tuổi Nam Nữ  phân bố như thế nào?
Độ tuổi theo hạng vé phân bố như thế nào?
Độ tuổi theo giới tính và hạng vé phân bố như thế nào?


3. Clip bài giới thiệu


4. Một số hình ảnh từ Clip







5. Danh sách câu lệnh

t = file.choose() ## File: titanic3.csv
da=read.csv(t,header=T)
attach(da)
View(da)

require(ggplot2)
ggplot(da,aes(x=age)) + theme_bw() + geom_density(fill="blue") + labs(title ="Passenger Age Distribution")

ggplot(da,aes(x=age,fill=sex)) + theme_bw() + geom_density(alpha=0.25) + labs(title ="Passenger Age Distribution by Gender")

da$pclass = as.factor(da$pclass)
ggplot(da,aes(x=age,fill=pclass)) + theme_bw() + geom_density(alpha=0.25) + labs(title ="Passenger Age Distribution by Ticket Class")

ggplot(da,aes(x=age, fill=pclass)) + theme_bw() + geom_density() + labs(title ="Passenger Age Distribution by Ticket Class") + facet_wrap(~ pclass)

ggplot(da,aes(x=age, fill=sex)) + theme_bw() + geom_density(alpha=0.25) + labs(title ="Passenger Age Distribution by Ticket Class") + facet_wrap(~ pclass)

ggplot(da,aes(x=age, fill=sex)) + theme_bw() + geom_density() + labs(title ="Passenger Age Distribution by Ticket Class and Gender") + facet_wrap(~ sex ~ pclass)

Thanks

<Viet Nguyen-ngvietlg@gmail.com>


Không có nhận xét nào:

Đăng nhận xét