1. Tải dữ liệu tại đây: https://www.kaggle.com/fossouodonald/titaniccsv
2. Một sô câu hỏi
Độ tuổi của hành khách phân bố ra sao?
Độ tuổi Nam Nữ phân bố như thế nào?
Độ tuổi theo hạng vé phân bố như thế nào?
Độ tuổi theo giới tính và hạng vé phân bố như thế nào?
3. Clip bài giới thiệu
4. Một số hình ảnh từ Clip
5. Danh sách câu lệnh
t = file.choose() ## File: titanic3.csv
da=read.csv(t,header=T)
attach(da)
View(da)
require(ggplot2)
ggplot(da,aes(x=age)) + theme_bw() + geom_density(fill="blue") + labs(title ="Passenger Age Distribution")
ggplot(da,aes(x=age,fill=sex)) + theme_bw() + geom_density(alpha=0.25) + labs(title ="Passenger Age Distribution by Gender")
da$pclass = as.factor(da$pclass)
ggplot(da,aes(x=age,fill=pclass)) + theme_bw() + geom_density(alpha=0.25) + labs(title ="Passenger Age Distribution by Ticket Class")
ggplot(da,aes(x=age, fill=pclass)) + theme_bw() + geom_density() + labs(title ="Passenger Age Distribution by Ticket Class") + facet_wrap(~ pclass)
ggplot(da,aes(x=age, fill=sex)) + theme_bw() + geom_density(alpha=0.25) + labs(title ="Passenger Age Distribution by Ticket Class") + facet_wrap(~ pclass)
ggplot(da,aes(x=age, fill=sex)) + theme_bw() + geom_density() + labs(title ="Passenger Age Distribution by Ticket Class and Gender") + facet_wrap(~ sex ~ pclass)
Thanks
<Viet Nguyen-ngvietlg@gmail.com>
Không có nhận xét nào:
Đăng nhận xét