Tìm kiếm (search)

Thứ Hai, 23 tháng 7, 2018

DATA VISUALIZATION- PHÂN TÍCH DỮ LIỆU BẰNG BIỂU ĐỒ-dùng R và ggplot2

Như các bạn đã biết là Tôi đang học về R và có tìm hiểu thấy phần mềm này có những công cụ phân tích dữ liệu TUYỆT HAY. Hứng khởi muốn chia sẻ cho mọi người để cùng học hỏi.

Trong ví dụ này Tôi sử dụng dữ liệu với 1309 dòng và 14 cột là dữ liệu về chuyến tàu TITANIC bị va vào băng trôi và đắm vào năm 1912.


tải dữ liệu tại đây:  https://www.kaggle.com/fossouodonald/titaniccsv

Một số câu hỏi như:

Có bao nhiêu người sống sót?
Tỉ lệ sống sót giữa nam và nữ như thế nào?
Tỉ lệ sống sót giữa các hạng vé ?
Tỉ lệ sống sót giữa các hạng vé và giới tính ?

các câu hỏi này đều có thể được trả lời bằng hình ảnh thông qua gói công cụ ggplot2 và phần mềm R

Các bạn thử nghiên cứu R nhé, miễn phí, powerful

Xem clip ở đây.




Một số hình Ảnh từ Clip




Câu lệnh của R

t=file.choose()
da = read.csv(t,header=T)
attach(da)
View(da)

install.packages("ggplot2")
require(ggplot2)

da$survived = as.factor(da$survived)

ggplot(da,aes(x=survived,fill=survived)) + theme_bw() + geom_bar()+ labs(y="Passenger Count",title ="Titanic survived Rate")


ggplot(da,aes(x=sex,fill=survived)) + theme_bw() + geom_bar()+ labs(y="Passenger Count",title ="Titanic survived Rate by Sex")

da$pclass = as.factor(da$pclass)

ggplot(da,aes(x= pclass ,fill=survived)) + theme_bw() + geom_bar()+ labs(y="Passenger Count",title ="Titanic survived Rate by Ticket Class")

ggplot(da,aes(x= sex , fill= survived))+ theme_bw() + facet_wrap( ~ pclass) + geom_bar() + labs(y="Passenger Count",title ="Titanic Survived Rates by Ticket Class and Sex")

Chúc mọi người học hành tốt

<Viet nguyen- ngvietlg@gmail.com>


Không có nhận xét nào:

Đăng nhận xét