Tìm kiếm (search)

Thứ Bảy, 8 tháng 9, 2018

DATA VISUALIZATION- PHÂN TÍCH DỮ LIỆU BẰNG HÌNH ẢNH_GGPLOT2-BOXPLOT

Bài này giới thiệu với các bạn về BoxPlot với ggplot2 và phần mềm R

1. Tải dữ liệu tại đây:  https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results

2. Một sô câu hỏi

Chiều cao của các vận động viên ra sao?
Chiều cao vận động viên Nam và Nữ như thế nào?
Chiều cao vận động viên qua các kỳ Olympic?
Chiều cao vận động viên theo Huy chương?

3. Clip bài giới thiệu


4. Một số hình ảnh từ Clip






5. Danh sách câu lệnh

t = file.choose() ## File: athlete_events.csv
da=read.csv(t,header=T)
attach(da)
View(da)

require(ggplot2)
ggplot(da,aes(y=Height)) + theme_bw() + geom_boxplot(fill="green",outlier.color = "red") + labs(title ="Players Height Distribution")

ggplot(da,aes(y=Height)) + theme_bw() + geom_boxplot(fill="brown2",outlier.color = "red") + labs(title ="Players Height Distribution") + coord_flip()

ggplot(da,aes(x=Sex, y=Height, fill=Sex)) + theme_bw() + geom_boxplot(outlier.color = "red") + labs(title ="Players Height Distribution by Gender")

ggplot(da,aes(x=Sex, y=Height, fill=Sex)) + theme_bw() + geom_boxplot(outlier.color = "red") + labs(title ="Players Height Distribution by Gender") + coord_flip()

ggplot(da,aes(x=Medal, y=Height, fill=Sex)) + theme_bw() + geom_boxplot(outlier.color = "red") + labs(title ="Players Height Distribution by Gender")

ggplot(da,aes(x=Year, y=Height, fill=factor(Year))) + theme_bw() + geom_boxplot(outlier.color = "red") + labs(title ="Players Height Distribution by Olympics Years")

Clip này Tôi làm khi đi công tác ở California, hôm nay cuối tuần chuẩn bị đi chơi chút nên làm vội chút nên chưa chau chuốt lắm, sai sót gì các bạn góp ý kiến xây dựng bổ xung nhé. Chúc các bạn học hành tốt, công tác tốt.

<Viet Nguyen- ngvietlg@gmail.com>



Không có nhận xét nào:

Đăng nhận xét