Tìm kiếm (search)

Thứ Sáu, 31 tháng 8, 2018

DATA VISUALIZATION- PHÂN TÍCH DỮ LIỆU BẰNG HÌNH ẢNH_GGPLOT2-VIOLIN PLOT

Bài này giới thiệu với các bạn về Violin Plot với ggplot2 và phần mềm R

1. Tải dữ liệu tại đây:  https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results

2. Một sô câu hỏi

Độ tuổi của vận động viên phân bố ra sao?
Độ tuổi vận động viên theo Nam-Nữ?
Độ tuổi nào đạt huy chương nhiều hơn
..........


3. Clip bài giới thiệu



4. Một số hình ảnh từ Clip











5. Danh sách câu lệnh

require(ggplot2)
ggplot(da,aes(factor(0),y=Age)) + theme_bw() + geom_violin(fill="brown2") + labs(title ="Athletes Age Distribution")


ggplot(da,aes(x=Sex, y=Age, fill=Sex)) + theme_bw() + geom_violin() + labs(title ="Athletes Age Distribution by Gender")


ggplot(da,aes(x=Medal, y=Age, fill=Medal)) + theme_bw() + geom_violin() + labs(title ="Athletes Age Distribution by Medal")


ggplot(da,aes(x=Medal, y=Age, fill=Sex)) + theme_bw() + geom_violin() + labs(title ="Athletes Age Distribution by Medal & Gender")


ggplot(da,aes(x=Year, y=Age, fill=factor(Year))) + theme_bw() + geom_violin() + labs(title ="Athletes Age Distribution by Year")


Các bạn tìm hiểu thêm nhé

<Viet Nguyen- ngvietlg@gmail.com>



Không có nhận xét nào:

Đăng nhận xét