日本における、コロナウイルス感染者確認数(日毎)

library(tidyverse) 
library(rvest)
url <- "https://www.mhlw.go.jp/stf/newpage_09849.html"
h <- read_html(url)
tab <- h %>% html_nodes("table")
tab <- tab[[3]] %>% html_table 
# str(tab)
dat <- tab
colnames <- dat[1,]
colnames(dat) <- colnames
dat <- dat[2:181,]
dat <- dat[,3:5]
dat
dat0 <- dat %>% group_by(性別) %>% summarize(計 = n()) %>% mutate(割合 = 計/sum(計))
dat0 %>% ggplot(aes(性別, 計)) + geom_col(aes(fill = 性別)) +
  theme_gray(base_family = "HiraKakuPro-W3")

dat1 <- dat %>% group_by(年代, 性別) %>% summarize(計 = n())
dat1 %>% ggplot(aes(x = 年代, y = 計, fill = 性別)) + geom_bar(stat = "identity") + 
  theme_gray(base_family = "HiraKakuPro-W3")

dat2 <- dat %>% group_by(確定日, 性別) %>% summarize(計 = n()) 
dat2$確定日[dat2[,1]=='2/1']<-'2/01'
dat2$確定日[dat2[,1]=='2/2']<-'2/02'
dat2$確定日[dat2[,1]=='2/3']<-'2/03'
dat2$確定日[dat2[,1]=='2/4']<-'2/04'
dat2$確定日[dat2[,1]=='2/5']<-'2/05'
dat2$確定日[dat2[,1]=='2/6']<-'2/06'
dat2$確定日[dat2[,1]=='2/7']<-'2/07'
dat2$確定日[dat2[,1]=='2/8']<-'2/08'
dat2$確定日[dat2[,1]=='2/9']<-'2/09'
dat2 %>% ggplot(aes(x = 確定日, y = 計, fill = 性別)) + geom_bar(stat = "identity") +  
  theme_gray(base_family = "HiraKakuPro-W3")

参考