読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

readHTMLTable:R から HTML の表を読み込む

XML パッケージの readHTMLTable 関数を使うと簡単に HTML のテーブルを読み込めることを最近知った。

試しに 地域別最低賃金の全国一覧 |厚生労働省 の表を入力してみる。

library(XML)
read1 <- 
 readHTMLTable("http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/koyou_roudou/roudoukijun/minimumichiran/")

これだけ。

とりあえずプロット。

dat1 <-as.numeric(as.character(read1[[1]][,2]))
names(dat1) <- as.character(read1[[1]][,1])

dat2 <-as.character(read1[[1]][,3])
dat2 <- as.numeric(substr(dat2,2,4))

dotchart(rev(dat1),xlab="円",pch=16,
         xlim=c(min(c(dat1,dat2)),max(c(dat1,dat2))),
         main="全国最低賃金一覧")
points(rev(dat2),1:48)
legend("bottomright",c("平成26年度","平成25年度"),pch=c(16,1))

f:id:abrahamcow:20150212003457p:plain

参考:readHTMLTable {XML} | inside-R | A Community Site for R