読者です 読者をやめる 読者になる 読者になる

廿TT

譬如水怙牛過窓櫺 頭角四蹄都過了 因甚麼尾巴過不得

AWK

AWK でかけ算九九の表を作る

AWK

$ seq 9 | awk '{for(i=1;i<10;i++)$i=$1*i;print}' 1 2 3 4 5 6 7 8 9 2 4 6 8 10 12 14 16 18 3 6 9 12 15 18 21 24 27 4 8 12 16 20 24 28 32 36 5 10 15 20 25 30 35 40 45 6 12 18 24 30 36 42 48 54 7 14 21 28 35 42 49 56 63 8 16 24 32 40 48 56 64…

AWK で Reservoir Sampling; テキストからランダムに少数の行を抽出

AWK R

R による溜池サンプリング(Reservoir Sampling)の実験 - 廿TT を踏まえて, AWK でテキストファイルからランダムに1000行非復元抽出するコードを書きました.テスト用のデータをRで生成します. set.seed(1) rmixnorm3 <- function(n) { n1 <- round(n*0.5) n…

AWK で gather と spread

AWK R

はじめに dplyr ユーザーのための AWK 入門 - 廿TT に引き続き、相模原市オープンデータライブラリー | 相模原市 で公開されている駅別乗降人員の推移データを使用して AWK で簡単なデータ整形を行ってみます。 列持ちのデータを行持ちに変える wide フォー…

AWK で新しいことわざを作る

AWK

動機 カットアップで小説を書いたウィリアム・バロウズという作家をご存知だろうか。カットアップとは印刷物の文章をハサミで切って並べ替え、おもしろそうなフレーズができたらそれをそのまま使うという手法だ。実にお手軽。誰にでもまねできそうだ。しかし…

dplyr ユーザーのための AWK 入門

R AWK

はじめに dplyrを使いこなす!基礎編 - Qiita を参考に、相模原市オープンデータライブラリー | 相模原市 で公開されている駅別乗降人員の推移データを使用して dplyr と対比させながら AWK で簡単な集計を行ってみます。 行の絞り込み dplyr でいう filter …

AWK:csv ファイルから欠測値を取り出す

AWK

はじめに 実務で扱うデータにはしばしば欠測値が含まれます。例えばこんな csv ファイルがあったりします。 1, 2, 3 1, 2 1, 2, 3 1, 2, 3 1, 23列の行と2列の行が混在しています。このような列数が不揃いのファイルをそのままエクセルなどの表計算ソフトで…

AWK:空行で区切られたファイルを処理する

AWK

ヘッダとフッタの削除 AWK 再評価の波を感じる。 なるべく書かないawkの使い方 - ザリガニが見ていた...。 統計屋のためのAWK入門 - あんちべ! AWK がどういう言語かは上記の 2 エントリで学んでもらうとして、最近ぼくが使った事例を紹介。こんな感じでヘ…

パイプ(chain 演算子)は合成関数みたいだと思ったことなど

R AWK

R (dplyr) の chain dplyr パッケージがとりあえずはやいというのでいじってみた. しかし chain(チェイン? チェーン?)というやつになかなかなじめなかった.例えば、hist(rnorm(100)) を rnorm(100) %>% hist() みたいに書けるのが chain. library(dplyr)…