コマンド
$0 datafile
$0 < datafile
cat datafile | $0
オプションに関して
[入力に関係するオプション]
-= : 先頭行をヘッダ(列名の並びなどでありデータでは無い)と見なして処理
-@ num : 入力ファイルを読む際に、何行毎に標準エラー出力に報告を出すか。未指定なら1000万行毎。
-l ファイル名 : 個数を数える文字列の対象を含んだファイル名を指定する。出力順序がファイルの各行に記載の順序になる。
-l は、プロセス置換 <( ) を使うと便利。; -l により、メモリを節約できる。; -l と -@ が共にあると、見つかった行数しかざたない。
[出力のオプション]
-f : 出現数で整列する -fr なら逆順にする
-k : キー文字列で整列する -kr なら逆順にする
-n : キー文字列を数と見なして整列する -nr なら逆順にする
-r : 上記を逆順にする。
-y 数値範囲 : 頻度が指定回数のもののみ出力。例 -y 1..3 なら3以下。 3.. なら3以上。2,4,6..8 なら2と4と6,7,8。
-a : 累和を出力 (accumulative sum)
-% : データ件数全体に対する割合を出力
-0 0 : 出力の先頭行に変数名の並びなどを出力しない。
-1 : 個数を出力しない。出現したキー文字列のみ出力。
-2 0 : 最後の二次情報を出力しない。
[派生のオプション]
-i str ; 入力区切り文字
-x N,M ; Nはカラムの切断位置(左から何番目の区切りで切るか), Mは残った文字列を何通り取り出すか。Mが未指定なら12。
-: 文字列の出現行の位置の範囲を出力するようにする。
その他: * freqfreq のような、頻度の頻度を出力するオプションを作りたい。オプションは -F で表したい。 * Ctrl+Cの挙動を文書化したい。 * -1 で動作ミスがある疑いがあったが、-100(-1 -0 0)とオプションを与えると解消した。 * -x で、右側文字列のランキングについて、十分なオプションを設計する必要がある。 * -x で [..]xN の書式の出力の仕方について、もっと柔軟にしたい。