リスト形式とデータフレーム

食わずぐらい嫌いでしたが、いざ使ってみるとExcelのピボットテーブルは良いものです。
使ったことある人なら解ると思いますが、GUIでデータベースの集計項目、方法を
パッパと切り替え、目的の結果を得られた時には、あぁ^〜こころがぴょんぴょんするんじゃ^〜


で、特にRの「データフレーム」とExcelピポットテーブルに読み込むための「リスト形式」の構造が基本同じってか

関係データベース - Wikipedia

の関係モデル*1そのものなので、

  • Rでデータフレームをゴニョゴニョ操作したものをCSVに落として、ExcelのピポットテーブルでGUIで確認
  • ExcelGUIでデータを俯瞰して、Rでの操作を色々検討
  • 数千万行のログデータをRで読み込んで、Excelで読み込める上限の100万行までカットしたCSVを作成
  • Excelで図にするのが難しいなら、ggplot2でグラフ化を作成


等の連携をすると、単体のみの使用より捗りました。ってか再現性のために全てRでゴニョゴニョしてるとR初心者は軽く死ねます><
GUIなのもあってExcelのほうが学習コストが大変低いのでExcelで挑戦して、Rに反映させる*2って手順でした。

改訂2版 やさしく学ぶ エクセルピボットテーブル
持丸 浩二郎
シーアンドアール研究所
売り上げランキング: 163,129

*1:一行目に項目(名前、年齢、性別、など)あって、二行目以降は項目データのリストが続くだけ^^;

*2:他言語覚えてるとRの文法意味不明、PythonのPandas覚えたほうが幸せらしいw;