DTAL(旧RCEAL)留学記録

2010年1月から2014年半ばまで在学していたケンブリッジ大学理論・応用言語学科でPhDを取得するまでの記録です。

Hadley Wickham氏のRcppワークショップ

久しぶりにLondonRに参加してきました。今回はRのggplot2パッケージplyrパッケージの開発者として知られるHadley Wickham氏によるRcppのワークショップが14時半から17時半まで3時間あり、その後、通常の発表が三件(内一件はWickham氏によるもの)という内容でした。Wickham氏は米国の大学の所属ですが、先週、useR! 2013がスペインで開催されたので、そのためにこちらにいらっしゃっているのだと思います。参加者は30名強。平日の昼間ですし、それだけ集まれば十分だと思います。RcppはRの中にC++のコードを埋め込むことができるというRのパッケージ*1で、何度か話を聞いたことはあったのですが、ワークショップ形式で実際に触ったのは初めてです。如何せんC++をほとんど知らず、またC++でコードを書かなければ耐えられないほど時間のかかる処理をRで行うこともないので、すぐに使うことはないでしょうが、ワークショップに出て(あるかどうかわかりませんが)いざという時に触るハードルが随分と低くなったように思います。ワークショップのスライド等はこちらで公開されています。また、更に詳しいチュートリアル調の説明がこちらにあります。


夜のLondonR本体は100名弱の参加者。これまでのLondonRで最大だそうです。ワークショップと共にいつもとは違うパブのファンクションルームで開催され、今回もMango Solutionsがスポンサーとなっているため、パブでのドリンクは無料でした。発表はRevolution Analyticsの方が生存分析について、Mango Solutionsの方がRでのアプリケーション開発についてお話された後、再度Wickham氏が登壇し、Bigger data analysisというタイトルでお話されました。その時のスライドがこちらで公開されています。巨大なデータの変換(transformation)と視覚化の話で、それぞれ現在開発中のdplyrパッケージbigvisパッケージを紹介するという内容でした。詳しくはスライドをご覧ください。ただ私の分野では数千万行というようなデータを扱うことはほとんどないので、この辺りの知識を習得する必要がどの程度あるのかは疑問です。


さて、次回以降もワークショップを予定しているようで、候補として以下が挙がっていました。

  1. RapidR(初心者向け。2時間でR入門を扱う)
  2. EasyR($や[]などのシンタックスを使わず、with関数やsubset関数を使ってデータを触る方法を紹介?)
  3. ggplot2
  4. Connecting R and Excel
  5. The Apply family of functions

多数決で3と5が同数程度だったので、その二つを今後は行うそうです。ggplot2は最近勉強し始めたので興味があります。


ロンドンに行く楽しみの一つは日本食。今回は肴菜亭とmisatoというレストランに行ってきました。こういったまともな日本食が食べられるのは英国ではロンドンならではです。


出す出す詐欺を続けていた博士論文は最後のsupervisionを終え、あとは本当に提出するだけとなりました。もう提出まで指導教官と会うこともありません。今週出そうと思えば出せたのですが、まだ外部審査員が決まっておらず早く出す意味もないことと、私が書き直した部分について指導教官がざっと見てコメントをくださるということで、提出はCL後(再来週の頭)となりそうです。

*1:書籍も出ています