DTAL(旧RCEAL)留学記録

2010年1月から2014年半ばまで在学していたケンブリッジ大学理論・応用言語学科でPhDを取得するまでの記録です。

Corpus Linguistics 2013

ランカスターで開催された標題の学会に出席しました。[twitter:@corpustylistics]さんがまとめてくださった、私を含めた参加者のツイッター上でのつぶやきがここにあります。その中の[twitter:@langstat]さんのツイートにもありますが、今回は(批判的)談話分析系の発表が非常に多かった印象です。ランカスターのCorpus Approaches to Social Sciences(ESRCプロジェクト)もそうですが、コーパスを用いた談話系の研究が増えているのでしょうか。


私は博論の一部を発表しました。データ分析面は面白いのですが、解釈が難しい箇所です。「コーパスSLA」というセッションでの発表であったため、それはSLA的にどうなのか、という指摘を多く受けました。


ところで私はこれまで学会発表は全てスーツで行っており、今回も特に何も考えることなくスーツで発表したのですが、よく周りを見てみるとスーツでの発表は少数派で、ほとんどの発表者はスーツよりはカジュアルな、襟付きシャツ程度の格好で発表していました。これを反省し、次回からは服装を考えようと思います。


二年後のCorpus Linguistics 2015もランカスター大学で開催されるようです。またランカスターかと思う反面、過去三度ランカスターに行っているにもかかわらず、大学以外はほとんど回っていないので、次回はせめてcity centre、あわよくば湖水地方辺りを回りたいと思います。


今回も様々な方にお会いさせて頂き、お世話になりました。特に日本でコーパスの研究をされている方々にはこのような学会でしかお会いすることがないので、お話することができて良かったです。今後ともよろしくお願いします。

Hadley Wickham氏のRcppワークショップ

久しぶりにLondonRに参加してきました。今回はRのggplot2パッケージplyrパッケージの開発者として知られるHadley Wickham氏によるRcppのワークショップが14時半から17時半まで3時間あり、その後、通常の発表が三件(内一件はWickham氏によるもの)という内容でした。Wickham氏は米国の大学の所属ですが、先週、useR! 2013がスペインで開催されたので、そのためにこちらにいらっしゃっているのだと思います。参加者は30名強。平日の昼間ですし、それだけ集まれば十分だと思います。RcppはRの中にC++のコードを埋め込むことができるというRのパッケージ*1で、何度か話を聞いたことはあったのですが、ワークショップ形式で実際に触ったのは初めてです。如何せんC++をほとんど知らず、またC++でコードを書かなければ耐えられないほど時間のかかる処理をRで行うこともないので、すぐに使うことはないでしょうが、ワークショップに出て(あるかどうかわかりませんが)いざという時に触るハードルが随分と低くなったように思います。ワークショップのスライド等はこちらで公開されています。また、更に詳しいチュートリアル調の説明がこちらにあります。


夜のLondonR本体は100名弱の参加者。これまでのLondonRで最大だそうです。ワークショップと共にいつもとは違うパブのファンクションルームで開催され、今回もMango Solutionsがスポンサーとなっているため、パブでのドリンクは無料でした。発表はRevolution Analyticsの方が生存分析について、Mango Solutionsの方がRでのアプリケーション開発についてお話された後、再度Wickham氏が登壇し、Bigger data analysisというタイトルでお話されました。その時のスライドがこちらで公開されています。巨大なデータの変換(transformation)と視覚化の話で、それぞれ現在開発中のdplyrパッケージbigvisパッケージを紹介するという内容でした。詳しくはスライドをご覧ください。ただ私の分野では数千万行というようなデータを扱うことはほとんどないので、この辺りの知識を習得する必要がどの程度あるのかは疑問です。


さて、次回以降もワークショップを予定しているようで、候補として以下が挙がっていました。

  1. RapidR(初心者向け。2時間でR入門を扱う)
  2. EasyR($や[]などのシンタックスを使わず、with関数やsubset関数を使ってデータを触る方法を紹介?)
  3. ggplot2
  4. Connecting R and Excel
  5. The Apply family of functions

多数決で3と5が同数程度だったので、その二つを今後は行うそうです。ggplot2は最近勉強し始めたので興味があります。


ロンドンに行く楽しみの一つは日本食。今回は肴菜亭とmisatoというレストランに行ってきました。こういったまともな日本食が食べられるのは英国ではロンドンならではです。


出す出す詐欺を続けていた博士論文は最後のsupervisionを終え、あとは本当に提出するだけとなりました。もう提出まで指導教官と会うこともありません。今週出そうと思えば出せたのですが、まだ外部審査員が決まっておらず早く出す意味もないことと、私が書き直した部分について指導教官がざっと見てコメントをくださるということで、提出はCL後(再来週の頭)となりそうです。

*1:書籍も出ています

BAAL Language Learning and Teaching SIG 2013

昨年に引き続き、標題の学会に出席しました。主に基調講演の内容をツイートしたものをこちらにまとめています。開催地がロンドンと聞いて、発表もしないのに行くことにしたのですが、ロンドンはロンドンでもKing's Crossから更に1時間半ほどかかる場所が会場で、ケンブリッジから片道2時間半かかったのは予定外でした。参加者は80人強で昨年同様こじんまりとしていて、色々な人達と話す機会があり、良い学会だと思います。来年はLeedsで開催されると聞いています。


博論は特に進展はありません。「もうあと少し」と三ヶ月くらい言われ続けている気がします・・。

語数削減

一時は9万2-3千語あった博士論文ですが、主な主張に直接は影響しないと判断した所を削っていったところ、8万語弱くらいになりました。あと1章、指導教官のコメント待ちの所があり、そのコメントを反映させれば提出できるはずです。削減過程で博論を最初から最後までそこそこ丁寧に読み直したのですが、自分の英文に読みづらい箇所が多いことに気づき、それは主に(1)受動態で(2)be + 過去分詞までの語数が多い(=主部が長い)文が原因でした。指導教官に一度、「Whether 〜 〜 was checked.」という文に対し、「それはSOVの言語の書き方だ」と指摘されたことがあるのですが、確かにそうかもしれません。この辺りはインプットは多量にあるはずなのに必ずしもできないのは、文法性をこえた部分の明示的指導を受けたことや明示的学習を行ったことが少ないからでしょうか。


そういえば三年前に行った研究を元に二年弱前に書いた論文がようやく出ました。Learner Corpus Research 2011の予稿集という形です。
Murakami, A. (2013). Cross-linguistic influence on the accuracy order of L2 English grammatical morphemes. In S. Granger, S. Gaëtanelle, & F. Meunier (Eds.), Twenty years of learner corpus research. Looking back, moving ahead: Corpora and language in use - Proceedings 1 (pp. 325–334). Louvain-la-Neuve: Presses universitaires de Louvain.
私の論文のドラフト版(といっても完成版とほとんど変わりません)は以下からダウンロード可能です。
http://academia.edu/2584364/


最近は特に忙しくもなく、割とのんびりとした日々を過ごしています。ケンブリッジも最高気温が20℃前後と暖かくなってきて、この過ごしやすい季節にゆったりとできるのはありがたいです。

提出間近か

修正に修正を重ねていた博士論文ですが、本日ついに指導教官より「You are done」という言葉を頂きました。変な意味ではないとすると、今月末くらいには提出できるはずです。最後の関門は長さ。上限が8万語のところ、現時点で8万9千語くらいなので、10%ほどカットしなければいけません。オーバーしている自覚はありましたが、せいぜい1000-2000語くらいだと思い込んでいました。図表が合わせて1万5千語以上あったのが誤算でした。しかし経験的に削るのは足すよりも簡単なので、削れるところを削っていけば何とかなるだろうと思っています。


この2-3週間はケンブリッジ大学では年度末で、学部生・修士の学生は試験に明け暮れていたようです。Collegeの図書館も満席に近い状態が続いていましたが、試験期間が終わると同時に学生は来なくなり、好天気とも相まって図書館は閑散とした日々が続いています。これは例年通りの光景で、試験とは特に関係のない私のような学生にとっては快適な時期です。さてその試験ですが、結果は試験単位ではなく、全教科をまとめた形で、Senate House(議事堂?)に学科ごとに掲示されます。一枚のA4紙に、Class I、Class II、Class IIIと書かれており、それぞれの下に学生の名前が記載されています。Class Iが最も良い成績で、Class II、Class IIIと続きます。Class IIは更にDivision 1とDivision 2に分かれます。一般に、最終学年の成績がトータルでClass II Division 1(2-i)以上であると就職は大丈夫だそうです。

LALAとGAM

先週、Looking at Language Acquisition (LALA)というケンブリッジでのワークショップで研究発表を行いました。これは言語習得関係の研究を行なっている博士課程の学生が自身の研究を発表するという恒例のイベントで、例年であればエセックス大学とケンブリッジ大学が合同で行うのですが、今年はエセックス大学からの参加者はおらず、半日のみの開催で発表者も私を含めて計4名と少し寂しいイベントとなりました。それでもケンブリッジ大学で言語習得関係の研究を行なっているスタッフや学生がオーディエンスに勢揃いするため、フィードバックをもらえる良い機会です。全く考えたこともないような質問が飛んでくることはそれほどありませんが、以前に考えて何となくうやむやになっていたようなことを再度突っ込まれたりすると、博論のディフェンス(viva)に向けてまだまだ色々と考えなければと思ってしまいます。また今週金曜日には、コンピューターサイエンス研究科で、計算言語学の専門家(スタッフ+博士課程の学生)を前に研究を発表します。私の研究は必ずしも(というか全く)計算言語学の範疇ではないので、どう受け取られるか不安ではあるものの、これまでなかった機会ですし、また違った視点からのフィードバックをもらえるのではと期待しています。


さて、今日は久しぶりにロンドンに行き、LSEDepartment of Methodologyというところが開講しているトレーニングコースの一つである、一般化加法モデルのコースに出席してきました。博士論文の研究で用いた手法であるため、大体は既知の内容でしたが、こういったトレーニングコースで体系的に学ぶのは良い復習になります。知識が大分整理された気がします。ところでこのトレーニングコース、このほかにもコーパス構築だとかシミュレーションだとかテキスト分類だとか、面白そうな講座が並んでいます。参加費無料ですし、もっと早く知っておけば色々と出席していたかもしれません。

外部審査員

博論は「もう少し」という状態からそれほど進んでいません。指導教官からコメントをもらい、一つ一つの修正はそれほど時間がかからないのですが、如何せん数が多く大変です。ただそれでも遅くとも来月には出せるのでは、という感じになってきました。


そうなると、そろそろ外部審査員を決めなければなりません。ケンブリッジ大学では(英国の大学では?)博士論文は学内から一人、学外から一人の審査員により審査され、それぞれinternal examiner、external examinerと呼ばれます。日本や米国の大学とは違い、指導教官は審査パネルには含まれません。vivaと呼ばれる口述試験では、通常1時間半から2時間程度、審査員二人にみっちりと博士論文の内容について突っ込まれ、その中で自身の論文を弁護しなければなりません。また博士号は論文ではなく人に対して授与されるためか、僅かにですが博士論文以外のことを尋ねられることもあるそうです。ある友人はSLAの博論に対し、「BBCに自身の研究を2分(?)でPRするとしたらどう言うか」と尋ねられたと言っていました。


さて、私の場合、内部審査員はほぼ決まっているのですが、外部審査員はまだ決まっていません。公的には私は審査員の選択には関わらず、博士論文の提出後に指導教官(を通して学科などを通して大学院委員会)が決定・依頼するのですが、実際は指導教官と学生が相談し、指導教官から候補者に非公式に打診を行った後に、公的に大学から依頼する、というのが通常の流れです。この非公式の打診は一般的には博士論文を提出する数ヶ月前に行います(なので私の場合は既に通常のスケジュールと比較して遅いです)。外部審査員は、論文が学位に足るものであるかどうかを判断できる人、というのが絶対条件ですが、その審査ができるだけではなく、今後推薦状などをお願いすることを考え、提出された博士論文を深く且つ高所から理解し、論文提出者を具体的な理由と共に推せる人、というのが望ましい条件です。そうすると、私の場合は学習者コーパスの計量的分析を行っている研究者が望ましいことになるのですが、学習者コーパスの研究者や計量的な言語研究を行っている研究者は国内外に多くいても、その両者を組み合わせた研究を行なっている研究者は意外と見つかりません。米国には数人思い当たる研究者がいるのですが、あいにく学科は米国からの旅費は負担できないので、外部審査員はヨーロッパの研究者限定となります。そういうわけで、外部審査員の選択にやや手間取っています。