DTAL(旧RCEAL)留学記録

2010年1月から2014年半ばまで在学していたケンブリッジ大学理論・応用言語学科でPhDを取得するまでの記録です。

R. Harald Baayen氏の講演とEnglish Profile Research Seminar

2月6日(木)・7日(金)とケンブリッジに戻り、R. Harald Baayen氏の講演×2(木)と毎年恒例のEnglish Profile Research Seminar(金)に出席してきました。氏は当ブログでも何度か触れていますが、混合効果モデル等の複雑なモデルを言語研究に用いられた、言語研究における(進んだ)統計利用のパイオニアと呼べる方です。これも当ブログで触れたことがありますが、2008年のAnalyzing Linguistic Data: A Practical Introduction to Statistics Using Rは私の統計分析のバイブルです。今回はケンブリッジ大学言語学科(DTAL)のComputational Linguistics Research Clusterという所とLinguistic Society(LingSoc:言語学サークル)が共同で氏をお招きしたようです。


木曜日の午前中はそのリサーチクラスターのイベントで、DTAL所属・元所属の計算言語学コーパス言語学周りの研究を行なっている学生・ポスドクによるdistributional semantics等の発表の後、Baayen氏のGAMM(Generalized Additive Mixed Model: 一般化加法混合モデル)に関する発表。混合効果モデルと加法モデルを組み合わせるというもので、私は2012年のベルギーのイベントでの氏らの発表で初めてその手法を知り、その後、主に氏の論文(これこれ)で更に学び、博士論文にこそ含めませんでしたが、私のデータに走らせたこともあります。今回はベルギーでの発表のGAMMの部分に特化し、更に様々な具体例等を加えたもので、具体的なRコードも含め、色々と学ぶことができました。この辺りは余裕があれば別記事を書いてみたいです。


同日の午後はLingSocのイベントで、Baayen氏による「Implicit Morphology」と題した講演。「言語研究における統計利用のパイオニア」はあくまで氏の副次的な側面で、本職(?)は心理言語学者。本講演ではRescorla-Wagner equationsという学習アルゴリズムを用いて、diphoneを素性として名詞の複数形をアウトプットとするコンピューターモデル(spread activation model)についてお話されました。形態素を明示的に表象として設けなくても複数形を正しく生成でき、また言語獲得過程で見られるような(?)誤りも再現できたとのことです。基となっているモデル自体は2011年にPsychological Review誌上で発表されています。LingSoc後のワインレセプション時とその後の夕食時に色々と直接お話させて頂け、また実際に私のデータを用いてGAMMのミニチュートリアルまでしてくださり、私にとって大変有意義なイベントでした。


金曜日はEnglish Profile Research Seminarへ。2010年に出席し始め、はや5回目の参加です。午前中は主に今年からケンブリッジに設立されたALTA (Automated Language Teaching and Assessment)関係の話。dependency parserの出力を素性空間とした熟達度推定、人工的に誤りを挿入することによるラベル付きデータの生成などについての発表がありました。


続いてはAdam Kilgarriff氏による発表で、以前からあるForBetterEnglish(語を入力すると容易な語彙からなる短い文のみを返してくれるウェブサイト)に加え、SKELL(Sketch Engine for English Language Learning)というウェブサイトを公開されたようです。ここでは語を入力するとその語の文単位でのコンコーダンスライン、ワードスケッチ、シソーラスを見ることができます。背後のコーパスはUKWaCだそうです。ForBetterEnglishもSKELLも外国語教育でのコーパスの直接利用を目指したもので、通常のコンコーダンスラインは学習者には難易度が高く、またSketch Engineのようなウェブコンコーダンサーは多機能な反面直感的な操作がしづらくなってきているので、これらを開発した、という経緯だと理解しています。言語教育でのコーパスの直接利用というと、コンコーダンスラインから帰納的に学習を行うというデータ駆動型学習(DDL)を真っ先に思い浮かべますが、ワードスケッチのような要約情報を文脈とリンクした形で提示するというのは、DDLに比べて現実的な選択肢かもしれないと感じました。


続いてドイツのチームによるPragmatic profile、(私は関わっていませんが)バーミンガムのチームによるmetaphorical competence、最後にNeil Jones氏によるLearning-Oriented Assessmentの話があり、閉会となりました。今年も様々な方々とお話することができ、楽しいイベントでした。来年以降も可能であれば参加したいと思います。

修正版を提出

クリスマス休暇中に博士論文を修正し、一週間ほど前に修正版を内部審査員に送りました。これでOKが出て、大学と大学図書館に製本した論文を提出すれば、学位が確定します。現時点で博士論文を含め、学位に関してこちらが行わなければいけないことはありませんし、そろそろジャーナル論文に着手しようと思っています。


最近はバーミンガムでのプロジェクトはそれほど忙しくなく、勤務時間中(一応9-17時くらいはオフィスにいる必要があります)もアウトプットに加えてインプットに時間を割けています。お陰でRで簡単なGUIの作り方を学んだり、その知識で単機能GUIを作ってみたり、ネットワーク分析について学んだりできています。これが続けば良いのですが、二月の中旬頃からは忙しくなる予定です。

2013年の反省・2014年の抱負

今年を振り返ってみると、前半がケンブリッジで博士論文の仕上げ、後半がバーミンガムでこれまでとは全く異なるプロジェクトでの研究と、大きく二つのフェーズに分けられます。前者に関しては、博士論文の提出が7月になるとは昨年末の段階では全く思っていませんでした。もっと早い段階で提出し、夏前後にviva、その後に働き始める、というイメージを抱いていました。現に一年前の記事では「PhDを取得する(目標というか何をどうするにしても必須!)」というのを目標(?)に挙げています。これは結果的に未達成となりました。言い訳をさせてもらえば、そもそもPhDが必要だと感じていたのは主に就職のためで、年の早い段階にその就職が何とかなりそうだと感じたため早期提出すべき理由が薄れ、ズルズルと提出を引き伸ばしてしまいました。またこれはもう少し後ですが、博士論文の審査員の都合によりvivaが9月以降になることが判明したため、早く提出する意味もありませんでした。少なくとも後者はやむを得ないのですが、それでも審査が11月になり、年越しの段階でも博論の修正が終っていないのは気持ちの良いものではありません。就職活動への影響という実害はないので結果オーライではあるのですが。これはもう来年の抱負にも挙げませんが、早急に修正版を提出して楽になりたいです。


PhD取得に加え、今年の抱負のもう一つは「次のステージがどこのどういうポジションであれ、そこに順応し、そこにいる最大限のメリットを享受するにはどうすれば良いかを考え行動する」というもの。これは結果が見える形にはなっていないものの、概ね満足しています。現ポジションで私に求められているのはコーパス管理、テキスト処理、統計処理などのデータ管理・計量分析周りです。そうであればとここ数カ月はそちらへの傾倒を強め、Rでのプログラミングや統計処理について学び、その知識を仕事上で用いています。


さて、来年の抱負ですが、以下を挙げておきます。

  1. 博士論文を複数の論文に分けてジャーナルに投稿する
  2. 現プロジェクトに関する専門性を深める
  3. 次の職に向け、就職活動を始める


1に関しては、研究は論文等として公開してこそ意味がありますし、実利面からも業績がないと次の職を得るのは難しいと思うので必須です。2に関しては、博士課程ではあまり触れなかったテキストマイニング系の技術や、近々プロジェクト関係で必要になりそうなネットワーク分析を学びたいです。またバーミンガム大学コーパス研究を行っているのですから、コーパスに基づく談話分析のノウハウをその専門家であるプロジェクトメンバーから学び取りたいです。3に関しては、現ポストは2015年8月までですので、2014年の後半には次の職への応募を始めなければなりません。そのためには1で挙げたように業績が必須ですが、それと共に研究計画なども新たに練り直す必要があります。


本年も様々な方にお世話になりました。2014年もよろしくお願い致します。

クリスマスマーケット

バーミンガムでは毎年この時期にFrankfurt Christmas Marketというイベントが開催されているようです。今年は11月14日から12月22日まで行われているとのことで、私も二度行ってきました。街の中心部のメインストリートは出店で埋め尽くされており、英国第二の都市でのイベントだけあってすごい人でした。片田舎であるケンブリッジとはさすがに違います。




出店は飲食類が中心で、ホットドッグやmulled wine、winter Pimm's、チョコレートなどが販売されていました。



さて、博論の修正はまだ苦戦中です。修正を迫られた点のほとんどは既に対処し、残るのは三箇所ほどですが、その内の一つはそれなりに時間がかかることが見えているので、来週仕事がオフになってから取り掛かる予定です。しかし一応終わりが見えてきたような気はしています。

再度引っ越し

10月末に再度引っ越しました。バーミンガムがどのようなところかわからなかったので、最初は短い契約をと思い2ヶ月契約にしたのが間違いで、住み始めて数週間経った頃には既にその後の入居者が決まっており、賃貸契約の延長ができませんでした。仕方なく前住居と同じSelly Oak地区という大学近辺の地区で新居を探したところ、ケンブリッジとは違い住居数は学生数と比較して十分にあるためか、年度始めにもかかわらず比較的容易にいくつも見つかり、そのうちの一つに決めました。今度は1 bedroom、日本でいう1LDKです。




博論の修正は思っていたよりも難航しています。minor correctionとはいえ、おそらくはmajorに近いminorで、少し書き加えれば、あるいは少し書き換えれば修正が終わるといった類のものではありません。viva中にも答に窮するような、真っ当だと感じる指摘を何度も受けており、その多くに関しては根本的な解決は極めて難しいので、少なくとも体裁だけでもなんとか取り繕いたいと考えて修正しているのですが、進捗は芳しくありません。年内に終わらせたいと思っていましたが、そう簡単にはいかなさそうです。

Viva

本日viva(博士論文の口頭審査)があり、minor correctionという結果でした。「修正なしの合格」から「不合格」まで複数段階ある内の上から三番目で、必要な修正を施し、三ヶ月以内に修正版を提出すれば、Degree Committeeの審査を経て、学位が確定します。minor correctionの場合、学位取得に至らないことはほぼありませんので、博士課程を修了することが実質的に決まったと捉えることもできます。


特に結果を心配していたわけではありません。手厳しい(けれどもありがたい)フィードバックも頂いたのでそれを踏まえて論文を修正しなければいけません。そして何よりも博士論文を複数の論文に分けてジャーナルに投稿するという重要な仕事が残っています。しかし留学の最低ラインであった「学位取得」が叶いそうで、とにかく今はほっとしています。

Cambridge Language Sciences

10月3-4日の二日間、ケンブリッジに戻り、Cambridge Language Sciencesの「Language Sciences in the 21st Century: The interdisciplinary challenge」というイベントに参加してきました。Cambridge Language Sciencesとは、ケンブリッジ大学内で言語に関係する研究を行っている部署・研究者を集め、何か学際的な研究を行おうという試みです。今回はマルチリンガリズム、神経言語学と言語進化、言語の多様性と普遍性、言語哲学と計算言語学という四つのセクションがあり、それぞれのセクションで一人基調講演者を学外から招き、他に学内のスタッフが通常発表をいくつか行うという形式でした。通常発表は学内も含めて募集は行われませんでしたが、ポスター発表と後述するspeed presentationは募集があったので応募し、それらの枠で発表してきました。


さて、ポスターはRedcliffeという業者に印刷をお願いしたのですが、あろうことか配送先(勤務先の大学)の郵便番号を書くべきところに自宅の郵便番号を書いてしまったため指定配送先には届かず、またどうしてもその日の内にポスターを受け取らないと間に合わなかったため、£40+で印刷したポスターをさらに£40ほどかけて隣町まで取りに行くというハメに陥りました。そんな高額のポスターですが、初日はポスターセッションとコーヒーブレイクが同時間帯で、しかも二者は別の部屋という運営のまずさもあり、二日間で4-5人が見に来てくださるにとどまりました。先週末のLCRと立て続きに発表で、ポスターは作っただけであまり説明する準備ができていなかったので、構わないのですが、上記のような苦労はなんだったのだという気もします。


もう一つのspeed presentationは、PhDの学生がスライド1枚を使って1分間で自身の研究の紹介を行うというもの。私はトップバッターで、3つの図を1枚のスライドに詰め込み、弾丸トークでそれらを説明するというスタイルを取りました。話すのが速すぎるので理解してもらえるとは思っていなかった(図の印象だけ残れば良いと思っていた)のですが、失笑が各所から漏れたのは予想外で、終了後には「あの弾丸トークの人」という認識をされてしまいました。1分間の発表なので何らかの印象をオーディエンスに残せれば成功と言えると思いますが、こういう印象でも良いのかどうかはわかりません・・・。もちろんそんなことを行ったのは私だけで、ほかの人達はデータではなく対象としている現象を話したり、研究動機を話したりと、比較的ゆるめの発表が多かったです。


さて、7月末のCLから続いた夏〜秋の学会シーズンもこれで終わりです。これからは私自身もまだvivaがあり、勤務先のプロジェクトもあと一ヶ月ほどで本格化する(予定な)ので、研究のアウトプット以外のところに力を入れようと思います。