「データを多角的に見る視点」を学ぶデータサイエンス教育にも期待がかかる
立教大学 ウエルネス研究所
健康をより積極的に、かつ多次元的にみた「ウエルネス」をテーマに活動する立教大学 ウエルネス研究所。ここで新たに立ち上げられた「熱中症プロジェクト」の研究を支える一方、学生のみなさんのデータサイエンス教育にも貢献したのが、TIBCO Spotfireによるデータ分析とその可視化、そして「新たな気づき」でした。ここではその経緯と導入後の活用ぶりについて、ウエルネス研究所 所長の石渡氏、研究所員の中村氏にうかがいました。
[お話を伺った方]
立教大学 コミュニティ福祉学部スポーツウエルネス学科 教授
立教大学 ウエルネス研究所 所長(2021年度)
石渡 貴之 氏
立教大学 ウエルネス研究所 所員
中村 大輔 氏
― ウエルネス研究所についてお聞かせいただけますか。
石渡氏 : 立教大学には学部や大学院研究科といった教育の側面を持つ組織とは別に、研究を主目的とする「研究所」という組織があり、ウエルネス研究所もそのひとつです。研究成果を学内外や地域社会に公開し、ウエルネスに関する諸サービスを提供することを目的としています。
「ウエルネス」というのは「健康」と近いニュアンスで捉えられがちですが、実際はより積極的に、かつ多次元的にみた「健康観」を表す概念です。この領域の研究に関しては「運動」、「スポーツ」、「レクリエーション」、「福祉」、「教育」、「栄養」、「医療」、「宗教」、「心理」といった、多角的・多次元的なアプローチが要請されています。そこで研究所の活動も幅広く、いわゆる研究発表に加えて、さまざまなジャンル・テーマの講演会、ヨガなどの講習会、映画の上映会なども開催しています。
研究所員も大学教員だけではなく、付属小学校・中学校・高校の教職員もいますし、研究を学際的に発展させるため、外部の研究者も迎えています。
― 中村先生は、外部の研究者としてウエルネス研究所に入られたのですね。
石渡氏 : そうです。中村先生は以前所属されていた国立スポーツ科学研究所や株式会社ウェザーニューズで、アスリートの暑熱対策に携わっていました。私は環境生理学、温熱生理学を専門分野とし、体温調節の研究をしています。中村先生をお迎えしたのを機に、それぞれの経験やウェザーニューズが専門とする気候関連のリソースを活かそうと「熱中症プロジェクト」が立ち上がったのです。
熱中症については、国が収集している膨大な量のデータ、いわゆるビッグデータがある。ならばこれを活用するプロジェクトが良いだろうということで、データ分析に乗り出すことになりました。
― では、Spotfire導入のきっかけも、熱中症プロジェクトだったのですか。
中村氏 : はい。それまでは表計算ソフトと統計解析ツールでデータ分析をしていたのですが、熱中症プロジェクトで扱う膨大なデータ量は、表計算ソフトではとても扱いきれません。
どのくらいのデータ量かというと、まずは毎年6月1日~9月30日のだいたい120日間、全国各都道府県の熱中症に関するRAWデータが10年分あります。概算すると120(日数)×47(都道府県数)×10(年数)、これだけで56,400件です。カラムは都道府県や搬送件数などで10ほどあるでしょうか。そこに気象条件などのデータもありますから、表計算ソフトだと正直、嫌になるほどの量ですよね(笑)。
それに今回は全国各都道府県のデータということで「地図上に熱中症の発生状況などのデータを重ねて見られるようにしたい」と考え、マップチャート機能があるSpotfireに出会いました。デモを拝見していくうちにビッグデータの扱いやすさ、前処理、データ可視化、統計処理など研究に必要なデータ分析機能がオールインワンで搭載されていることが導入のきっかけです。
― Spotfire導入後の手応えや、成果はいかがですか。
中村氏 : いわゆる“作業”の時間が飛躍的に短縮されました。例えばRAWデータの数が合っているか逐一確認して、合わないところを探し当てて処理する……といったこともそれまでは表計算ソフトで時間をかけてやっていたわけですが、Spotfireだと一度に確認できる。データの結合や複雑な前処理もSpotfireのデータキャンバス機能を使えば容易化でき、すぐにグラフ化できますし、有意差の確認で用いる高度な統計処理もノーコードで簡単にできる。
こうした作業の時間が浮いた分、研究が効率化できたと言いたいところなのですが、これもSpotfireのおかげで手軽かつ探索的にデータを見ることができるようになって、データに向き合う時間はむしろ長くなっているかもしれないです(笑)。ビッグデータに限らず「もはやSpotfireがないとデータ分析自体が無理だ」というくらい活用していますね。
― 中村先生のSpotfire導入がきっかけで、研究室の学生のみなさんもSpotfireを使っていらっしゃるそうですね。
石渡氏 : 我々のようなスポーツ関連の研究では、ビッグデータを扱う研究は行ってきませんでした。ところが創薬研究ではSpotfireが使われていることを聞いて、それほどのツールであれば学生に経験させておくことで将来役立つのではないかと思いました。
学生であっても、もはや表計算ソフトを使えるのは当たり前になりつつあります。そこで、もう一歩踏み込んだスキルを身に着け、他にない強みを作って欲しいと考えていました。そんな折に中村先生の様子に触れ、「Spotfireを通じてデータを多角的に見る経験をし、視野を広げること」が学生の強みになるのではないかと感じたのです。
そこで、まず私のゼミ生のうち3年生の12名に、NTTコム オンラインの担当者によるレクチャーを受けてもらい、Spotfireを使って自分の実験データをまとめるという課題を課しました。
― Spotfireを導入したことで、学生のみなさんにも変化が見られましたか。
石渡氏 : まだ始めたばかりですから、正直見やすいグラフを作るようなことはできても、一歩踏み込んだ分析をするまでには至っていないですね。
それでもいろいろ面白い取り組みはありました。例えば、大学野球部の選手ごとの球速と、身長・体重といったデータの関係性を分析したものや、同じく野球部の担当ポジション別に腰痛と筋肉量の関係性を分析したものなどですね。今回はデータもそれほど多くなかったのですが、来年度はこの学生たちが4年生になり、卒業研究にあたってもっと多くのデータを扱うようになりますから、Spotfireがあることで面白い分析ができるのではないかと期待しています。
Spotfireの特徴として「さまざまな条件のグラフを瞬時に作れる」、例えばデータのばらつきを瞬時に把握して、そこに対する仮説を立てさらに別のグラフを作るといったこともすぐできる点があります。こうした機能を使いこなしていくことで、表計算ソフトでは今まで得られなかった「データを多角的に見る」ことを、学生が本質的に理解する機会にもなると考えています。
― ところで、熱中症プロジェクトは今どのような状況にあるのですか。
中村氏 : このプロジェクトで執筆した熱中症と暑さ指数(WGBT)に関する論文を国際科学雑誌に投稿し、現在査読中です。
熱中症における日常生活での注意喚起について、日本は全国統一の「暑さ指数」を指針としています。例えば「暑さ指数28℃~31℃になったら厳重警戒」という指針は、北海道でも九州でも、6月でも9月でも同じなんですね。
ところが関連データを分析してみると、6月には暑さ指数22℃~23℃の段階で、すでに熱中症での救急搬送件数が増加し始めていることがわかりました。これは、まだ体が暑さに慣れていないので、比較的暑さ指数が低い状態でも熱中症になりやすいのだと見られます。地域によっても、比較的早い時期から暑くなる地域と、真夏でも涼しい地域では、熱中症での搬送件数が増えるポイントに差があります。そこで、地域や時期を分けた熱中症危険度の指標を設け、より実態に即した注意喚起をするべきだ……といった内容です。
どのタイミングで搬送件数が増加するかは、Spotfireでトレリス機能(グラフを格子状にグループ分割表示できる機能)を使って可視化しました。絶対数はやはり7~8月が多いのですが、6月は暑さ指数が低くても搬送件数が増えているのがわかりました。
石渡氏 : 中村先生が今回こうしてSpotfireで分析してくれるまで、スポーツウエルネス分野ではビッグデータを扱える研究者がいなかったのです。これからは学校でのスポーツ事故のデータを分析するなど、さまざまな研究にビッグデータが活用できるだろうと楽しみにしています。
学生たちも今はゼミの中でSpotfireを使っているだけですが、卒業研究には他の教員も携わりますから、Spotfireの評判は教員、学科、学部……と徐々に広がっていくのではないかと見ています。そこからも、さらに面白い分析や研究が生まれてほしいですね。
― IoTの広がりなどで、スポーツウエルネス分野でも有用なデータが入手しやすい環境になってきているはずですし、これからの展開には期待が高まりますね。Spotfireが教育・研究のためのツールとしてさらにお役に立てるよう、我々も引き続きサポートします。本日はありがとうございました。
※掲載内容は2022年1月時点の情報です。