Tokyo Metropolitan Vocational Skills Development Center

東京都 東京都立中央・城北職業能力開発センター

担当講師インタビュー①

担当講師インタビュー

データサイエンスについての質問 回答者:森川 馨講師

Q この「データサイエンス」コースはどのような講習ですか。

 「データサイエンス」コースは受講される皆さんがスキルアップ、仕事に使うことが前提なので、データサイエンスの基礎からはじめて応用まで機械学習の解析手法も視野に入れて学びます。講義ではExcelなどを使い解析事例の実習を通じて学びます。
 講義ではデータ解析のやり方でなく、その仕組みをしっかり理解することを目標にしています、また、データサイエンスを活用するうえで必要な数学も勉強します。しかし、抽象的な難しい数学はやりません。安心してください。

Q データサイエンスは特定分野職種の方が使うものというイメージがありますが、将来はそうではないのでしょうか。

 最近は、「データサイエンス」という言葉をよく耳にしますが、我々の身の回りにあるデータの統計解析です。ただし、対象となるデータは情報化社会の進展とともに拡大し、従来からの測定データ、調査データのみでなく、画像、音声、そしてデータ量も膨大なビッグデータも対象となり、社会科学、人文科学の分野への応用にもつながり、今後多くの仕事で、多くの人が活用するようになると思います。
 また、コンピュータの発達によりデータ解析は視覚的にも解析結果が分かやすく、使いやすくなっています。ただし、仕事に使うためには、何をやっているか分からないで使うのではダメで、基礎はしっかり勉強する必要があると思います。

Q 高校で文系を選択して以来、数学から遠ざかっています。どこから勉強したらよいですか。

 必要は発明の母です。目の前の課題の解決に向き合い勉強を始めるのがよいと思います。学校では、将来必要になるだろうと色々な教科を習いますが、社会に出てからは、現実に今必要になっていることを出発点に勉強するのが良いと思います。
 データの解析が必要であれば自分に適した(少し易しめの)本を使って、今度はしっかり勉強を始めて下さい。  ただし、勉強には時間がかかります。数学の勉強を始めるのに、高校の数Iから勉強をはじめる必要はありません。
 目の前の課題と真剣に向き合えば道は開けると思います。データ解析の問題に限れば、アプリケーションを使って統計解析の結果が出た、それだけではダメです。結果が出たことは良いことですが、次のステップはその結果がどうして出たのか。その結果は正しいのかを判断できるようになる必要があります。そこをブラックボックスにしないで、勉強を続けてください。そうした努力が実力となり新しい仕事へ次のステップになると思います。


Q データサイエンスの活用を考えた時、数学のどの部分を勉強すべきでしょうか。

 データサイエンスの分野では、データサイエンスコースで取り上げている大学1年で学ぶ「線形代数」と「多変数関数の微分」が必要です。データサイエンスでは、理系分野でも社会科学分野でも多くの要因のある現象を解析するので一般の統計学の入門で学ぶ1変数の統計学では不足で、多変数データの解析が必要になります。そのためには多変数を扱う数学の基礎として線形代数が必要です。
 線形代数は大学1年で理系ではほぼ必須で習います。線形代数のふるさとは、連立方程式ですから使っている計算は難しくありませんが、一方で線形代数は現代数学の出発点でもあるため少し抽象的な部分もあり、大学で学ぶほとんどの学生はその内容が理解できていません(私もそうでした)。
 データ解析をする上では、線形代数の勉強は必須です。線形代数は、大学で既に習っていても社会に出てもう一度勉強し直す分野だと思います。線形代数は少し抽象的だといいましたが、データを線形代数を使って解析することは、線形代数を勉強する上で具体的で大変分かりやすい良い例だと思います。線形代数は数学の2本の柱の一本です。内容はとても深く、現代数学の出発点でもあり、また相対論、量子力学にも繋がっています。

Q アプリの活用等、データサイエンスをやさしく学ぶためのおすすめの方法はありますか。

 データサイエンスをやさしく学ぶというのは、データサイエンスを抽象的でなく、実感を持って学ぶということだと思います。データサイエンスコースでは、実際のデータをExcelを使って解析する中で、解析に使う数式の意味を理解してもらうように努めています。
 もちろん、次のステップとして数式に戻って数式を理解することに努めて欲しいと思います。簡単な計算を練習して、数式に慣れることが理解するには重要であると思います。統計のアプリケーションを使うことは良い経験にはなりますが、それは入り口です。アプリケーションの使い方がデータ解析ではありません。今の時代、複雑な計算にはコンピュータを使いますが、コンピュータで何をやっているのか、その解析結果の意味することが分かることが重要です。
 数学では、聞いたり、読んだりしただけでは不足です。中学、高校でやったようにノートを作り、実際に自分で鉛筆を持って計算練習をすることが理解につながります。

Q データサイエンス、AIという言葉はよく耳にしますが、今後社会や仕事はどう変わっていくのでしょうか。

 ChatGPTに代表されるようにコンピュータサイエンスの進展は著しく脅威であるとも感じられ、我々の仕事を奪うのではないかと不安も感じます。戦争に使う兵器もますます精密になっています。恐ろしいことです。
 ご質問の今後社会や仕事はどう変わっていくのかという質問に正しく私には答えることはできません。何故なら、それらを使うのが人間であり、使う人間の側の問題が絡むからです。
 今後のコンピュータ社会の未来は人間が深く考え、知恵を絞らない限り、明るい未来が今の状況のままで実現するとは思いません。それに対するにはまず相手をよく知ることが必要だと思います。単にAIを恐れるのではなく、どうやってコンピュータが学習するのかその仕組みを知ることは、今後の社会や仕事を考える上で、大きなヒントを得ると思います。
 今やっている「データサイエンスコースでは、統計学の基礎(平均、分散の計算)からニューラルネットワーク(コンピュータが学習する仕組み)、自然言語処理(コンピュータが我々の言葉をどうやって認識するか)を、基礎となる数学も踏まえて勉強しています。勉強すれば、それらがしっかりしたサイエンスに基づいて組み立てられていることが分かると思います。
 学習の中で、漠然とした不安でなく、どこが問題なのかなども分かると思います。私は、ヒトの意に沿うAIでなく、ヒトは愚かですからその愚かさ(弱さ)を我々に示してくれるAIができると良いと思います。
 データサイエンスの活用とは、データに基づいたより正しい判断(ヒトによるバイアス(人間に都合の良い解釈)も入りにくい情報を得る)ができるようになることです。
 私の分野ではEBM(Evidence-Based Medicine:科学的根拠に基づく医療)が目指されていますが、現実には高い壁があります。その壁の多くがヒトの利害に基づいたバイアスの加わった判断や行為、そして社会のしくみにかかわる非科学的事象によることが多いです。我々の生きている社会には多くの問題があります。そして、その問題の一部は解決に向かっていますが、一方でより大きな新たな問題が出現し、トータルには問題は減少するどころか拡大しています。社会のシステムはいかにあるべきか、どのように問題を解決したらよいのか、これからのデータサイエンスが真剣に取り組むべき課題です。社会システムへの課題を上げましたが、データサイエンスは、ビジネスを含め、社会一般に活用されるべきであると思います。データサイエンスは今後の社会の広い分野の仕事で不可欠なツールであると思います。
 データサイエンスの活用が社会のいろいろな問題の解決への手段を提示し、それをヒトが深く考え、知恵を絞って判断していけば、社会はより良い方向に向かっていけるのではないかと思っています。もちろんそうした社会でも社会自身が変わり状況が変わりますから、その時点、時点でデータ(エビデンス)を集め、エビデンスに基づいて社会を変えていくべきだと思います。

Q これから就職・キャリアチェンジを考えている若い世代に伝えたいことはありますか。

 実力をつけて、新しい世界にチャレンジし、社会に役立つ良い仕事をしてほしいと思います。
データサイエンスは今まさに発展している心躍る分野です。現在、データサイエンスで使われている多くの手法は、ここ15年で発展した手法です。しかし、基本となるサイエンスはもちろん変わっていませんし、その基礎となるサイエンス(線形代数や多変数の微分など)をしっかり勉強し、理解する必要はますます高まっています。
 皆さんがおそらく習った統計学、検定・推定のやり方を学ぶ統計学ではなく、その仕組みを理解し、さらに先にも書きましたが、コンピュータが学習するとは、コンピュータが人間の言葉を理解するとはどういうことかを理解することは、これからの社会や人間の在り方を理解する上で重要なことだと思います。データサイエンスの背景となるしくみ、数理に皆さんはおそらく感動すると思います。また、それを支えている数理は人類の共有の財産だと思います。
 ここで使われている数理(サイエンス)はそれほど難しいものではありません。ただし、鉛筆を持って計算練習をするなど中学、高校に戻って、初心に戻って勉強する必要があります。また、勉強には少し時間がかかります。しかしそこから得られる知識はコンピュータ社会への見方を変え、新しい仕事への第一歩となると思います。
 データサイエンスに限りませんが、しっかり勉強して、実力をつけ、新しい仕事にチャレンジし、社会に役立つ良い仕事をして頂きたいと思います。
 さあ、アインシュタインも勉強した「線形代数」の勉強から始めましょう。

(令和6年3月25日)