edX

社会科学のためのデータサイエンスを勉強する

こんにちは、ナスビーニョです。今回は、昨今の社会科学に必要なデータサイエンスが学べる講座をインターネット上で見つけたので紹介していきます。

今回使う教材は、edXで提供されている「Data Analysis for Social Scientists」というコースです。

Edxは、MOOCと言われる無料で授業を公開しているウェブサイトになります。

https://www.edx.org/

詳しくは下記の記事もどうぞ

あわせて読みたい
お金がなければ、MOOCを使って勉強しよう(一流大学の授業を無料で受ける)こんにちは、ナスビーニョです。今回はMOOC(ムーク)について紹介します。 MOOCとは MOOC(ムーク)とは、Massive O...

Data Analysis for Social Scientists

このコースでは、データを利用することにより文化的・社会的・経済的政策を読み解くことが目標となっています。

データ分析の基となっている、確率・統計の基礎から勉強するので、初学者でもしっかりとデータサイエンスが分かるようになるように作られています。

またRを使い、実際に回帰分析を行うなど、実証研究を見据えたコースとなっています。

※このコースはMITにが提供しているMicroMastersにおける、DEDP program, SDS programの対象科目となっています。

MicroMastersについてはこちらを参考にしてください。

DEDP programについてはこちら

SDS programについてはこちら

また、MicroMastersについてはこちらの記事に書いています。

あわせて読みたい
お金をかけずに修士号取得?MicroMastersとはこんにちは、ナスビーニョです。今回は、edx上で取得できるMicroMastersというプログラムを紹介したいと思います。 Micro...

シラバス

シラバスを和訳したものを載せておきます。

こちらからシラバスにアクセスできます。

MODULE 1: INTRODUCTION

  • Rの練習
  • データサイエンスの意義

MODULE 2: FUNDAMENTALS OF PROBABILITY, RANDOM
VARIABLES, JOINT DISTRIBUTIONS, AND COLLECTING DATA

  • 確率の基礎/確率変数
  • 確率分布
  • データの収集法

MODULE3: DESCRIBING DATA, JOINT AND CONDITIONAL
DISTRIBUTIONS OF RANDOM VARIABLES

  • 調査における原則と実践する際の手順
  • カーネル密度推定
  • 同時分布・周辺分布・条件付分布

MODULE 4: JOINT, MARGINAL, AND CONDITIONAL
DISTRIBUTIONS & FUNCTIONS OF RANDOM VARIABLES

  • 確率分布・期待値・分散
  • 基礎的な回帰分析

MODULE5: SPECIAL DISTRIBUTIONS, THE SAMPLE MEAN,THE CENTRAL LIMIT THEOREM AND ESTIMATION

  • 特別な分布
  • 標本平均・中心極限定理・推定

MODULE 6: ASSESSING AND DERIVING ESTIMATORSCONFIDENCE, INTERVALS AND HYPOTHESIS TESTING

  • 推定値の導出
  • 信頼区間の解釈
  • 仮説検定

MODULE 7: CAUSALITY, ANALYZING RANDOMIZED EXPERIMENTS, & NONPARAMETRIC REGRESSION

  • 対照実験
  • ノンパラメトリック回帰

MODULE 8: SINGLE AND MULTIVARIATE LINEAR MODELS

  • 単回帰モデルと重回帰モデル

MODULE 9: PRACTICAL ISSUES IN RUNNING REGRESSIONS, AND OMITTED VARIABLE BIAS

  • 固定効果、その他のモデル
  • 回帰不連続デザイン

MODULE 10: INTRO TO MACHINE LEARNING AND DATA
VISUALIZATION

  • 予測のための機械学習
  • データの視覚化

MODULE11: ENDOGENEITY, INSTRUMENTAL VARIABLES, AND EXPERIMENTAL DESIGN

  • 内生性問題
  • 操作変数
  • 実証研究の仕方

内容は、計量経済学を学ぶのにかなり似ていると思いますが、計量経済学の基となっている統計・確率もしっかり学べるようになっています。

履修要件

先ほどのシラバスのページに履修要件が載っています。

履修要件:高校程度の数学が出来ること。

※確率・統計の前提知識は不要

シラバスには書いていませんが、講義は英語で行われるので、英語である程度理解できることが求めらます。ただ、字幕等は付けられるので、英語が苦手な方でも対応可能であると思います。

スケジュール

スケジュールについてはこちらからアクセスできます。

履修する上で大事な日付を挙げておきます。

9月11日 受講開始 / Module 1

9月18日 Module2 /Module 1宿題 締め切り

・・・

11月26日 Module10 課題 / 最終試験締め切り

このように、1週間ごとにModuleが公開されます。またModuleが公開された1週間後に宿題が締め切りとなるので、修了書を取得したい人は締め切りに気を付けてください。

今回は、これで終わりです。シラバスの内容を見るとかなり難しく感じますが、頑張って履修していきます(笑)。同じく履修する方も一緒に頑張りましょう!