機械学習/ディープラーニングが無料で学べる、米国有名大学の「オンライン講座/講義動画」:AI・機械学習の独学リソース
アメリカのスタンフォード大学/MIT/ハーバード大学/コロンビア大学/ニューヨーク大学といった有名大学の一部では機械学習や深層学習のオンライン講座/講義動画を無料で配信している。その概要と特長をまとめる。
本稿は、2020年8月25日に公開した記事を、2022年8月18日の最新情報に合わせて改訂したものです。主にスタンフォード大学とMIT、ニューヨーク大学の内容を書き直しました。
機械学習やディープラーニング(深層学習)を大学講義(特に海外の有名大学)レベルで徹底的に学びたい。でも本当に留学したり大学に入学したりするのは大変なのでしたくない。
……そのように思っている本格志向の人には、有名大学が提供する良質なのに「無料」のオンライン講座(もしくは講義動画とスライド資料)がお勧めだ。本稿ではその中でも特に有用だと考えられる米国の有名大学(下記の5つ)のものを紹介する。ただし、いずれも当然、講義は英語である(※日本語字幕が付いている場合もある)。
ちなみに、大学講義を大規模に(Massive)公開した(Open)オンライン講座(Online Courses)はMOOCと呼ばれ(※その日本版のJMOOCについては本稿の最後で紹介)、世界中で人気を博している。上記の「オンライン講座」とはMOOCの一種である。MOOCでは、学期ごとに参加者が募集される(※頻繁に学期が開催されているので、ほぼいつでも参加できる)。主に週単位で学んでいき、その週ごとに確認テストがある。また、理解できないことなどがあれば、掲示板を使って参加者同士で教え合いながら解決することが求められる。最後の実力テストをクリアしてコースを修了すると、修了証書(Certificate)を有償で入手することもできる。
また、上記の「講義動画(+スライド資料がある場合も)」は大学講義(+資料)がそのまま誰でも閲覧できる状態で公開されているものだ。確認テストなどはないが、より気軽に視聴/閲覧できるメリットがある。
それでは、大学ごとに紹介していこう。
スタンフォード大学
オンライン講座(Coursera)
本稿の初稿を執筆した2020年時点では、非常に有名なスタンフォード大学による「機械学習」のオンライン講座が存在していたが、いつの間にか無くなってしまったようだ。その代わりに、DeepLearning.AIとスタンフォード大学の共同提供による上記の専門講座(Specialization)が提供開始されている。この専門講座は3つのコースで構成され、いずれも修了証書を得ない「聴講コース」であれば無料で受講できる(※無料トライアル申し込みボタンを押した後に表示されるダイアログの左下に「聴講コース」のテキストリンクがある。ただし聴講コースだと、Pythonコードで機械学習を体験するラボを受講できない)。
講師は、「教えるのがうまい」と定評があり有名なAndrew Ng(アンドリュー・ング)氏だ。構成内容は、
- コース1:教師あり機械学習: 回帰と分類
- 第1週「機械学習の概要」
- 第2週「複数の入力変数で回帰」
- 第3週「分類」
- コース2: 高度な学習アルゴリズム
- 第4週「ニューラルネットワーク」
- 第5週「ニューラルネットワーク:学習」
- 第6週「機械学習の実践適用へのアドバイス」
- 第7週「決定木」
- コース3: 教師なし学習、レコメンデーション、強化学習
- 第8週「教師なし学習」
- 第9週「レコメンデーション」
- 第10週「強化学習」
となっている。
かつての講座と新しい講座では、項目内容も少し変わっているが、教え方が大きく変わったように筆者は感じている。かつての講座は基礎的な数学から分かりやすく教えてくれる内容だったが、新しい講座はより初学者向けに数学をあまり使わずに分かりやすく教えてくれる内容になっており、これが新たな特長/利点となっている。また、かつての講座ではOctaveというマイナーなプログラミング言語を用いていたが、新しい講座ではオプションで学べるラボでJupyterノートブック+Pythonというメジャーなツールを使うので学びやすくなった。「機械学習の基礎」を学びたいなら、取りあえずこの講座を履修するとよい。
同じAndrew Ng氏が提供するオンライン講座に、
- Deep Learning Specialization by deeplearning.ai | Coursera(ディープラーニング専門講座)
もありお勧めではあるが、スタンフォード大学が提供する講座ではないので(※deeplearning.aiが提供)、本稿では説明を割愛する。
講義動画(YouTube)
スタンフォード大学では、以下の通り、過去の講義動画をYouTubeに一般公開してくれている。
- Stanford EE104: 機械学習入門フルコース(Introduction to Machine Learning Full Course) | 2020 - YouTube
- Stanford CS221: 人工知能:原則と技術(Artificial Intelligence: Principles and Techniques) | Autumn 2021 - YouTube(Autumn 2019)
- Stanford CS229: 機械学習(Machine Learning) | Summer 2019 - YouTube(Autumn 2018)
- Stanford CS230: 深層学習(Deep Learning) | Autumn 2018 - YouTube
- Stanford CS224N: 深層学習で自然言語処理(Natural Language Processing with Deep Learning) | Winter 2021 - YouTube(Winter 2019)
- Stanford CS224U: 自然言語理解(Natural Language Understanding) | Spring 2021 - YouTube(Spring 2019)
- Stanford CS224W: グラフで機械学習(Machine Learning with Graphs) | 2021 - YouTube
- Stanford Stanford CS25: トランスフォーマー(Transformers United) | Autumn 2021 - YouTube
- Stanford CS234: 強化学習(Reinforcement Learning) | Winter 2019 - YouTube
- Stanford CS330: 深層マルチタスクとメタ学習(Deep Multi-Task and Meta Learning) | Autumn 2020 - YouTube(2019)
- AA289 - ロボット工学と自律システムのセミナー(Robotics and Autonomous Systems Seminar) - YouTube
これらの講義動画の特長は、YouTubeで気楽に視聴できること。欠点はその裏返しで、講座形式で学友とともに学んだり質問したりできないことだ。
ちなみに、スタンフォード大学は「Stanford Online」というオンライン大学を開校しており、オンラインで日本に居ながら大学のコース(講座)に出席でき、スタンフォード大学工学部の人工知能学士号(=卒業証書)も取得できる。基本的にコースは有料である(※コースごと約60万円で、卒業するには最低4コースを修了する必要があり、1〜3年で数百万円はかかる)。ただし、これは「大学講義への出席」であり、手軽ではないことに注意してほしい。
MIT(マサチューセッツ工科大学)
講義動画(YouTube)+スライド資料
- MIT 6.S191: ディープラーニング入門(Introduction to Deep Learning) 公式ページ
- MIT 6.S191: YouTube再生リスト(2022年/2021年/2020年/2019年/2018年の5年分あり)
MITでは、講座「6.S191」の講義動画(YouTube)とスライド資料が無料で一般公開されている。筆者もいくつか視聴してみて、講義の分かりやすさがとても気に入った。それが特長であり、「入門」と名付けられているように、全10講義+全5演習だけ(下記の箇条書きを参照)でかなり広範な内容が学べるようになっているのもメリットだ。特に、「ディープラーニングの基礎」を短時間でより幅広く学びたい人にお勧めだ。
- 第1講「ディープラーニング入門」
- 第2講「ディープシーケンスモデリング」
- 演習1「TensorFlowの紹介:音楽の生成」
- 第3講「ディープコンピュータビジョン」
- 第4講「深層生成モデリング」
- 演習2「顔認識システムのデバイアス」
- 第5講「深層強化学習」
- 第6講「限界と新境地」
- 演習3「エンド・ツー・エンドの自動運転制御の学習」
- 第7講「LiDARによる自律走行」
- 第8講「ディープラーニングにおける不確実性」
- 演習4「最終プロジェクト」
- 第9講「サイエンスのためのAI」
- 第10講「音声認識」
- 演習5「競技プロジェクト」
ハーバード大学
オンライン講座(edX)
ハーバード大学(edX)も、スタンフォード大学(Coursera)と同様にオンライン講座を開設している。多数のコンテンツを無料で提供しているが、その中の一つがこの講座である。構成内容は、
- 本講座の紹介と歓迎
- 第1節「機械学習入門」
- 第2節「機械学習の基礎」
- 第3節「予測のための線形回帰、平滑化、行列処理」
- 第4節「距離、Knn、クロスバリデーション、生成モデル」
- 第5節「2つ以上のクラスを持つ分類とcaretパッケージ」
- 第6節「モデルフィッティングとレコメンデーションシステム」
- 第7節「最終評価とコースのまとめ」
となっている。ただし、この講座は、
- データサイエンスの専門家修了証書(Professional Certificate in Data Science) | Harvard University(※経歴用の証書であり、大学用の学位ではない)
という(下記の全9講座で構成される)プログラムの8番目の講座である。つまり、事前に7つの講座を受講することが前提条件となっているので注意してほしい。
- 第1講「Data Science: R言語の基本(R Basics)」
- 第2講「Data Science: 視覚化(Visualization)」
- 第3講「Data Science: 確率(Probability)」
- 第4講「Data Science: 推論とモデリング(Inference and Modeling)」
- 第5講「Data Science: 生産性向上ツール(Productivity Tools)」
- 第6講「Data Science: ラングリング(Wrangling)」
- 第7講「Data Science: 線形回帰(Linear Regression)」
- 第8講「Data Science: 機械学習(Machine Learning)」
- 第9講「Data Science: 総仕上げ(Capstone)」
これらの全講座が無料である(特長)。自分のペースで進めることもできるが、全てを指定されたペースで受講すると、1年5カ月かかる(人によっては欠点)。
それだけ時間をかけて学んだのなら、転職などによるキャリアアップ時に「取得済み資格の一つとしてアピールしたい」ということもあるだろう。そんな場合は、修了証書を取得すればよい。プログラム全体の証書取得には991米ドル(2022年8月現在は891.90米ドルに割引中)がかかるものの、約13万円であれば非常に安価といえるだろう(※2020年では491米ドルだったので比較すると価格が約2倍になり、円安でさらに高くなってしまったが……)。
講義動画(YouTube)/オンライン講座
- Harvard CS50AI: Pythonで始める人工知能入門(Introduction to Artificial Intelligence with Python) 公式ページ/edXページ(スライド資料/確認テストあり)
- Harvard CS50AI: YouTube再生リスト(2020年、視聴だけならこちらがお勧め)
ハーバード大学の「CS50」は、「コンピュータサイエンス(CS)とプログラミング技術という知的研究分野への入門」のための講座である。上記の講義動画は、その講座の一部であり、
- 「はじめに」(約2分の紹介動画)
- 第0講「検索」
- 第1講「知識」
- 第2講「不確実性」
- 第3講「最適化」
- 第4講「学習」
- 第5講「ニューラルネットワーク」
- 第6講「言語」
という8本の講義動画で構成されている。
このオンライン講座/講義動画の特長は、約2時間×7本というちょうどよいボリューム感である(特長)。若い講師がメインで登壇しており、勢いがよいので、攻撃的に(=モチベーション高く)勉強できる感じが筆者は好きだ。「人工知能の基礎」について、効率的に学びたい人にお勧めできる。
コロンビア大学
オンライン講座(edX)
コロンビア大学(edX)は、「ColumbiaX」という無料のオンライン講座を展開している。その一つがこの講座である。構成内容は、
- 第1週「アルゴリズム1」
- 第2週「アルゴリズム2」
- 第3週「アルゴリズム3と個人ゲノミクスへの応用」
- 第4週「機械学習」
- 第5週「機械学習の応用」
と5週分と短めである。また、2017年と少し古いのも欠点だ。よって、同じオンライン講座であれば、最初のスタンフォード大学の方がお勧めである。より本格的に学ぶなら、ハーバード大学の方がお勧めだ。「アルゴリズムの基礎」を重点的に学びたい人には、より良い選択肢ではないかと思う。
講義動画(YouTube)+スライド資料
コロンビア大学コンピュータサイエンス学部(COMS)における講座「W4995」の講義動画が無料で視聴できる。この講座は、
- 「チャンネル紹介」(約90秒)
- 第1講「はじめに」
- 第2講「視覚化とMatplotlib」
- 第3講「教師あり学習とモデル検証」
- 第4講「前処理」
- 第5講「回帰の線形モデル」
- 第6講「分類の線形モデル」
- 第7講「決定木とランダムフォレスト」
- 第8講「勾配ブースティング」
- 第9講「モデル評価と評価指標」
- 第10講「キャリブレーション、不均衡データ」
- 第11講「モデル検査と特徴量選択」
- 第12講「AutoML+一部特徴量選択」
- 第13講「次元削減」
- 第14講「クラスタリングと混合モデル」
- 第15講「テキストデータの操作」
- 第16講「テキストデータのトピックモデル」
- 第17講「単語ベクトルと文書埋め込み」
- 第18講「ニューラルネットワーク」
- 第19講「Kerasと畳み込みニューラルネット」
- 第20講「高度ニューラルネットワーク」
- 第21講「時系列と予測」
- ※上記は2020年版。2019年版だと少し構成や動画数が異なる
という22本の講義動画で構成されている。
これらの講義動画では、Python向け機械学習ライブラリー「scikit-learn」を交えながら解説してくれるので、実践活用(=実装)までスムーズに結びつくのが特長だ。約90分×22本という充実のボリュームである。特に「機械学習の実践」を目指して本格的に学びたい人にお勧めだ。
ニューヨーク大学
講義動画(YouTube)+スライド資料
ニューヨーク大学の講座「DS-GA 1008」の講義動画が無料で視聴できる。この講座は、
- 第1週「講義:ディープラーニングの歴史と動機と進化」
- 第1週「演習:分類、線形代数、可視化」
- 第2週「講義:確率的勾配降下法とバックプロパゲーション」
- 第2週「演習:ニューラルネットワークの訓練」
- 第3週「講義:畳み込み型ニューラルネットワーク」
- 第3週「演習:自然信号の特性とCNN」
- 第4週「演習:畳み込みの応用」
- 第5週「講義:最適化」
- 第5週「演習:1次元マルチチャンネル畳み込みと自動勾配」
- 第6週「講義:CNNの応用と、RNN、Attention」
- 第6週「演習:RNNとLSTMアーキテクチャ」
- 第7週「講義:エネルギーベースモデルと自己教師あり学習」
- 第7週「演習:不完備/過完備のオートエンコーダー」
- 第8週「講義:対比法と正則化潜在変数モデル」
- 第8週「講義:変分オートエンコーダー」
- 第9週「講義:グループスパース性と世界モデルと生成的敵対ネットワーク(GAN)」
- 第9週「演習:(エネルギーベースの)生成的敵対ネットワーク」
- 第10週「講義:コンピュータビジョン(CV)における自己教師あり学習(SSL)」
- 第10週「演習:トラックの荷台を斜めに持ち上げる」
- 第11週「講義:PyTorchの活性化関数と損失関数」
- 第11週「演習:不確実性の下での予測と方策学習(PPUU)」
- 第12週「講義:自然言語処理(NLP)の深層学習」
- 第12週「演習:AttentionとTransformer」
- 第13週「講義:グラフ畳み込みニューラルネットワーク(GCN)」
- 第13週「演習:グラフ畳み込みニューラルネットワーク(GCN)」
- 第14週「講義:エネルギーベースモデルによる構造化予測」
- 第14週「演習:オーバーフィットと正則化、ベイズ型ニューラルネット」
- 第15週「演習A:潜在変数エネルギーベースモデル(EBM)の推論」
- 第15週「演習B:潜在変数エネルギーベースモデル(EBM)の学習」
という29本の講義動画で構成されている。
これらの講義動画の特長は、あのYann LeCun(ヤン・ルカン)氏が一部で登壇することだ。ディープラーニングに携わる者/学ぶ者であれば誰もが一度は名前を聞いたことがあるのではないだろうか。それぐらい人工知能の歴史上で有名な人である。
それだけでなく、PyTorchという最新の「ディープラーニング」ライブラリーを使い、Transformerなど最新情報が含まれている。ディープラーニングの初学者が基本から最新情報までをひとっ飛びで学びたい人には(今回紹介した中で)最もお勧めできる。各種資料も充実しているので、ぜひ動画と併せて活用してほしい。
以上、5つの米国有名大学の講義が無料で受講できるオンライン講座と講義動画を紹介した。いずれも骨のあるコンテンツなので、大学で学ぶような覚悟が必要である。また、日本語字幕があるといっても、英語力はかなり必要となる。
「できれば日本語で学びたい」という場合は、
- TSUKUBA OCW「機械学習概論〜ディープラーニングGAN、本格的に学べる全20時間の大学講義が無償公開」
- gacco「機械学習/統計学/データサイエンスの無償gacco動画、全まとめ【2022年春版】」
という2つの記事が参考になるだろう。gaccoの方は、日本版MOOCである「JMOOC」の一つである。MOOCのプラットフォームには主に、スタンフォード大学を中心としたCourseraや、ハーバード大学とMITを中心としたedXなどがあるが、gaccoは(edXと同じ)「Open edX」がベースとなっているので使いやすく、お勧めだ。
Copyright© Digital Advantage Corp. All Rights Reserved.