ニュース
2020年1月版:AI/機械学習/データサイエンス関連ニュースまとめ:学習リソースや業界ニュース
Microsoftの「R」コミュニティー向けブログサイトが、AIや機械学習、データサイエンスなどに関する2020年1月のニュースのまとめを掲載した。
Microsoftの「R」コミュニティー向けブログサイト「Revolutions」が2020年1月31日(米国時間)、人工知能(AI)や機械学習(ML)、データサイエンスなどに関する2020年1月のニュースのまとめを掲載した。
オープンソースAI、ML、データサイエンスに関するニュース
- 「Pandas 1.0.0」がリリース 汎用(はんよう)Pythonデータフレームパッケージがマイルストーンに到達
- 「TensorFlow 2.1.0」がリリース Python 2をサポートする最後のTensorFlowリリース
- 「Karate Club」の開発が前進 Karate Clubは、グラフ構造データを使った教師なし学習に向けた最先端メソッドのライブラリ。Pythonパッケージ「NetworkX」をベースに開発された
- OpenAIが「PyTorch」の標準化を発表 OpenAIによる今後のディープラーニングモデルのリリースに影響しそうだ
- Spark/Rのインタフェース「sparklyr」に進展 Linux Foundationのインキュベーションプロジェクトになり、「sparklyr 1.1」がリリースされた
- オープンソースPythonライブラリ「DiCE」がリリース Microsoft Researchが発表。DiCEは、MLモデルの「Diverse Counterfactual Explanations」に使用される
AI/ML業界ニュース
- Google Cloud Platform(GCP) ML用データの準備プロセスをスピードアップさせる「Auto Data Exploration and Feature Recommendation Tool」をリリース
- Google パブリックデータセットの検索エンジン「Google Dataset Search」の一般提供を開始
- NetflixとAmazon Web Services(AWS) Pythonベースの“人間中心の”データサイエンスフレームワーク「Metaflow」をオープンソースとしてリリース(関連記事)
- RStudioプロジェクト 新たに公益法人となった。同法人はデータサイエンスや科学研究、技術コミュニケーションに向けたフリーなオープンソースソフトウェアの開発を憲章に掲げている
- Facebook 「VizSeq」をオープンソース化。VizSeqは、幅広いテキスト生成タスクのビジュアル解析を簡素化するPythonツールキット
- AWS 新サービス「Open Data on AWS」をリリース。「Registry of Open Data on AWS」により、AWSサービスで公開されているデータを容易に見つけることができる
Microsoftニュース
- 「AI for Health」 予算4000万ドルの5カ年プログラムとして開始。助成金の他、データサイエンス専門家や技術などのリソースを投入し、AIを利用して健康問題に取り組む
- 「Visual Studio Code」 Python拡張であり、Notebookのカーネル選択やターミナルでの環境の自動アクティベーションなどの改良が加わった
- 「Azure Machine Learning」サービス シングルルートI/O仮想化やInfiniBandを備えたVM(仮想マシン)をサポート。BERT(Bidirectional Encoder Representations from Transformers)のような大規模ディープラーニングモデルのトレーニングプロセスをスピードアップさせる狙い
- 「Microsoft Video Indexer」 多言語音声の文字起こしと高精細キーフレームの抽出をサポート。後者はCustom Visionで使用される
- 「Microsoft Translator API」 特定分野に固有の語彙(ごい)やイディオムを使用するカスタム翻訳をサポート
- 「InterpretML」 オープンソースのPythonパッケージのα版がリリース。InterpretMLは、解釈可能なMLモデルをトレーニングし、ブラックボックスシステムを説明するための「Explainable Boosting Machine」を実装する
- 「fairlearn 0.4.1」 AIシステムの公平性を評価し、観察された不公平さを軽減するためのPythonパッケージの最新版が公開
学習リソース
- Computer Vision Recipes コンピュータビジョンシステム構築事例やベストプラクティスガイドラインのリポジトリ。幾つかのシナリオに対応したJupyter Notebookと、PyTorchをベースにしたユーティリティー関数を含む
- NLP Recipes 自然言語処理のベストプラクティスと事例のリポジトリ。最新の手法と一般的なシナリオを実装したJupyter Notebookを含み、テキストと言語に関する問題に取り組む研究者や実務家に人気がある
- AI Now Instituteの2019レポート 政策立案者や提唱者、研究者が、不平等を拡大するAIの使い方に対抗するために何ができるかを解説
- スタンフォード大学のAI Index 2019レポート AIの研究やアプリケーション、影響に関連するデータや指標、トレンドを追いかけたもの
- Mathematics for Machine Learning AIの実装を支える数学的概念を解説した書籍(PDFを入手可能)
- How to select algorithms for Azure Machine Learning 問題の種類などの要件に応じたML手法の選択ガイド
- 「Azure Machine Learning」 時系列予測に向けた自動MLのチュートリアルが公開
- People+AI Guidebook 人間中心のAI製品を設計するためのリソース。Googleが提供
- Data Project Checklist データサイエンスプロジェクトを立ち上げるためのチェックリスト。fast.aiのジェレミー・ハワード氏が提供
- PyTorch: An Imperative Style, High-Performance Deep Learning Library 広く普及したPyTorchフレームワークに関する初の本格的な研究論文
アプリケーション
- AI Dungeon 2 モバイルとWebブラウザ用のテキストアドベンチャーゲーム。OpenAIが開発した高度な文章生成モデル「GPT-2」をベースにしたインタラクティブなストーリーが特徴
- 「生成音楽」の再生 ニューヨーク市にあるホテルのロビーで再生しているもの(ミュージシャンのビョークとMicrosoftのパートナーシップによる)。屋上に設置したカメラに写る鳥の群れや天候の変化に反応して音楽を生成する
- 数学アプリケーション Facebookが、数学の方程式を解くニューラル機械翻訳ベースのAIシステムを開発
- DialoGPT 人間並みの会話の受け答えを生成する大規模トレーニング済みモデル。Microsoft Researchが開発
- VisualizeMNIST 簡単な数字認識モデルのレイヤーを対話的に可視化するWebブラウザベースのツール。レイヤーの「角度」を自由に変更できる
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
機械学習/AIとセキュリティの組み合わせが秘める可能性と2つの課題
機械学習や人工知能(AI)がビジネスを変革する昨今、セキュリティの分野でもAIの活用が進んでいる。企業がセキュリティ対策にAIを取り入れるために必要なことは何か。AIでセキュリティ対策の何が変わるのか。セキュリティエンジニアは、AIとどう向き合うべきなのか。2020年の「AI/機械学習」界わいはこうなる! 10大予測
MLOps/AutoMLなどの自動化に、自然言語処理(BERTなど)、倫理問題/信頼と、2019年の「AI/機械学習」界わいの変化は止まらなかった。2020年はどう進化していくのか? 英語での情報を参考に、10個の大胆予測を行う。普通のエンジニアでも分かるディープラーニング概説
人気過去連載を電子書籍化して無料ダウンロード提供する@IT eBookシリーズ。第58弾は、AI・機械学習・ディープラーニングの基礎の基礎を解説する連載記事。親しみやすい会話形式で気楽に学べる。