Google Cloud Vision APIのパブリックβ版が公開：画像認識機能が使えるAPI

米グーグルは2016年2月18日、「Google Cloud Vision API」のパブリックβ版を公開した。APIコールのみで画像の特徴的な要素や一般的なランドマークなどをラベル付けしたり、多様な言語の文字認識（OCR）機能を利用できる。

» 2016年02月19日 16時12分公開

[原田美穂，＠IT]

　米グーグルは2016年2月18日（米国時間）、「Google Cloud Vision API」のパブリックβ版を公開した。Google Cloud Vision APIは2015年12月に限定β版として発表していたもの。パブリックβ版になったことで、誰でも試せるようになった。APIコールのみで、画像の特徴的な要素や一般的なランドマークなどをラベル付けしたり、多様な言語の文字認識（OCR）機能を利用できる。

Google Cloud Vision APIによる画像認識のイメージ（出典：米グーグル）

　限定β版で提供されていた「APIリクエストに画像を埋め込む方法」に加えて、グーグルのクラウドストレージサービスである「Google Cloud Storage」に格納した画像を指定する方法も用意されている。APIの詳細はドキュメントで公開されている。

{
  "requests":[
    {
      "image":{
        "source": {
          "gcs_image_uri":"gs://bucket-name/path_to_image_object"
        }
      },
      "features": [
        {
          "type":"LABEL_DETECTION",
          "maxResults":1
        }
      ]
    }
  ]
}

Google Cloud Storageの画像を指定してラベル付けを行う場合のサンプルコード（出典：Google Cloud Vision APIのドキュメント）

　このAPIの利用料金は「ユニット」単位で行われる。1つの画像であっても「顔検知」と「ラベル検知」を行った場合は2ユニットとカウントする。日本語版のGoogle Cloud Vision APIを紹介するWebサイトによると、それぞれの機能は1000ユニットまで無料。価格は、ユニット数が多くなればなるほど単価が安くなるように設定されている。

Google Cloud Vision APIの料金（出典：グーグル）

APIコールだけでおよそ欲しい画像認識系の機能が使えるGoogle Cloud Vision APIとは
グーグルの画像認識APIが限定プレビューに。画像認識や分類などの手間の掛かる実装をAPIコールで外に出せるため、一般的な用途であれば端末側を賢く作り上げる必要がなくなる。
もう絶望しない！ディープラーニングによる画像認識のビジネス活用事例
最近注目を浴びることが多くなった「Deep Learning」と、それを用いた画像に関する施策周りの実装・事例について、リクルートグループにおける実際の開発経験を基に解説していく連載。今回は、Deep Learning／CNN（Convolutional Neural Net）をどうビジネスに活用しているかに焦点を当て、その試行錯誤の過程を紹介します。
Windows系ITエンジニアのための産業用ドローン開発環境
Windows系のITエンジニアのための産業用ドローン開発環境が登場。ドローンワークスは、Windows 10 IoTとMicrosoft Azureを組み合わせた新たなドローン開発プラットフォームを「IoT Technology 2015」で展示。