米グーグルは2016年2月18日、「Google Cloud Vision API」のパブリックβ版を公開した。APIコールのみで画像の特徴的な要素や一般的なランドマークなどをラベル付けしたり、多様な言語の文字認識(OCR)機能を利用できる。
米グーグルは2016年2月18日(米国時間)、「Google Cloud Vision API」のパブリックβ版を公開した。Google Cloud Vision APIは2015年12月に限定β版として発表していたもの。パブリックβ版になったことで、誰でも試せるようになった。APIコールのみで、画像の特徴的な要素や一般的なランドマークなどをラベル付けしたり、多様な言語の文字認識(OCR)機能を利用できる。
限定β版で提供されていた「APIリクエストに画像を埋め込む方法」に加えて、グーグルのクラウドストレージサービスである「Google Cloud Storage」に格納した画像を指定する方法も用意されている。APIの詳細はドキュメントで公開されている。
{
"requests":[
{
"image":{
"source": {
"gcs_image_uri":"gs://bucket-name/path_to_image_object"
}
},
"features": [
{
"type":"LABEL_DETECTION",
"maxResults":1
}
]
}
]
}
このAPIの利用料金は「ユニット」単位で行われる。1つの画像であっても「顔検知」と「ラベル検知」を行った場合は2ユニットとカウントする。日本語版のGoogle Cloud Vision APIを紹介するWebサイトによると、それぞれの機能は1000ユニットまで無料。価格は、ユニット数が多くなればなるほど単価が安くなるように設定されている。
APIコールだけでおよそ欲しい画像認識系の機能が使えるGoogle Cloud Vision APIとは
もう絶望しない! ディープラーニングによる画像認識のビジネス活用事例
Windows系ITエンジニアのための産業用ドローン開発環境Copyright © ITmedia, Inc. All Rights Reserved.