TOP
連載一覧
@IT Special
セミナー
eBook
ブログ
アットマーク・アイティ ITエキスパートのための問題解決メディア
Loading
@IT総合トップ >
@ITspecial
Tweet
このエントリーをはてなブックマークに追加

pr

WebOTX WORKS Partner Voices:

漏れのない検索を実現する方法をご存じですか?
住友電工情報システム「QuickSolution」の底力

サービスは基盤の上に成り立ち、基盤はサービスを安定して稼動させるために存在する。WebOTX WORKS Partner Voicesでは、企業システムのインフラを支えるNECのサービス実行基盤「WebOTX」が、パートナーの提供するソリューションにどのように貢献しているのかパートナーへのインタビューを通して紹介する。今回は住友電工情報システムの全文検索エンジン「QuickSolution」とWebOTXの深い関わりを掘り下げよう。
   

エンタープライズサーチとインターネット検索の違いとは

 PCは1人1台が当たり前のいま、企業のノウハウはなんらかの電子情報になっているだろう。企業内の情報を共有することで企業は成長するが、欲しい情報を簡単に探すことは想像以上に難しく、となりの部署にあるノウハウを探すことさえできない場合もある。

 「エンタープライズサーチ」はそのようなニーズから登場した考え方だ。企業内に存在するありとあらゆる情報を対象としたエンタープライズサーチは、一見インターネット検索と同じ手法を適用すればよいと考えがちだが、実際には企業であるがゆえのニーズがある。

 一般的なインターネット検索では動的/静的なHTMLコンテンツやPDF、そしてOffice文書などが対象となるが、エンタープライズサーチではさらにデータベース内の情報やXML文書なども検索対象にする必要がある。そして表記の揺れや、企業に特有の専門用語も考慮しなくてはならない。

 企業のノウハウをいかに簡単に、的確に探し出せるかは企業の生命線ともいうべき重要なポイントだ。住友電工情報システムが提供する全文検索エンジン「QuickSolution」は、企業が蓄積したノウハウを「漏れなく」探すためのソリューションである。

   

「知の発掘」ができるツールを


岸田 正博氏
住友電工情報システム
ビジネスソリューション開発部
QuickSolution開発課
岸田 正博氏

 住友電工情報システムQuickSolution開発課の岸田正博氏は、エンタープライズサーチを「知の発掘」と表現する。その意味は何であろうか。

 一般的なインターネット検索で行っていることは「分かっているものを探す」行為だという。インターネットに存在するさまざまなWebページには、自分が必要としている情報がどこかに存在しているであろう、という前提があるが、エンタープライズサーチでは「分かっていないものを探す」、つまりいままで遭遇していない文書や、さらには存在を予見していない文書までも、いかに検索するかがポイントとなる。

 このためには「ナレッジマネジメント」「ナレッジ・マネジメント」「ナレッジ・マネージメント」というような表記揺れ、スペルミス、短縮表現を吸収するための類似検索アルゴリズムもさることながら、「いかにして漏れのない検索を実現するか」が重要だと岸田氏は述べる。

 このような検索においては、検索対象の文章からワードを切り出す手法が使われる。日本語ではワードとワードの間にスペースがないことから、機械的に複数文字の文字列として分解する「N-gram方式」、また言語に特化したシステム辞書を用意し、その辞書とワードが一致する部分で切り出すような「形態素解析方式」などが利用されることが多い。

 しかし、N-gram方式であると辞書は不要であるという利点はあるが「京都」を検索しようとすると「東京都」もヒットしてしまうという問題があるし、形態素解析方式であると検索精度は高いものの、常に辞書のメンテナンスが必要となる。

 そこでQuickSolutionではそれらの方式の利点のみを組み合わせ、新たに作られた「QSハイブリッド方式」を採用している。この特徴を表でまとめてみよう。

 
N-gram方式
形態素解析方式
QSハイブリッド方式
システム辞書 不要 必要 必要(必須ではない)
インデックス形式 N-gram転置ファイル
:フルテキストインデックス
単語転置ファイル:
単語インデックス
N-gram転置ファイル+単語転置ファイル
長所
● 任意の文字列を検索可能
● 検索漏れがない


● 検索結果にノイズが入りにくい


● 任意の文字列を検索可能
● 検索漏れがない
● 検索結果の上位にノイズが入りにくい
短所
● 検索結果にノイズが入りやすい
  →「京都」で検索して東京都がヒットする
→ 「スキー」で検索して「ウイスキー」がヒットする

● 検索漏れが生じる
  →リカバーできず致命的
● 新語/造語が検索できない
  →辞書のメンテナンスが必要
→インデックス再生成が必要
● 型番の部分一致に弱い
  →「イントラ」で検索して「イントラネット」がヒットしない

● インデックスサイズが大きい
  →インデックス更新時間は従来と同程度
● 検索漏れはN-gramベースの方式でカバーできるため、辞書のメンテナンスおよびインデックスの再生成は必須ではない

表 N-gram、形態素解析、QSハイブリッド方式の比較

 この方式を採用することにより、インデックスサイズが若干大きくなるとはいえ、エンタープライズサーチでは最も重要な「漏れがない検索」を実現することができる。さらに検索エンジン、検索画面ともに多言語対応しており、日本語、英語、中国語、韓国語も検索することが可能だ。

 また指定した検索ワードが文書の先頭に集中する文書ほど、望まれている文書である可能性が高いとするなどのアルゴリズムを基にスコア付けを行う「位置考慮検索」を組み合わせることで、もれなく探し出した文書のうち、最も有効な文書を見つけることが可能だ。QuickSolutionは企業に眠る情報の原石のなかから、“今最も欲しいもの”を的確に発掘できるツールなのだ。

QuickSolutionの検索画面の例 (クリックで拡大表示)

   

基盤は専門家に――トラブルフリーで導入ができた理由

 このように、QuickSolutionは情報をもれなく探すための機能を提供している。しかし、システムとして検索サービスを提供するためには、システムのインフラ部分も重要だ。

 その点でQuickSolutionを支えているのが、NECの提供するJavaベースのサービス実行基盤「WebOTX」である。QuickSolutionはWebOTX Application Server上に構築されており、QuickSolutionにとって「縁の下の力持ち」的な存在だ。

QuickSolutionのシステム構成例

 岸田氏は「あくまで私たちは検索エンジンの機能を向上させることに注力し、基盤となる部分は『もちはもち屋』で専門家にお願いすべきだと考えている」と述べる。その「WebOTX」のサポートに対する評価だが、「お客様のシステム構築時に、私たち経由で問い合わせをするケースもありましたが、即日回答だったと思います」(岸田氏)と現場レベルでの評価も上々のようだ。また社内のサービスでも簡単には止めることができないものが増えるなか、クラスタリングやフェイルオーバーの仕組みを実装することも不可欠である。そのようなエンタープライズクラスの可用性、信頼性を実現するシステム構成に関する情報も豊富に揃っており、「WebOTX上で安心して構築することができた」(岸田氏)という。

 Javaのアプリケーションサーバといえば、真っ先にTomcatが思い浮かぶだろう。QuickSolutionはあくまで検索エンジンであるため、Tomcatをアプリケーションサーバとしてバンドルし提供することもあるが、「実行基盤にWebOTXを利用した案件は安定している。問い合わせやトラブルの数も少なく、 QuickSolutionと親和性が高い」という声も上がっており、導入した企業からも評判が高い。

 NECは2008年7月に基幹業務システム向けのJava最新仕様「Java EE 5」へ準拠した「WebOTX V8」をリリースした。NGNミドルウェア共通APIの基本仕様の採用など、時代を先取りし、揺るぐことのない実行基盤があるからこそ、上に乗るアプリケーションが安心して作れ、安心して使えるのだ。

 今後、NECと住友電工情報システムはエンタープライズサーチの領域でプロモーション協業を展開していくという。セミナーの開催も予定されており、そこではQuickSolutionの具体的な事例、そしてWebOTXの最新情報も紹介される。探すべき情報が社内にあふれているすべての企業にとって注目のセミナーとなりそうだ。

セミナー開催情報

企業内の情報を巧く活用できる秘訣教えます!

 エンタープライズサーチの導入に成功した企業は、それをどのように活用しているのでしょうか? エンタープライズサーチの最新動向と有効的な活用事例、構築事例をご紹介します。企業内検索エンジン「QuickSolution」と、企業インフラエンジン「WebOTX」のコラボレーションで実現するエンタープライズサーチシステムの構築について、ご興味のある方はぜひセミナーにご参加ください。

日時 2008年7月28日(月) 13:30〜17:00
  (13:00〜受付開始)
会場 NECブロードバンドソリューションセンター(品川イーストワンタワー7F)
⇒会場地図はこちら

  詳細は「企業内の情報を巧く活用できる秘訣教えます!」セミナー詳細ページをご覧ください。

提供:日本電気株式会社
企画:アイティメディア 営業本部
制作:@IT 編集部
掲載内容有効期限:2008年7月28日



 ● WebOTX WORKS Partner Voices:
第1回:
漏れのない検索を実現する方法とは
住友電工情報システム
「QuickSolution」
第2回:
AIRにFlash、PDF。アドビ技術の集大成
アドビシステムズ
「LiveCycle ES」
第3回:
既存システムとの連携に不可欠なピース
セゾン情報システムズ
「HULFT」
関連リンク
住友電工情報システム 全文検索エンジン QuickSolution(クイックソリューション)
NECのサービス実行基盤 WebOTX
WebOTXパートナープログラム WebOTX WORKS
NECのサービス実行基盤 WebOTX 事例ご紹介
プレスリリース:
サービス実行基盤「WebOTX」最新版の発売
ITpro SPECIAL:
ユーザー視点での高信頼性の追求が顧客満足度No.1製品の開発を支える

関連記事
NEC、サービス実行基盤と情報管理の2製品を発表 (@IT News)
NEC、JBI対応のAPサーバ/ESBを販売開始
(@IT NewsFlash)
多様なユビキタス・デバイスに対応する サービス実行基盤「WebOTX」(@IT Special)

セミナー開催情報

企業内の情報を巧く活用できる秘訣教えます!

 エンタープライズサーチの導入に成功した企業は、それをどのように活用しているのでしょうか? エンタープライズサーチの最新動向と有効的な活用事例、構築事例をご紹介します。企業内検索エンジン「QuickSolution」と、企業インフラエンジン「WebOTX」のコラボレーションで実現するエンタープライズサーチシステムの構築について、ご興味のある方はぜひセミナーにご参加ください。

日時 2008年7月28日(月) 13:30〜17:00
  (13:00〜受付開始)
会場 NECブロードバンドソリューションセンター(品川イーストワンタワー7F)
⇒会場地図はこちら


 詳細は「企業内の情報を巧く活用できる秘訣教えます!」セミナー詳細ページをご覧ください。


@ITトップ|@IT Special インデックス|会議室|利用規約|プライバシーポリシー|サイトマップ


Copyright © ITmedia, Inc. All Rights Reserved.