【大阪】BMXUG勉強会 -Kubernates体験&Watson Discovery入門- 2019年3月27日参加レポート
今回、k8s の体験を目的として参加したのですが、意外な収穫があったので、 共有したく、記事を書くことにしました。hashtag はこちら #bmxug
https://bmxug.connpass.com/event/117966/
Watson Discovery
Watson Discovery とは??
簡単に言うと、IBM 製の検索 API になります。 全文検索システムでおなじみに ElasticSearch とは違った「IBM」ならではの機能が搭載されています。 また、無料で使えるとのことで、興味津々になってしまいました。
どんな特徴があるの?
なにかしらの文章データを WatsonDiscovery に渡してあげることで、 文章にあるコンテキストを種々様々な側面から抽出してくれます。 特に、大量のドキュメントを検索したいときに使う場合に活躍します。
メタ情報による検索
登録した文章データから良い感じのメタ情報を抽出してくれます。 たとえば、下記の属性があるみたいです。
- エンティティ
- リレーション
- キーワード
- カテゴリー
- コンセプト
- セマンティックロール
- センチメント
- エモーション
例えば、怒っている文章を渡すと WatsonDiscovery では、
「怒りのエモーション」メタ情報を付与されます。ほえ〜!すごい!
確かに独自な機能ですよね。
この機能は、日本語ではサポートされていませんでしたが、
2018 年 8 月ごろにできるようになったそうです!
隠れたコンセプトをみつける
文章にあるワードだけでなく、文章にないワードのコンセプトも見出してくれるそうです。 どうなってるんだ!?
クローラも提供されている(WebCrewl)
日本語のニュースを定期的にクロールして、ディスカバリーの辞書を更新してくれる機能もあるそうです。 手段の1つに、URL を指定するだけで勝手にクロールしてくれる方法もあります。簡単だ。。。 これを使えば、データを用意しなくて済みますし、お問い合わせ Q&A みたいなのが簡単に作れちゃいます。
サンプル紹介
例えば、「喜ばれるホワイトデーのプレゼント」で検索してみます。 また、メタ情報検索として、センチメンタル「ポジティブ」を指定。 (データは、WebCrewl で収集済み)
結果を、種々様々な形式のランキングを表示してくれました。 例えば、「いくらお金をつかうか?」というランキングでは、TOP が無料でした。これは面白かった。
visual insight (ベータ版)
ワードの距離を視覚的に見せてくれるそう。wordCloud もありました。
最後に
IBM ならではの、独特の全文検索システム API でした。 無料で使えるそうなので、時間があるときにでも使ってみたいなと思います!