Azure Search を触ってみて
Azure Search をいろいろ触ってみてのノートです。最新のアップデート内容とは違う可能性があります。
最初に
Azure Search を知らない場合、参考になる資料です
- Azure Search Deep Dive ~検索エクスペリエンス向上のためのノウハウ徹底解説~ | de:code 2016 | Channel 9
- 2016/5 の de:code 2016 での約1時間の動画。大変参考になり、概要を知ることができます。
- スライド:DEV-018_Azure Search Deep Dive ~検索エクスペリエンス向上のためのノウハウ徹底解説~ - Docs.com
- Azure Search とは | Microsoft Azure | ホスト型クラウド検索サービス
- Azure の公式ドキュメントです
- ここのドキュメントはどのページも参考になります。サンプルもここから取得できます。
- Daiyu Hatakeyama さんの資料(2017/4 追加)
やってみる
開発について
- Azure ポータルからの操作以外に次のツールが用意されているが、自分で REST API を叩いた方が良い。雰囲気をつかむまでは Azure ポータル上で、そのあとは REST API 中心がいい。
ツール
- Azure Search SDK (Azure Search 公式 SDK) NuGet Gallery | Microsoft Azure Search Library 1.1.2
- reddog-io/RedDog.Search: Management library for Microsoft Azure Search
- Azure Search 操作できるポータルサイトを立ち上げる、Azure Web Apps の拡張機能を利用する
- REST API はここを参照 Azure の検索サービスの REST
REST API たたき中心がよい理由は、
- SaaS という特性から。
- 現在、Azure Search は REST API を先行して実装されており、Azure ポータルは二の次の実装、という印象を受ける。Azure のポータル上の変な日本語翻訳に惑わされやすい。
- 試行錯誤等で REST API を何度も叩く可能性あり。
- インデックスは作成した後、一部だけ更新というのができない。
- ツールがプレビュー機能に対応しておらず、プレビュー機能の API を試すことができない。
他
- Azure Search を作成した後、価格レベルが変更できないので注意
- 特に Free で試した後、実際のデータで試したりするとドキュメント数が足りなくて、もう一度作り直す、ということがあって面倒。
- 変更できるようにしてーという Feedback あり。Allow to upgrade the pricing tier – Customer Feedback for Microsoft Azure
- アナライザーは ja.microsoft, ja.lucene どちらともで試した方がよい
- de:code 2016 でも言われていたが、検索対象によって異なってくるので、どちらのアナライザーも実際のデータで試した方がよい。
- CSV は、現在、各行を検索できない。1ファイル単位で検索可能。が、しばらく後検索可能になりそう。please treat each line in a CSV file as a separate document when indexing – Customer Feedback for Microsoft Azure
面白そうな機能
- スコアプロファイリング
- ドキュメント クラッキング (現時点プレビュー)
PDF Microsoft Office 形式: DOCX/DOC、XLSX/XLS、PPTX/PPT、MSG (Outlook 電子メール) HTML XML ZIP EML プレーン テキスト ファイル (.txt) JSON