Solr4.0起動時のエラーのメモ
solr3.6の起動時のエラー:org.apache.solr.common.SolrException: undefined field text
solr4.0から導入された_version_フィールド
LimitTokenCountFilterFactory config parsing is totally broken
2013年1月17日木曜日
さくらVPS CentOS6.2でSolr4.0を使って「魔法少女まどか☆マギカ」の台詞を全文検索
- Solr 4.0 のインストール 細かい設定は、さくらVPS CentOS6.2でSolr4.0のチュートリアルに従って設定済みのため、詳細は割愛する。
- ディレクトリの用意
- 不要ファイルの削除
- solr.xmlの編集 以下のとおりになっていることを確認する。
- schema.xmlの編集
- solrconfig.xmlの編集
- solrの起動
- beautifulsoupのインストール 別ターミナルを開いて、beautifulsoupのインストールをする。
- インストール魔法少女まどか☆マギカの台詞のデータをダウンロード Apache Mahout 機械学習Libraryを使って「魔法少女まどか☆マギカ」の台詞をテキストマイニングしてみたを参考に、台詞をjsonで保存する。
- solrの起動
- madmagiのデータインポート 別ターミナルを開いて、データのインポートをする。
- 管理コンソールの起動 ブラウザから、「http://IPアドレス:8983/solr/#/madmagi/query」を起動し、管理コンソールから検索できるか確認する。
defaultCoreName="madmagi"
core name="madmagi"
instanceDir="madmagi"
以下の内容をコピペする。
Ctrl+Cで終了する。
(1/31追記)solrconfig.xmlを編集する。
以下をコメントアウトする。
以下の内容をコピペする。
Ctrl+Cで終了する。
以下のスクリプトを実行する。
出力結果を確認する。
登録:
投稿 (Atom)