public final class JaSynonymTokenizerFactory extends TokenizerFactory implements ResourceLoaderAware
JaSynonymTokenizer
のファクトリクラス。useSynonyms=trueが指定されたときは、システム定義類義語辞書(漢字送り仮名表記揺れ辞書)が適用される
(ただしそのためにはSynonymsExtractor
を用いてあらかじめ漢字送り仮名表記揺れ辞書を作成しておく必要がある)。
さらに、synonyms属性を使ってユーザ定義類義語辞書ファイルを指定できる(今のところ文字コードはUTF-8固定)。<fieldType name="text_ja_reading" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true"> <analyzer type="index"> <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-symbols.txt"/> <tokenizer class="com.rondhuit.solr.analysis.morpho.JaSynonymTokenizerFactory" dir="${dicDir}/${dicType}" type="${dicType}" wCostFactor="0.5" cCostFactor="0.5" synonymMode="fusion" synonyms="synonyms.txt" aggressiveUnknown="true"/> <filter class="com.rondhuit.solr.analysis.morpho.JaReadingInjectionFilterFactory"/> <filter class="com.rondhuit.solr.analysis.morpho.CompoundAllFilterFactory" delimiter=""/> </analyzer> <analyzer type="query"> <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-symbols.txt"/> <tokenizer class="com.rondhuit.solr.analysis.morpho.JaSynonymTokenizerFactory" dir="${dicDir}/${dicType}" type="${dicType}" wCostFactor="0.5" cCostFactor="0.5" aggressiveUnknown="true"/> <filter class="com.rondhuit.solr.analysis.morpho.JaSynonymReadingInjectionFilterFactory"/> <filter class="com.rondhuit.solr.analysis.morpho.CompoundAllFilterFactory" delimiter=""/> </analyzer> </fieldType>
LUCENE_MATCH_VERSION_PARAM, luceneMatchVersion
コンストラクタと説明 |
---|
JaSynonymTokenizerFactory(java.util.Map<java.lang.String,java.lang.String> args) |
修飾子とタイプ | メソッドと説明 |
---|---|
Tokenizer |
create(AttributeFactory factory) |
void |
inform(ResourceLoader loader) |
availableTokenizers, create, forName, lookupClass, reloadTokenizers
get, get, get, get, get, getBoolean, getChar, getClassArg, getFloat, getInt, getLines, getLuceneMatchVersion, getOriginalArgs, getPattern, getSet, getSnowballWordSet, getWordSet, isExplicitLuceneMatchVersion, require, require, require, requireBoolean, requireChar, requireFloat, requireInt, setExplicitLuceneMatchVersion, splitAt, splitFileNames
public JaSynonymTokenizerFactory(java.util.Map<java.lang.String,java.lang.String> args)
public Tokenizer create(AttributeFactory factory)
create
クラス内 TokenizerFactory
public void inform(ResourceLoader loader) throws java.io.IOException
inform
インタフェース内 ResourceLoaderAware
java.io.IOException
Copyright © 2009-2018 RONDHUIT Co.,Ltd. All Rights Reserved.