public final class JaSynonymTokenizerFactory extends TokenizerFactory implements ResourceLoaderAware
JaSynonymTokenizerのファクトリクラス。useSynonyms=trueが指定されたときは、システム定義類義語辞書(漢字送り仮名表記揺れ辞書)が適用される
(ただしそのためにはSynonymsExtractorを用いてあらかじめ漢字送り仮名表記揺れ辞書を作成しておく必要がある)。
さらに、synonyms属性を使ってユーザ定義類義語辞書ファイルを指定できる(今のところ文字コードはUTF-8固定)。
<fieldType name="text_ja_reading" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
<analyzer type="index">
<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-symbols.txt"/>
<tokenizer class="com.rondhuit.solr.analysis.morpho.JaSynonymTokenizerFactory"
dir="${dicDir}/${dicType}" type="${dicType}" wCostFactor="0.5" cCostFactor="0.5"
synonymMode="fusion" synonyms="synonyms.txt" aggressiveUnknown="true"/>
<filter class="com.rondhuit.solr.analysis.morpho.JaReadingInjectionFilterFactory"/>
<filter class="com.rondhuit.solr.analysis.morpho.CompoundAllFilterFactory" delimiter=""/>
</analyzer>
<analyzer type="query">
<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-symbols.txt"/>
<tokenizer class="com.rondhuit.solr.analysis.morpho.JaSynonymTokenizerFactory"
dir="${dicDir}/${dicType}" type="${dicType}" wCostFactor="0.5" cCostFactor="0.5"
aggressiveUnknown="true"/>
<filter class="com.rondhuit.solr.analysis.morpho.JaSynonymReadingInjectionFilterFactory"/>
<filter class="com.rondhuit.solr.analysis.morpho.CompoundAllFilterFactory" delimiter=""/>
</analyzer>
</fieldType>LUCENE_MATCH_VERSION_PARAM, luceneMatchVersion| コンストラクタと説明 |
|---|
JaSynonymTokenizerFactory(java.util.Map<java.lang.String,java.lang.String> args) |
| 修飾子とタイプ | メソッドと説明 |
|---|---|
Tokenizer |
create(AttributeFactory factory) |
void |
inform(ResourceLoader loader) |
availableTokenizers, create, forName, lookupClass, reloadTokenizersget, get, get, get, get, getBoolean, getChar, getClassArg, getFloat, getInt, getLines, getLuceneMatchVersion, getOriginalArgs, getPattern, getSet, getSnowballWordSet, getWordSet, isExplicitLuceneMatchVersion, require, require, require, requireBoolean, requireChar, requireFloat, requireInt, setExplicitLuceneMatchVersion, splitAt, splitFileNamespublic JaSynonymTokenizerFactory(java.util.Map<java.lang.String,java.lang.String> args)
public Tokenizer create(AttributeFactory factory)
create クラス内 TokenizerFactorypublic void inform(ResourceLoader loader) throws java.io.IOException
inform インタフェース内 ResourceLoaderAwarejava.io.IOExceptionCopyright © 2009-2018 RONDHUIT Co.,Ltd. All Rights Reserved.