com.rondhuit.solr.analysis (RONDHUIT-solr-plugin 4.0.1 API)

クラスのサマリー
クラス	説明
AbstractBufferedCharFilter	サブクラスのために`AbstractBufferedCharFilter.nextChar()`, `AbstractBufferedCharFilter.pushChar(int)`, `AbstractBufferedCharFilter.pushLastChar(int)`, `AbstractBufferedCharFilter.read(char[], int, int)`の各メソッドを提供する。
BasicNGramTokenizer	非推奨 LUCENE-4955 により、本クラスの機能はLucene本体に組み込まれました。
BasicNGramTokenizerFactory	非推奨 LUCENE-4955 により、本クラスの機能はLucene本体に組み込まれました。
ICUTransliterateTokenFilter	ICU4Jの`Transliterator`クラスを使用したトークンテキスト変換。
ICUTransliterateTokenFilterFactory	`ICUTransliterateTokenFilter`のファクトリクラス。
JaBuzzPhraseTokenizer	アルファベット、漢字およびカタカナからなる指定された文字長以上の長さの単語を「専門用語」とみなしてトークンを抽出する。
JaBuzzPhraseTokenizerFactory	`JaBuzzPhraseTokenizer`のファクトリクラス。
JaReadingFilter	別途作成した読み辞書を使用して漢字トークンをよみがなに変換する。
JaReadingFilterFactory	`JaReadingFilter`のファクトリクラス。
JaReadingInjectionFilter	`ReadingAttribute`の読みを`CharTermAttribute`に入れる。
JaReadingInjectionFilterFactory	`JaReadingInjectionFilter`クラスのファクトリ。
JaReadingSynonymFilter	別途作成した読み辞書を使用して漢字トークンをよみがなシノニムに展開する。
JaReadingSynonymFilterFactory	`JaReadingSynonymFilter`のファクトリクラス。
JaStringTypeFilter	トークン文字列の「タイプ」（ひらがな、カタカナ、漢字、アルファベット）を基準にフィルタリングする。
JaStringTypeFilterFactory	`JaStringTypeFilter`のファクトリクラス。
JaSuggestFilter	日本語サジェスト用のフィルター。
JaSuggestFilterFactory	`JaSuggestFilter`のファクトリクラス。
JavaNormalizerCharFilter	`Normalizer`を使用したオフセット補正機能対応の`CharFilter`。
JavaNormalizerCharFilterFactory	`JavaNormalizerCharFilter`のファクトリクラス。
Kanji1GramTokenizer	検索性能を考慮した、漢字のみ1-gramで処理する`Tokenizer`。
Kanji1GramTokenizerFactory	`Kanji1GramTokenizer`のファクトリクラス。
KanjiNumberCharFilter	"四十七"などの漢数字を"47"という算用数字（アラビア数字）に正規化する。
KanjiNumberCharFilterFactory	`KanjiNumberCharFilter`のファクトリクラス。
KatakanaStemCharFilter	`JapaneseKatakanaStemFilter`の`CharFilter`バージョン。
KatakanaStemCharFilterFactory	`KatakanaStemCharFilter`のファクトリクラス。
KnownWordsTokenizer	`FST`上に作成された辞書に掲載されているキーワードだけをトークナイズする。
KnownWordsTokenizerFactory	`KnownWordsTokenizer`のファクトリクラス。
NakaguroCharFilter	外来語に使われる中黒（全角 U+30FB, 半角 U+FF65）の有無を正規化し、相互にヒットするようにする。
NakaguroCharFilterFactory	`NakaguroCharFilter`のファクトリクラス。
NGramKatakanaStemFilter	N-gram系トークナイザーで使える`JapaneseKatakanaStemFilter`。
NGramKatakanaStemFilterFactory	`NGramKatakanaStemFilter`のファクトリクラス。
NGramSynonymTokenizer
NGramSynonymTokenizerFactory	Factory for `NGramSynonymTokenizer`.
OdorijiCharFilter	「時々」と「時時」など、漢字／ひらがな／カタカナ文字の繰り返し記号を使用するいわゆる「踊り字」のサポート。
OdorijiCharFilterFactory	`OdorijiCharFilter`のファクトリクラス。
POSAsMappedBytePayloadTokenFilter	`PartOfSpeechAttribute`のタイプを別に指定されたマップ定義にしたがい1バイト数値の`PayloadAttribute`に変換する`TokenFilter`。
POSAsMappedBytePayloadTokenFilterFactory	`POSAsMappedBytePayloadTokenFilter`のファクトリクラス。
ProlongedSoundMarkCharFilter	全角カタカナまたはひらがなのうしろの下表の文字を長音記号（U+30FC "KATAKANA-HIRAGANA PROLONGED SOUND MARK"）に正規化する`CharFilter`。
ProlongedSoundMarkCharFilterFactory	`ProlongedSoundMarkCharFilter`のファクトリクラス。
SingleTokenFilter	複数のトークンを一つにつなげる。
SingleTokenFilterFactory	`SingleTokenFilter`のファクトリクラス。
SupportTestFilterFactory	記号"/"と","を使って表現されたトークンの位置増分とオフセットを指示に従い設定する。
TypeAsMappedBytePayloadTokenFilter	`TypeAttribute`のタイプを別に指定されたマップ定義にしたがい1バイト数値の`BytesRef`に変換する`TokenFilter`。
TypeAsMappedBytePayloadTokenFilterFactory	`TypeAsMappedBytePayloadTokenFilter`のファクトリクラス。
WarekiCharFilter	和暦年を西暦年に正規化する`CharFilter`。
WarekiCharFilterFactory	`WarekiCharFilter`のファクトリクラス。

列挙型のサマリー
列挙型説明

JaBuzzPhraseTokenizer.Type
「専門用語」の型定義。

列挙型のサマリー
列挙型	説明
JaBuzzPhraseTokenizer.Type	「専門用語」の型定義。

パッケージcom.rondhuit.solr.analysisの説明

CharFilter、Tokenizer、TokenFilterを集めたパッケージ。

パッケージ com.rondhuit.solr.analysis

パッケージcom.rondhuit.solr.analysisの説明