public class JaBuzzPhraseTokenizer extends Tokenizer
修飾子とタイプ | クラスと説明 |
---|---|
static class |
JaBuzzPhraseTokenizer.Type
「専門用語」の型定義。
|
AttributeSource.State
修飾子とタイプ | フィールドと説明 |
---|---|
static boolean |
DEFAULT_ALLOW_MIX
カタカナと漢字からなる単語を許可するか否かのデフォルト
|
static int |
DEFAULT_MIN_ALPHABET_LEN
専門用語とみなすアルファベット単語のデフォルトの最小文字長
|
static int |
DEFAULT_MIN_KANJI_LEN
専門用語とみなす漢字単語のデフォルトの最小文字長
|
static int |
DEFAULT_MIN_KATAKANA_LEN
専門用語とみなすカタカナ単語のデフォルトの最小文字長
|
static int |
DEFAULT_MIN_MIX_LEN
専門用語とみなすカタカナ+漢字ミックス単語のデフォルトの最小文字長
|
DEFAULT_TOKEN_ATTRIBUTE_FACTORY
コンストラクタと説明 |
---|
JaBuzzPhraseTokenizer() |
JaBuzzPhraseTokenizer(AttributeFactory factory) |
JaBuzzPhraseTokenizer(int minAlphabetLen,
int minKatakanaLen,
int minKanjiLen,
boolean allowMix,
int minMixLen) |
JaBuzzPhraseTokenizer(int minAlphabetLen,
int minKatakanaLen,
int minKanjiLen,
boolean allowMix,
int minMixLen,
AttributeFactory factory) |
修飾子とタイプ | メソッドと説明 |
---|---|
void |
end() |
boolean |
incrementToken() |
void |
reset() |
close, correctOffset, setReader
addAttribute, addAttributeImpl, captureState, clearAttributes, cloneAttributes, copyTo, endAttributes, equals, getAttribute, getAttributeClassesIterator, getAttributeFactory, getAttributeImplsIterator, hasAttribute, hasAttributes, hashCode, reflectAsString, reflectWith, removeAllAttributes, restoreState, toString
public static final int DEFAULT_MIN_ALPHABET_LEN
public static final int DEFAULT_MIN_KATAKANA_LEN
public static final int DEFAULT_MIN_KANJI_LEN
public static final int DEFAULT_MIN_MIX_LEN
public static final boolean DEFAULT_ALLOW_MIX
public JaBuzzPhraseTokenizer()
public JaBuzzPhraseTokenizer(int minAlphabetLen, int minKatakanaLen, int minKanjiLen, boolean allowMix, int minMixLen)
public JaBuzzPhraseTokenizer(AttributeFactory factory)
public JaBuzzPhraseTokenizer(int minAlphabetLen, int minKatakanaLen, int minKanjiLen, boolean allowMix, int minMixLen, AttributeFactory factory)
public final boolean incrementToken() throws java.io.IOException
incrementToken
クラス内 TokenStream
java.io.IOException
public final void end() throws java.io.IOException
end
クラス内 TokenStream
java.io.IOException
Copyright © 2009-2018 RONDHUIT Co.,Ltd. All Rights Reserved.