public final class Tokenizer
extends java.lang.Object
SynonymFilterFactoryを使う必要がない。
これにより品詞や読みなどの属性情報が失われることなく、また、オフセット値誤りが発生しないので、検索語ハイライトが正しく動作する。| 修飾子とタイプ | クラスと説明 |
|---|---|
static class |
Tokenizer.Token
Tokenは
restart(Reader)で与えられたReaderにおけるトークンである。 |
| コンストラクタと説明 |
|---|
Tokenizer(Dictionary dictionary)
コンストラクタ。
|
Tokenizer(Dictionary dictionary,
boolean aggressiveUnknown)
コンストラクタ。
|
| 修飾子とタイプ | メソッドと説明 |
|---|---|
Dictionary |
getDictionary() |
int |
getFinalOffset()
searchForward()がnullを返した後このメソッドを呼ぶと最終オフセットが得られる。 |
com.rondhuit.solr.analysis.morpho.Tokenizer.Node |
getNextNode() |
com.rondhuit.solr.analysis.morpho.Tokenizer.Node |
leftMostSubstring(int lo)
引数で指定されたバッファ中の文字列で始まる文字列を辞書引きし、単語候補を返す。
|
Tokenizer.Token |
nextToken()
restart(Reader)を呼んだ後、トークンをひとつずつ取得するためにこのメソッドを呼ぶ。 |
Tokenizer.Token |
nextTokenWithSynonyms()
restart(Reader)を呼んだ後、類義語を含むトークンをひとつずつ取得するためにこのメソッドを呼ぶ。 |
void |
restart(java.io.Reader r)
コンストラクタで本クラスのオブジェクトを作成した後このメソッドを呼ぶ。
|
void |
searchBackward(com.rondhuit.solr.analysis.morpho.Tokenizer.Node eos) |
com.rondhuit.solr.analysis.morpho.Tokenizer.Node |
searchForward()
前向きDP探索を行う。
|
public Tokenizer(Dictionary dictionary) throws java.io.IOException
dictionary - 辞書java.io.IOExceptionpublic Tokenizer(Dictionary dictionary, boolean aggressiveUnknown) throws java.io.IOException
dictionary - 辞書aggressiveUnknown - すべての可能性のある未知語生成を試さない場合はfalseを設定java.io.IOExceptionpublic Dictionary getDictionary()
public void restart(java.io.Reader r)
Tokenizerオブジェクトを再利用できる。このメソッドを呼んだ後、nextToken()を呼べるようになる。r - トークナイズ対象テキストpublic Tokenizer.Token nextToken() throws java.io.IOException
restart(Reader)を呼んだ後、トークンをひとつずつ取得するためにこのメソッドを呼ぶ。Tokenizer.Tokenを返す。なければnullを返すjava.io.IOExceptionpublic Tokenizer.Token nextTokenWithSynonyms() throws java.io.IOException
restart(Reader)を呼んだ後、類義語を含むトークンをひとつずつ取得するためにこのメソッドを呼ぶ。
類義語サポートが不要な場合は、このメソッドの代わりにnextToken()を呼ぶ。Tokenizer.Tokenを返す。なければnullを返すjava.io.IOExceptionpublic com.rondhuit.solr.analysis.morpho.Tokenizer.Node getNextNode()
public int getFinalOffset()
searchForward()がnullを返した後このメソッドを呼ぶと最終オフセットが得られる。public com.rondhuit.solr.analysis.morpho.Tokenizer.Node searchForward()
throws java.io.IOException
Node。java.io.IOExceptionpublic void searchBackward(com.rondhuit.solr.analysis.morpho.Tokenizer.Node eos)
public com.rondhuit.solr.analysis.morpho.Tokenizer.Node leftMostSubstring(int lo)
throws java.io.IOException
lo - 探索開始オフセットjava.io.IOExceptionCopyright © 2009-2018 RONDHUIT Co.,Ltd. All Rights Reserved.