HTMLParser (Lucene 2.2.0 API)

本文由网龙AE产品自动生成 数据挖掘交友

Overview  Package   Class  Use  Tree  Deprecated  Index  Help 
 PREV CLASS   NEXT CLASS FRAMES    NO FRAMES    
SUMMARY: NESTED | FIELD | CONSTR | METHOD DETAIL: FIELD | CONSTR | METHOD

org.apache.lucene.demo.html 数据挖掘实验室
Class HTMLParser

java.lang.Object
  "extendedorg.apache.lucene.demo.html.HTMLParser
 数据挖掘论坛 
All Implemented Interfaces:
HTMLParserConstants

public class HTMLParser
extends Object
implements HTMLParserConstants
数据挖掘论坛


Field Summary
 Token jj_nt
           
 boolean lookingAhead
           
static int SUMMARY_LENGTH
           
 Token token
           
 HTMLParserTokenManager token_source 数据挖掘研究院
           
 
Fields inherited from interface org.apache.lucene.demo.html.HTMLParserConstants
AfterEquals, ArgEquals, ArgName, ArgQuote1, ArgQuote2, ArgValue, CloseQuote1, CloseQuote2, Comment1, Comment2, CommentEnd1, CommentEnd2, CommentText1, CommentText2, DeclName, DEFAULT, Entity, EOF, HEX, LET, NUM, Punct, Quote1Text, Quote2Text, ScriptEnd, ScriptStart, ScriptText, SP, Space, TagEnd, TagName, tokenImage, WithinComment1, WithinComment2, WithinQuote1, WithinQuote2, WithinScript, WithinTag, Word
 
Constructor Summary
HTMLParser(File file)
          Deprecated. Use HTMLParser(FileInputStream) instead
HTMLParser(HTMLParserTokenManager tm)
           
HTMLParser(InputStream stream) 数据挖掘工具
           
HTMLParser(Reader stream)
           
 
Method Summary
 Token ArgValue() 数据挖掘交友
           
 void CommentTag()
           
 Token Decl()
           
 void disable_tracing() 数据挖掘实验室
           
 void enable_tracing()
           
 ParseException generateParseException()
           
 Properties getMetaTags()

数据挖掘实验室


           
 Token getNextToken()
           
 Reader getReader()

数据挖掘交友


           
 String getSummary()
           
 String getTitle()
           
 Token getToken(int index)
           
 void HTMLDocument()
           
 void ReInit(HTMLParserTokenManager tm)
           
 void ReInit(InputStream stream)
           
 void ReInit(Reader stream) 数据挖掘工具
           
 void ScriptTag()
           
 void Tag()
           
 
Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

Field Detail

SUMMARY_LENGTH

public static int SUMMARY_LENGTH 数据挖掘论坛 

token_source

public HTMLParserTokenManager token_source 数据挖掘交友 

token

public Token token 数据挖掘研究院 

jj_nt

public Token jj_nt  

lookingAhead

public boolean lookingAhead 数据挖掘交友 
Constructor Detail

HTMLParser

public HTMLParser(File file)
           throws FileNotFoundException 

数据挖掘论坛

Deprecated. Use HTMLParser(FileInputStream) instead

Throws:
FileNotFoundException

HTMLParser

public HTMLParser(InputStream stream)  

HTMLParser

public HTMLParser(Reader stream) 

数据挖掘论坛


HTMLParser

public HTMLParser(HTMLParserTokenManager tm) 数据挖掘实验室 
Method Detail

getTitle

public String getTitle()
                throws IOException,
                       InterruptedException 数据挖掘论坛 
Throws:
IOException
InterruptedException

getMetaTags

public Properties getMetaTags()
                       throws IOException,
                              InterruptedException 

数据挖掘研究院

Throws:
IOException
InterruptedException

getSummary

public String getSummary()
                  throws IOException,
                         InterruptedException 

数据挖掘研究院

Throws:
IOException
InterruptedException

getReader

public Reader getReader()
                 throws IOException 

数据挖掘论坛

Throws:
IOException

HTMLDocument

public final void HTMLDocument()
                        throws ParseException,
                               IOException 数据挖掘研究院 
Throws:
ParseException
IOException

Tag

public final void Tag()
               throws ParseException,
                      IOException 数据挖掘研究院 
Throws:
ParseException
IOException

ArgValue

public final Token ArgValue()
                     throws ParseException  
Throws:
ParseException

Decl

public final Token Decl()
                 throws ParseException 

数据挖掘论坛

Throws:
ParseException

CommentTag

public final void CommentTag()
                      throws ParseException  
Throws:
ParseException

ScriptTag

public final void ScriptTag()
                     throws ParseException 数据挖掘工具 
Throws:
ParseException

ReInit

public void ReInit(InputStream stream) 数据挖掘实验室 

ReInit

public void ReInit(Reader stream) 

数据挖掘论坛


ReInit

public void ReInit(HTMLParserTokenManager tm)  

getNextToken

public final Token getNextToken() 数据挖掘论坛 

getToken

public final Token getToken(int index) 数据挖掘实验室 

generateParseException

public ParseException generateParseException()  

enable_tracing

public final void enable_tracing()  

disable_tracing

public final void disable_tracing()  

Overview  Package   Class  Use  Tree  Deprecated  Index  Help 
 PREV CLASS   NEXT CLASS FRAMES    NO FRAMES    
SUMMARY: NESTED | FIELD | CONSTR | METHOD DETAIL: FIELD | CONSTR | METHOD

Copyright © 2000-2007 Apache Software Foundation. All Rights Reserved.

[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇: ArbitraryGOMXml (Lucene 2.2.0 API)
下一篇: GOMNamespace (Lucene 2.2.0 API)
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • Larbin网站爬虫简明使用说明
  • 全文检索引擎Lucene源码分析-analysis包
  • Nutch爬虫工作流程及文件格式详细分析
  • Lucene 基础指南(Java版)
  • 关于lucene 结构及内层的研究(一)
  • 实现NUTCH中文分词的代码修改方法
  • 利用Lucene搜索Java源代码
  • Lucene In Action ch 5 笔记 --高级搜索技
  • 第三节 Lucene索引文件格式分析
  • 如何使用Lucene进行全文检索(一)
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • 什么是luncene
  • 什么是nutch
  • 让Nutch支持中文分词
  • 关于lucene 结构及内层的研究(一)
  • Lucene In Action ch 5 笔记 --高级搜索技
  • 第三节 Lucene索引文件格式分析
  • 第二节 Lucene系统结构分析
  • 第一节 全文检索系统与Lucene简介
  • Lucene的查询语法!
  • 第四节 Lucene索引构建逻辑模块分析
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静