NativeExtractor (EXALEAD CloudView Custom code SDK)

java.lang.Object
- com.exalead.pdoc.analysis.StandardDocumentProcessor
- - com.exalead.indexing.analysis.processors.PartExtractor
  - - com.exalead.indexing.analysis.processors.NativeExtractor

All Implemented Interfaces:: DocumentProcessor

public class NativeExtractor
extends PartExtractor

Nested Class Summary

Nested Classes
Modifier and Type Class and Description

static class NativeExtractor.Extractors
- Nested classes/interfaces inherited from class com.exalead.indexing.analysis.processors.PartExtractor
  PartExtractor.ExtractCtx, PartExtractor.ExtractCtxBase

Nested Classes
Modifier and Type	Class and Description
`static class`	`NativeExtractor.Extractors`

Field Summary
- Fields inherited from class com.exalead.indexing.analysis.processors.PartExtractor
  log
- Fields inherited from class com.exalead.pdoc.analysis.StandardDocumentProcessor
  condition

Constructor Summary

Constructors
Constructor and Description
`NativeExtractor()`
`NativeExtractor(boolean annotateHTML, boolean skipInvisibleHTMLText)`
`NativeExtractor(boolean annotateHTML, boolean skipInvisibleHTMLText, boolean extractHTMLTables)`
`NativeExtractor(boolean annotateHTML, boolean skipInvisibleHTMLText, boolean extractJs, boolean extractHTMLTables, boolean extractHTMLStyles, boolean extractHTMLForms, int maxHTMLAnnotationDepth)` Deprecated.
`NativeExtractor(boolean annotateHTML, boolean skipInvisibleHTMLText, boolean extractHTMLTables, int maxHTMLAnnotationDepth)`
`NativeExtractor(boolean annotateHTML, boolean skipInvisibleHTMLText, NativeExtractor.Extractors extractors, int maxHTMLAnnotationDepth)`

Method Summary

All Methods Instance Methods Concrete Methods
Modifier and Type	Method and Description
`void`	`convertToOctree(int maxDepth, double cellPrec, exa.io2.ByteBuffer b, exa.io2.DynamicBuffer out)`
`protected java.lang.String`	`getDirective(PartExtractor.ExtractCtx ctx, java.lang.String dirname, java.lang.String defaultname)`
`protected void`	`handleBinaryNDoc(PartExtractor.ExtractCtx ctx)`
`protected void`	`handleHtml(PartExtractor.ExtractCtx ctx)`
`protected void`	`handleMatrix(PartExtractor.ExtractCtx ctx)`
`protected void`	`handleMesh(PartExtractor.ExtractCtx ctx)`
`void`	`handlePart(PartExtractor.ExtractCtx ctx)`
`protected void`	`handleText(PartExtractor.ExtractCtx ctx)`
`protected void`	`handleXMLNDoc(PartExtractor.ExtractCtx ctx)`
`void`	`process(DocumentProcessingContext context, ProcessableDocument document)` Process a document.
`void`	`release()` Release all processor ressources. This method is called before processor finalization.

Methods inherited from class com.exalead.indexing.analysis.processors.PartExtractor
canHandlePart, getDirective, partHasNoIndexDirective

Methods inherited from class com.exalead.pdoc.analysis.StandardDocumentProcessor
getCondition, init, setCondition

Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait

Constructor Detail

NativeExtractor

public NativeExtractor(boolean annotateHTML,
                       boolean skipInvisibleHTMLText)

NativeExtractor

public NativeExtractor(boolean annotateHTML,
                       boolean skipInvisibleHTMLText,
                       boolean extractHTMLTables)

NativeExtractor

public NativeExtractor(boolean annotateHTML,
                       boolean skipInvisibleHTMLText,
                       boolean extractHTMLTables,
                       int maxHTMLAnnotationDepth)

NativeExtractor

@Deprecated
public NativeExtractor(boolean annotateHTML,
                                   boolean skipInvisibleHTMLText,
                                   boolean extractJs,
                                   boolean extractHTMLTables,
                                   boolean extractHTMLStyles,
                                   boolean extractHTMLForms,
                                   int maxHTMLAnnotationDepth)

Deprecated.

NativeExtractor

public NativeExtractor(boolean annotateHTML,
                       boolean skipInvisibleHTMLText,
                       NativeExtractor.Extractors extractors,
                       int maxHTMLAnnotationDepth)

NativeExtractor
```
public NativeExtractor()
```

Method Detail

release
```
public void release()
```
Description copied from interface: DocumentProcessor

Release all processor ressources.
This method is called before processor finalization.

Specified by:

release in interface DocumentProcessor

Overrides:

release in class StandardDocumentProcessor

process
```
public void process(DocumentProcessingContext context,
                    ProcessableDocument document)
```
Description copied from interface: DocumentProcessor

Process a document.

Specified by:

process in interface DocumentProcessor

Overrides:

process in class PartExtractor

Parameters:

context - Context to perform various operations related to processing

document - The document being processed.

handlePart

public void handlePart(PartExtractor.ExtractCtx ctx)

Specified by:: handlePart in class PartExtractor

handleHtml

protected void handleHtml(PartExtractor.ExtractCtx ctx)

handleText

protected void handleText(PartExtractor.ExtractCtx ctx)

getDirective

protected java.lang.String getDirective(PartExtractor.ExtractCtx ctx,
                                        java.lang.String dirname,
                                        java.lang.String defaultname)

handleMesh

protected void handleMesh(PartExtractor.ExtractCtx ctx)

handleMatrix

protected void handleMatrix(PartExtractor.ExtractCtx ctx)

handleXMLNDoc

protected void handleXMLNDoc(PartExtractor.ExtractCtx ctx)

handleBinaryNDoc

protected void handleBinaryNDoc(PartExtractor.ExtractCtx ctx)

convertToOctree

public void convertToOctree(int maxDepth,
                            double cellPrec,
                            exa.io2.ByteBuffer b,
                            exa.io2.DynamicBuffer out)

Class NativeExtractor

Nested Class Summary

Nested classes/interfaces inherited from class com.exalead.indexing.analysis.processors.PartExtractor

Field Summary

Fields inherited from class com.exalead.indexing.analysis.processors.PartExtractor

Fields inherited from class com.exalead.pdoc.analysis.StandardDocumentProcessor

Constructor Summary

Method Summary

Methods inherited from class com.exalead.indexing.analysis.processors.PartExtractor

Methods inherited from class com.exalead.pdoc.analysis.StandardDocumentProcessor

Methods inherited from class java.lang.Object

Constructor Detail

NativeExtractor

NativeExtractor

NativeExtractor

NativeExtractor

NativeExtractor

NativeExtractor

Method Detail

release

process

handlePart

handleHtml

handleText

getDirective

handleMesh

handleMatrix

handleXMLNDoc

handleBinaryNDoc

convertToOctree