本文概述
- Tika ToXMLContentHandler构造函数
- Tika ToXMLContentHandler方法
- Tika将文档解析为XHTML示例
此类包含以下构造函数和方法。
Tika ToXMLContentHandler构造函数以下是ToXMLContentHandler类的构造函数。
Constructor | Description |
---|---|
public ToXMLContentHandler() | 它用于创建类的实例。 |
公共ToXMLContentHandler(字符串编码) | 它通过获取字符串参数来创建实例。 |
Methods | Description |
---|---|
公共无效字符(char [] ch, int开头, int长度)抛出SAXException | 它将给定的字符写入给定的字符流。 |
受保护的void write(char ch)抛出SAXException | 它按原样写入给定字符。 |
受保护的void write(String string)抛出SAXException | 它按原样写入给定的字符串。 |
公共无效startDocument()引发SAXException | 它写入XML前缀。 |
package tikaexample;
import java.io.IOException;
import java.io.InputStream;
import org.apache.tika.exception.TikaException;
import org.apache.tika.metadata.Metadata;
import org.apache.tika.parser.AutoDetectParser;
import org.apache.tika.sax.ToXMLContentHandler;
import org.xml.sax.ContentHandler;
import org.xml.sax.SAXException;
public class XhtmlParseExample { public static void main(String[] args) throws IOException, SAXException, TikaException {ContentHandler handler = new ToXMLContentHandler();
AutoDetectParser pa0rser = new AutoDetectParser();
Metadata metadata = http://www.srcmini.com/new Metadata();
try (InputStream stream = XhtmlParseExample.class.getResourceAsStream("Hello.txt")) {parser.parse(stream, handler, metadata);
System.out.println(handler.toString());
} }}
输出
以下是hello.txt文件的内容。
Hello Welcome to srcmini
提取后, 它将产生XHTML格式的输出。见下文。
<
html xmlns="http://www.w3.org/1999/xhtml">
<
head>
<
meta name="X-Parsed-By" content="org.apache.tika.parser.DefaultParser" />
<
meta name="X-Parsed-By" content="org.apache.tika.parser.txt.TXTParser" />
<
meta name="Content-Encoding" content="ISO-8859-1" />
<
meta name="Content-Type" content="text/plain;
charset=ISO-8859-1" />
<
title>
<
/title>
<
/head>
<
body>
<
p>
Hello Welcome to srcmini<
/p>
<
/body>
<
/html>
推荐阅读
- Tika文本文件提取示例
- Tika将文档解析为纯文本示例
- Tika解析器API详细解释和用法
- Android最佳PDF阅读器应用软件下载推荐(让你查看文档更方便)
- 7个最佳创意绘图小工具推荐合集(发挥你的艺术创造能力)
- iPhone最佳音乐制作应用软件下载推荐合集(哪个最好用())
- win10鼠标指针无限转圈的修好办法
- Win10如何清理应用商店程序安装包?
- Win10任务栏上的小箭头消失了怎样找到?