java如何去掉html标签页

要去掉HTML标签,可以使用正则表达式或者Java的Jsoup库,这里给出一个使用Jsoup库的方法:

1、需要添加Jsoup库到项目中,如果你使用的是Maven项目,可以在pom.xml文件中添加以下依赖:


    org.jsoup
    jsoup
    1.14.3

2、使用Jsoup的clean方法去除HTML标签:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class RemoveHtmlTags {
    public static void main(String[] args) {
        String html = "标题

这是一个段落。

这是另一个段落。

"; String text = removeHtmlTags(html); System.out.println(text); } public static String removeHtmlTags(String html) { Document document = Jsoup.parse(html); return document.text(); } }

这段代码会输出:

标题
这是一个段落。
这是另一个段落。

这样就去除了HTML标签,只保留了文本内容。

分享标题:java如何去掉html标签页
新闻来源:http://www.shufengxianlan.com/qtweb/news38/336438.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联