博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Solr建立索引时,过滤HTML标签
阅读量:5277 次
发布时间:2019-06-14

本文共 876 字,大约阅读时间需要 2 分钟。

原文地址 

 

1、在数据库的读取文件data-config.xml 中的entity 标记里边添加 transformer=”HTMLStripTransformer” 代码。

<entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description  from table">

            <field column="description" name="description" stripHTML="true"/>
</entity> 

2、在field 字段需要过滤html代码的字段添加 stripHTML=”true”

<entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description from table">

             <field column="description" name="description" stripHTML="true"/>
</entity>

3、修改schema.xml文件中的fieldType标记中的内容,添加如下代码<charFilter class=”solr.HTMLStripCharFilterFactory” />

<analyzer type="query">

    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"  mode="simple" reload="true" />
    <filter class="solr.LowerCaseFilterFactory" />
    <charFilter class="solr.HTMLStripCharFilterFactory" />
</analyzer>

转载于:https://www.cnblogs.com/fengh/p/4795126.html

你可能感兴趣的文章
helios架构详解(二)客户端架构和cluster
查看>>
android--01系统体系结构
查看>>
设计模式之Bridge
查看>>
UVa 11437:Triangle Fun(计算几何综合应用,求直线交点,向量运算,求三角形面积)...
查看>>
NGUI屏幕自适应(转)
查看>>
hadoop fs 获取文件大小
查看>>
2017 ACM/ICPC Asia Regional Qingdao Online - 1008 Chinese Zodiac
查看>>
P4099 [HEOI2013]SAO
查看>>
P4294 [WC2008]游览计划
查看>>
数值分析方法库
查看>>
交换两个变量值的方法汇总
查看>>
使用lua扩展应用程序
查看>>
maven新建项目报错
查看>>
Hbase记录-HBase增删改查
查看>>
JAVA-常用集合类型转换例子(基础必备)
查看>>
hello word ,好吧协会最菜真的是从头开始在复习,不过我打算稍微过一遍基本知识之后好好捡起来数据结构...
查看>>
tcp服务器
查看>>
java bigdecimal
查看>>
ListCtrl添加右键菜单(在对话框类中)
查看>>
For-Each循环
查看>>