国产av天堂亚洲av麻豆,精品亚洲国产成AV人片传媒,a级毛片无码久久精品免费

主頁 > 知識庫 > Jsp敏感詞過濾的示例代碼

Jsp敏感詞過濾的示例代碼

大部分論壇、網(wǎng)站等，為了方便管理，都進行了關于敏感詞的設定。

在多數(shù)網(wǎng)站，敏感詞一般是指帶有敏感政治傾向（或反執(zhí)政黨傾向）、暴力傾向、不健康色彩的詞或不文明語，也有一些網(wǎng)站根據(jù)自身實際情況，設定一些只適用于本網(wǎng)站的特殊敏感詞。

比如，當你發(fā)貼的時候帶有某些事先設定的詞時，這個貼是不能發(fā)出的?；蛘哌@個詞被自動替換為星號(*)或叉號(X)等，或者說是被和諧掉了。

在我看來敏感詞過濾最重要的是在寫過濾詞匯的算法，如何過濾出大批量的敏感詞，我感覺DFA的思想不錯

DFA簡介

在實現(xiàn)文字過濾的算法中，DFA是唯一比較好的實現(xiàn)算法。DFA即Deterministic Finite Automaton，也就是確定有窮自動機，它是是通過event和當前的state得到下一個state，即event+state=nextstate。下圖展示了其狀態(tài)的轉(zhuǎn)換

在這幅圖中大寫字母（S、U、V、Q）都是狀態(tài)，小寫字母a、b為動作。通過上圖我們可以看到如下關系

a b b
S -----> U S -----> V U -----> V

在實現(xiàn)敏感詞過濾的算法中，我們必須要減少運算，而DFA在DFA算法中幾乎沒有什么計算，有的只是狀態(tài)的轉(zhuǎn)換。

Java實現(xiàn)DFA算法實現(xiàn)敏感詞過濾

在Java中實現(xiàn)敏感詞過濾的關鍵就是DFA算法的實現(xiàn)。首先我們對上圖進行剖析。在這過程中我們認為下面這種結構會更加清晰明了。

同時這里沒有狀態(tài)轉(zhuǎn)換，沒有動作，有的只是Query（查找）。我們可以認為，通過S query U、V，通過U query V、P，通過V query U P。通過這樣的轉(zhuǎn)變我們可以將狀態(tài)的轉(zhuǎn)換轉(zhuǎn)變?yōu)槭褂肑ava集合的查找。

誠然，加入在我們的敏感詞庫中存在如下幾個敏感詞：日本人、日本鬼子、毛.澤.東。那么我需要構建成一個什么樣的結構呢？

首先：query 日 ---> {本}、query 本 --->{人、鬼子}、query 人 --->{null}、query 鬼 ---> {子}。形如下結構：

下面我們在對這圖進行擴展：

這樣我們就將我們的敏感詞庫構建成了一個類似與一顆一顆的樹，這樣我們判斷一個詞是否為敏感詞時就大大減少了檢索的匹配范圍。比如我們要判斷日本人，根據(jù)第一個字我們就可以確認需要檢索的是那棵樹，然后再在這棵樹中進行檢索。

這個思想留著以后用，我先寫一個過濾詞匯的一些簡單方法，沒有涉及到算法

Java代碼實現(xiàn)

基本思路：重寫HttpServletRequestWrapper中的getParameter方法，讓用戶輸入的字通過這個過濾，寫一個類繼承他，重寫方法，在寫一個過濾詞匯的詞典，來與輸入的對比

先寫一個jsp頁面，js是用Ajax去刷新的，最近學的想用用試試看，感覺不錯，Ajax是需要引js文件的

body>
  input type="text" name="word" onblur="filter(this.value);" id="filter"/>
  input type="submit" value="敏感詞過濾" />
script type="text/javascript" src="js/jquery.js">/script>
script type="text/javascript">
  function filter(num){
    $.ajax({
      type:"post",//提交方式
      url:"FilterWordServlet",
      async:true,//是否異步請求
      dataType:"html",//數(shù)據(jù)的返回類型
      data:{"num":num},//數(shù)據(jù)傳過去的值
      success:function(data,textStatus){//成功的執(zhí)行之后，回調(diào)這個函數(shù)處理事務
        $("#filter").val(data);
      },
      error:function(){//失敗執(zhí)行這個函數(shù)，處理失敗的事務
        alert("error");
      }
    })
  }
/script>
/body>

再繼承HttpServletRequestWrapper在重寫getParameter方法，

//主要思路是繼承HttpServletRequestWrapper，去改寫他的getParameter方法，讓其有過濾的業(yè)務
public class WordFilter extends HttpServletRequestWrapper{

  public WordFilter(HttpServletRequest request) {
    super(request);
    // TODO Auto-generated constructor stub
  }
  @Override
  public String getParameter(String name){
    //先得到父親的方法，傳入值，得到的值在跟過濾字典中的比較看是否含有，有則替換，沒有放過返回
    String word=super.getParameter(name);
    //調(diào)用字典中的文字
    ListString> list=Words.getList();
    for (String string : list) {
      //判斷是否含有這樣字典中的文字
      if (word.contains(string)) {  
        //將字符串中含有的替換掉
        word=word.replace(string, "**");
      }
    }
    return word;
  }
  
}

再寫一個Servlet，去獲取用戶輸入的字，進行過濾操作

@WebServlet("/FilterWordServlet")
public class FilterWordServlet extends HttpServlet {
  private static final long serialVersionUID = 1L;
  protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
    //設置請求和編碼格式
    request.setCharacterEncoding("utf-8");
    response.setCharacterEncoding("utf-8");
    //自己創(chuàng)建的請求方法，繼承與原來的，改寫了getParameter方法讓其有過濾的業(yè)務
    WordFilter wFilter=new WordFilter(request);
     String string=wFilter.getParameter("num");
     System.out.println("---------------");
     //out的響應方法。輸出在頁面上，讓ajax得到這個去處理一些業(yè)務
     PrintWriter out=response.getWriter();
     out.println(string);
     
  }

  
  protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
    // TODO Auto-generated method stub
    doGet(request, response);
  }

}

我自己建了一個list集合的過濾詞匯，以后修改可以從這里開始詞匯的搜索算法，先建一個詞匯類

public class Words {
  //過濾詞匯的詞典
  static ListString> list=new ArrayList>();
  static{
    list.add("你妹的");
    list.add("sb");
    list.add("滾");
  }
  public static ListString> getList() {
    return list;
  }
  public static void setList(ListString> list) {
    Words.list = list;
  }
  
}

這只是最基礎的一種。高級的需要算法的實現(xiàn)，可以思考一下這個DFA算法，我感覺很不錯

以上就是本文的全部內(nèi)容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

JSP開發(fā)之Struts2實現(xiàn)下載功能的實例
詳解Java讀取本地文件并顯示在JSP文件中
淺談jsp中的9個隱含對象
jsp 開發(fā)之struts2中s:select標簽的使用
詳解JSP 中Spring工作原理及其作用
簡單實現(xiàn)JSP分頁顯示效果
JSP 開發(fā)之THE SERVLET NAME ALREADY EXISTS.解決方法

標簽：貸款邀約銅川南京內(nèi)江樂山黃石大連廣州

巨人網(wǎng)絡通訊聲明：本文標題《Jsp敏感詞過濾的示例代碼》，本文關鍵詞 Jsp,敏感,詞,過濾,的,示例,；如發(fā)現(xiàn)本文內(nèi)容存在版權問題，煩請?zhí)峁┫嚓P信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡，涉及言論、版權與本站無關。