js正则匹配table,img及去除各种标签问题

来源:脚本之家 时间:2020-11-24

这篇文章主要介绍了js正则匹配table,img及去除各种标签问题,需要的朋友可以参考下

核心代码

//获取公示栏内容
     s = "$row.detail$";
     mainContent =s;
    
     //如果有多个table使用下面注释的正则只会匹配成一个table
     //var tabReg = /<table[^>]*>((?!table).)*<\/table>/gi;
    //匹配单个table
     var tabReg = /<table[^>]*>\s*(<tbody[^>]*>)?(\s*<tr[^>]*>[\s\S]*?<\/tr>\s*)*(<\/tbody>)?\s*<\/table>/gi;
     var tabMatch = tabReg.test(s);
    
     var tabMatchContentArray = s.match(tabReg);
 
     if(tabMatch)
     {
     
      mainContent = s.replace(tabReg,"#");
     }
    
     //对img标签进行匹配
     var imgReg = /<img.*?(?:>|\/>)/gi;
    
     imgMatchContentArray = s.match(imgReg);
   
     if(imgReg.test(s))
     {
      //将img标签替换为*
      mainContent = mainContent.replace(imgReg,"*");
     }
     //处理html标签
     mainContent = mainContent.replace(/&nbsp;/gi," ");
     var pReg1 = /<p>/gi;
     var pReg2 = /<\/p>/gi;
     mainContent = mainContent.replace(pReg1,"").replace(pReg2,"<br />");
     //下面的htmlReg1 ,htmlReg2可以匹配任意标签
//     var htmlReg1 =/<[^>]+>/gi;
//     var htmlReg2 =/<(.+?)[\s]*\/?[\s]*>/gi;
//    
//     mainContent = mainContent.replace(htmlReg1,"").replace(htmlReg2,"");
     //mainContent = mainContent.replace(/&/gi,"<p>").replace(/@/gi,"</p>");
    var pageIndex = 1;
    var size = 500;
    var tableContentArray = mainContent.split("#");
    var array = []; //存放以table分割后的数组中每个数组可以分作几页
   
    var arrayIndex = []; //存放table在内容中的索引
   
    var len =0;
    for(var i=0;i<tableContentArray.length;i++)
    {
      var con = tableContentArray[i];
     
      len += con.length;
     
      arrayIndex[i] = len;
     
      array[i] = Math.ceil(con.length /size);
    }
   
   
    var tableIndexArray = [];//存放table内容页码数
   
    var sum = 1;
   
    for(var j=0;j<array.length-1;j++)
    {
     
      sum += array[j];
      tableIndexArray[j] = sum;
    }
   
   
    var currentPageContent = mainContent.substr((pageIndex-1)*size,size);
   
   
    if(tableIndexArray.indexOf(pageIndex) >= 0)
    {
      currentPageContent = tabMatchContentArray[tableIndexArray.indexOf(pageIndex)];
    }
   
   
    if(currentPageContent.indexOf("#")!= -1)
    {
     
      var beginToCurrentPageContent = mainContent.substr(0,pageIndex*size);     
      var tabLastIndex = beginToCurrentPageContent.lastIndexOf("#");
      currentPageContent = currentPageContent.substr(0,tabLastIndex-(pageIndex-1)*size);
 
      //当前页是否有 * 获取最后一个 * 的位置
      var indexOf = currentPageContent.indexOf("*");
     
      if(indexOf >= 0)
      {        
         //获取开始到当前页位置的内容 中的 * 的最后的下标
         var reCount = beginToCurrentPageContent.split("*").length - 1;
         
         var contentArray = currentPageContent.split("*");
        
         currentPageContent = replaceImgContent(contentArray,reCount,imgMatchContentArray); 
      }
       
    }
    else
    {
     
      //当前页是否有 * 获取最后一个 * 的位置
      var indexOf = currentPageContent.indexOf("*");
     
      if(indexOf >= 0)
      {
         //获取从开始位置到当前页位置的内容
         var beginToCurrentPageContent = mainContent.substr(0,pageIndex*size);
        
         //获取开始到当前页位置的内容 中的 * 的最后的下标
         var reCount = beginToCurrentPageContent.split("*").length - 1;
         
         var contentArray = currentPageContent.split("*");
        
         currentPageContent = replaceImgContent(contentArray,reCount,imgMatchContentArray);
        
      }
     
    }
   
    if(currentPageContent=="")
    {
      alert("页码数超过范围");
    }
    else
    {
      document.getElementById("annouContent").innerHTML= currentPageContent;
    }
   
    /* currentArray:当前页以 * 分割后的数组
      replaceCount:从开始内容到当前页的内容 * 的个数
      matchArray : img标签的匹配的内容
    */
    function replaceImgContent(currentArray,replaceCount,matchArray)
    {     
      var result = "";
      for(var i=currentArray.length -1,j = replaceCount-1 ;i>=1; i--)
      {       
        var temp = (matchArray[j] + currentArray[i]);
        result = temp + result;
        j--;
      }     
      result = currentArray[0] + result ;     
      return result;
    }   
  </script>

下面是一些补充

js正则匹配删除table

var reg = /<[\/]*(table|td|tr)[ a-zA-z=''""]*>|123/g

一个JAVASCRIPT正则表达式,Table中只保留ColSpan和RowSpan

html = html.replace(/<(TBODY|THEAD|TFOOT|TH|TR|TD)[^>]*?(ColSpan\s*=\s*["']?[^"'>\s]*["']?[^>]*?)?(RowSpan\s*=\s*["']?[^"'>\s]*["']?[^>]*?)?>/gi,"<$1 $2 $3>");

以上就是js正则匹配table,img及去除各种标签问题的详细内容,更多关于js正则匹配table,img的资料请关注脚本之家其它相关文章!

来源:脚本之家

链接:https://www.jb51.net/article/183979.htm

相关文章

标签:

A5创业网 版权所有