PHP 替换文章关键字,链接 只替换一次
admin
2023-07-26 07:20:09
0

/*

  • 关键词匹配类
  • $str = "是是是是是范德萨下一年,下一年谁谁谁水水水水的洒落开是是是是军";
  • $key = new KeyReplace($str,array("下一年1"=>'http://baidu.com',"下一年"=>'baidu.com'));
  • echo $key->getResultText();
  • echo $key->getRuntime();
    */
    class KeyReplace
    {
    private $keys = array();
    private $text = "";
    private $runtime = 0;
    private $url = true;
    private $stopkeys = array();
    private $all = false;
    /**

    • @access public
    • @param string $text 指定被处理的文章
    • @param array $keys 指定字典词组array(key=>url,...) url可以是数组,如果是数组将随机替换其中的一个
    • @param array $stopkeys 指定停止词array(key,...) 这里面的词将不会被处理
    • @param boolean $url true 表示替换成链接否则只替换
    • @param boolean $all true 表示替换所有找到的词,否则只替换第一次
      */
      public function __construct($text='',$keys=array(),$url=true,$stopkeys=array(),$all=false) {
      $this->keys = $keys;
      $this->text = $text;
      $this->url = $url;
      $this->stopkeys = $stopkeys;
      $this->all = $all;
      }

    /**

    • 获取处理好的文章
    • @access public
    • @return string text
      */
      public function getResultText() {
      $start = microtime(true);
      $keys = $this->hits_keys();

      $keys_tmp = array_keys($keys);

    function cmp($a, $b){
    if (mb_strlen($a) == mb_strlen($b)) {
    return 0;
    }
    return (mb_strlen($a) < mb_strlen($b)) ? 1 : -1;
    }

    usort($keys_tmp,"cmp");

    foreach($keys_tmp as $key){

    if(is_array($keys[$key])){
        $url = $keys[$key][rand(0,count($keys[$key])-1)];
    }else
        $url = $keys[$key];
    
    $this->text = $this->r_s($this->text,$key,$url);

    }
    $this->runtime = microtime(true)-$start;

    return $this->text;
    }
    /**

    • 获取处理时间
    • @access public
    • @return float
      */
      public function getRuntime() {

      return $this->runtime;

    }

    /**

    • 设置关键词
    • @access public
    • @param array $keys array(key=>url,...)
      */
      public function setKeys($keys) {

      $this->keys = $keys;

    }
    /**

    • 设置停止词
    • @access public
    • @param array $keys array(key,...)
      */
      public function setStopKeys($keys) {

      $this->stopkeys = $keys;

    }
    /**

    • 设置文章
    • @access public
    • @param string $text
      */
      public function setText($text) {

      $this->text = $text;

    }

    /**

    • 用来找到字符串里面命中的关键词
    • @access public
    • @return array $keys 返回匹配到的词array(key=>url,...)
      */
      public function hits_keys(){
      $ar = $this->keys;
      $ar = $ar?$ar:array();
      $result=array();
      $str = $this->text;
      foreach($ar as $k=>$url){
      $k = trim($k);
      if(!$k)
      continue;
      if(strpos($str,$k)!==false && !in_array($k,$this->stopkeys)){
      $result[$k] = $url;
      }
      }
      return $result?$result:array();
      }

    /**

    • 用来找到字符串里面命中的停止词
    • @access public
    • @return array $keys 返回匹配到的词array(key,...)
      */
      public function hits_stop_keys(){
      $ar = $this->stopkeys;
      $ar = $ar?$ar:array();
      $result=array();
      $str = $this->text;
      foreach($ar as $k){
      $k = trim($k);
      if(!$k)
      continue;
      if(strpos($str,$k)!==false && in_array($k,$this->stopkeys)){
      $result[] = $k;
      }
      }
      return $result?$result:array();
      }

    /**

    • 处理替换过程
    • @access private
    • @param string $text 被替换者
    • @param string $key 关键词
    • @param string $url 链接
    • @return string $text 处理好的文章
      */
      private function r_s($text,$key,$url){

      $tmp = $text;

      $stop_keys = $this->hits_stop_keys();

      $stopkeys = $tags = $a = array();
      if(preg_match_all("#]+>[^<]]>#su",$tmp,$m)){
      $a=$m[0];

      foreach($m[0] as $k=>$z){
          $z = preg_replace("#\##s","\#",$z);
      
          $tmp = preg_replace('#'.$z.'#s',"[_a".$k."_]",$tmp,1);
      }

      };

      if(preg_match_all("#<[^>]+>#s",$tmp,$m)){
      $tags = $m[0];
      foreach($m[0] as $k=>$z){
      $z = preg_replace("###s","#",$z);
      $tmp = preg_replace('#'.$z.'#s',"[tag".$k."]",$tmp,1);
      }
      }
      if(!empty($stop_keys)){
      if(preg_match_all("#".implode("|",$stop_keys)."#s",$tmp,$m)){
      $stopkeys = $m[0];
      foreach($m[0] as $k=>$z){
      $z = preg_replace("###s","#",$z);
      $tmp = preg_replace('#'.$z.'#s',"[s".$k."]",$tmp,1);
      }
      }
      }
      $key1 = preg_replace("#([#()[]*])#s","\\$1",$key);

      if($this->url)
      $tmp = preg_replace("#(?![_s|[a|[|[_t|[_ta|[tag)".$key1."(?!ag\d+]|g\d+]|\d+]|s\d+]|])#us",''.$key.'',$tmp,$this->all?-1:1);
      else
      $tmp = preg_replace("#(?![_s|[a|[|[_t|[_ta|[tag)".$key1."(?!ag\d+]|g\d+]|\d+]|s\d+]|])#us",$url,$tmp,$this->all?-1:1);

      if(!empty($a)){

      foreach($a as $n=>$at){
      
          $tmp = str_replace("[_a".$n."_]",$at,$tmp);
      
      }

      }
      if(!empty($tags)){

      foreach($tags as $n=>$at){
      
          $tmp = str_replace("[_tag".$n."_]",$at,$tmp);
      
      }

      }
      if(!empty($stopkeys)){

      foreach($stopkeys as $n=>$at){
      
          $tmp = str_replace("[_s".$n."_]",$at,$tmp);
      
      }

      }
      return $tmp;
      }
      }

相关内容

热门资讯

东方雨虹旗下孚达科技落地华为全... 近日,东方雨虹旗下孚达科技高性能B1级挤塑板(XPS)成功落地华为贵安云上屯数据中心项目,凭借高标准...
沈炜的禅意与煎熬 文 | 巨潮WAVE,作者|老鱼儿,编辑|杨旭然 师出段永平的vivo创始人沈炜,和他高调的老师有...
双一流高校本科将扩招超10万人 作者 | 第一财经 林靖国务院日前印发《教育发展“十五五”规划》(以下简称《规划》),对“十五五”时...
探访外骨骼助力器消费现状 央视网消息:外骨骼助力器近年来在消费市场悄然兴起,很多人说,戴上它就能健步如飞、穿上它就能“保护膝盖...
西安外国语大学:严禁单人或少数... 澎湃新闻记者 钟煜豪“学校各类自习教室属全校公共学习资源,遵循共享使用、随到随用管理原则。近期学校多...
老外给马斯克算了笔账:地球人减... 马斯克可能也没想到,好好的spaceX评论区,突然被一群“劝人减重”的网友攻陷了。 按理说,大家一般...
2026山东网络视听大会下周启... 齐鲁晚报·齐鲁壹点记者 朱若彤 6月29日,山东省人民政府新闻办公室举行新闻发布会,邀请省委宣传部、...
浦东保密|“翻墙”让泄密如影随... 机关、单位工作人员 违规使用“翻墙”软件访问境外网站 不仅触犯法律红线 更打开了失泄密的“潘多拉魔盒...
马斯克:SpaceX计划今年每... 当地时间6月28日,马斯克在其社交媒体平台X上发文称,旗下最新一代大语言模型Grok 4.5已正式在...
从“样板”到“普惠”:华为极简... 随着AI技术应用的快速落地,各行各业正加速从传统IT基础设施向全域AI数据基础设施转型,而新型数据中...