function_score 之script_score
admin
2023-07-29 19:40:05
0


function_score  配合 script_score 是排序的终极方案


例子:


curl -XGET 'http://localhost:9200/*/*/_search?pretty&explain' -d '{

 "size" : 0,

  "query" : {

    "function_score" : {

      "query" : {

        "filtered" : {

          "filter" : {

            "bool" : {

              "must" : {

                "match" : {

                  "_all" : {

                    "query" : "关键字",

                    "type" : "boolean",

                    "operator" : "AND"

                  }

                }

              }

            }

          }

        }

      },

      "functions" : [ {

        "script_score" : {

               "params": {

                  "field": "company_name",

                   "term": "关键字"

                  },

          "script" : "_index[field][term].df()"

        }

      } ,

{

          "filter" : {

          "match" : {

            "company_name" : {

              "query" : "关键字",

              "type" : "boolean",

              "operator" : "AND"

            }

          }

        },

        "weight" : 2

      }

],

      "score_mode" : "sum"

    }

  },

  "aggregations" : {

    "agg" : {

      "terms" : {

        "field" : "member_id",

        "size" : 0,

        "order" : {

          "top_hit" : "desc"

        }

      },

      "aggregations" : {

        "top_hit" : {

          "max" : {

            "script" : {

              "inline" : "_score"

            }

          }

        }

      }

    }

  }

  }'


需要配置:

script.engine.groovy.inline.search: on

script.inline: on

script.indexed: on


script_score可以让你更加灵活的操作ES的打分。例如

   "script_score" : {

           "params": {

                  "field": "company_name",

                  "terms": ["关键字"]

                  },

          "script" : "score = 0.0; queryLength = 0.0; docLength = 0.0; for (word in terms) { tf = _index[field][word].tf(); score = score + tf * 1.0; queryLength = queryLength + 1.0; docLength = docLength + pow(tf, 2.0); }; return (float)score /(sqrt(docLength) * sqrt(queryLength)); "

        }


这里需要注意的是 company_name 这个字段 不允许分词,否则这个近似算法可能有问题,个人感觉script_score 执行的时间比较靠后,此时分词阶段已经结束,company_name 已经被分词完毕,不是源表中的值了,所以这个字段不能分词。 这里例子实际意义不大,但是看到function_score 还是很强大的。


当上面的query内容变成如下内容时:

 "match" : {

     "_all" : {

          "query" : "关键字",

          "type" : "boolean",

          "operator" : "AND"

     }

  }


相关×××开始启用。打出的分数算法如下。

score=(weight+script_score)*相关性分数


而原来的写法,打分就是 _index[field][term].df()+weight 的值,因为相关性在filter下都是1。

下面举例来说明


function_score 之script_score


4.09 是相关性的分数,


6.09=2+4.09 其中 4.09 来自下面的配置, 很明显_score=4.09 因为上面已经提到了。

"script_score" : {

          "script" : "return _score"

        }


所以:score=(weight+script_score)*相关性分数。 

至于相关性的分数如何打出,也很类似,请自行查看资料学习

相关内容

热门资讯

佩洛西86岁丈夫被控肇事逃逸,... 当地时间7月3日傍晚,美国众议院南希·佩洛西的丈夫保罗,再一次因为驾车事故而遭到了指控。据报道称,保...
当着中方的面,菲律宾许下三点承... 难得很难得,菲律宾又向中国郑重承诺了。承诺什么?感觉承诺了至少三点。看新闻稿,2026年6月30日,...
首个世界杯8强产生!摩洛哥3-... 新华社美国休斯敦7月4日电(记者吴俊宽、赵建通)4日在美国休斯敦进行的美加墨世界杯首场16强赛中,摩...
瑞典最新涉华表态:钦佩、赞赏! 当地时间2026年7月4日,瑞典首相克里斯特松在斯德哥尔摩会见中共中央政治局委员、外交部长王毅。克里...
特朗普:内塔尼亚胡知道“谁是老... 新华社耶路撒冷7月4日电(记者庞昕熠 冯国芮)以色列总理办公室4日晚发表声明称,以总理内塔尼亚胡此前...
辽宁抚顺出现特大暴雨,致3人死... 新华社沈阳7月4日电(记者邹明仲)记者4日从辽宁省抚顺市防汛抗旱指挥部获悉,7月4日凌晨1时至7时许...
泽连斯基与特朗普通话,商定在北... △资料图当地时间4日,乌克兰总统泽连斯基在社交媒体发文表示,他于美国独立日当天同美国总统特朗普通话。...
内塔尼亚胡将访美与特朗普会晤 △内塔尼亚胡(左)与特朗普(右)(资料图)当地时间7月4日,美国总统特朗普在接受电话采访时表示,以色...
陪卢秀燕赴台南帮谢龙介辅选,连... 海峡导报综合报道 被视为国民党最具人气的“最强母鸡”之一的台中市长卢秀燕,4日在国民党前副主席连胜文...