PHP开发:如何使用 Elasticsearch 实现全文检索

2023-07-04 0 3,921

在现代Web应用程序中,数据量越来越大,但用户期望和对数据的访问也越来越广泛。因此,搜索技术变得越来越重要,能够满足用户的预期并提供更好的用户体验。全文搜索是一种强大的技术,能够快速索引、搜索和排序大量数据。在这方面,Elasticsearch是一个领先的开源搜索引擎,它提供了许多先进的特性以及高可用性、易扩展性等优势。
在本篇文章中,将介绍如何通过PHP使用Elasticsearch实现全文检索。我们将从环境设置开始,包括Elasticsearch和PHP的安装,然后从索引、搜索和分析三个主要方面进行深入的介绍。
一、环境设置
首先,在本地或服务器上安装Elasticsearch。Elasticsearch可以从官方网站或者通过包管理器进行下载安装。
其次,通过Composer安装Elasticsearch的PHP客户端,也就是elasticsearch-php,它提供了许多方便的方法和类来调用Elasticsearch API。
composer require elasticsearch/elasticsearch
安装完成后,在PHP文件中进行如下配置:
require 'vendor/autoload.php';
$client = ElasticsearchClientBuilder::create()->build();
这样,就创建了一个与Elasticsearch服务器通信的客户端。
二、索引
在Elasticsearch中,索引是一个用于存储和快速查找数据的数据集合。我们可以使用elasticsearch-php的API将数据插入到索引中。

  1. 创建一个索引

首先,我们需要创建一个新索引。我们通过以下代码,在名为“my_index”的索引中创建一个名为“my_type”的类型。
$params = [

'index' => 'my_index',
'body' => [
'mappings' => [
'my_type' => [
'properties' => [
'title' => ['type' => 'text'],
'body' => ['type' => 'text'],
]
]
]
]

];
$response = $client->indices()->create($params);
“properties”数组中的“title”和“body”字段类型为“text”,这意味着它们会进行全文索引。在实践中,我们会根据具体的需求来设置索引和字段类型。
这样,我们就成功创建了一个名为“my_index”的索引。

  1. 向索引中添加文档数据

使用以下代码将文档插入到索引中:
$params = [

'index' => 'my_index',
'type' => 'my_type',
'body' => [
'title' => 'PHP Elasticsearch 全文检索',
'body' => 'Elasticsearch 是一个领先的全文搜索引擎,其功能包括分布式、高可用、实时搜索和分析能力等。',
]

];
$response = $client->index($params);
这里,我们将一篇带有标题和正文的文档插入到索引中。

  1. 更新文档

如果需要更新索引中已有的文档,使用以下代码:
$params = [

'index' => 'my_index',
'type' => 'my_type',
'id' => '1',
'body' => [
'doc' => [
'title' => '修改后的标题',
'body' => '修改后的正文内容',
]
]

];
$response = $client->update($params);
需要注意的是,在更新时必须提供文档的ID。

  1. 删除文档

如果需要删除已经存在的文档,使用以下代码:
$params = [

'index' => 'my_index',
'type' => 'my_type',
'id' => '1'

];
$response = $client->delete($params);
这样,我们就完成了索引和文档的创建、插入、更新和删除。
三、搜索
我们来看一下如何使用elasticsearch-php的API来进行搜索。

  1. 简单查询

首先,让我们执行一个简单的查询:
$params = [

'index' => 'my_index',
'type' => 'my_type',
'body' => [
'query' => [
'match' => [
'title' => 'PHP'
]
]
]

];
$response = $client->search($params);
在上面的代码中,我们执行了一个匹配查询,查询索引中所有包含“PHP”关键字的文档。搜索结果将存储在$response变量中。

  1. 多条件查询

如果需要查询多个条件,则可以使用bool查询来组合多个条件:
$params = [

'index' => 'my_index',
'type' => 'my_type',
'body' => [
'query' => [
'bool' => [
'must' => [
[ 'match' => [ 'title' => 'PHP' ] ],
[ 'match' => [ 'body' => '搜索引擎' ] ]
]
]
]
]

];
$response = $client->search($params);
这里,我们通过must参数指定了必须同时满足的两个查询条件。

  1. 分页查询

如果数据量很大,我们可以将搜索结果分页:
$params = [

'index' => 'my_index',
'type' => 'my_type',
'body' => [
'from' => 0, 'size' => 10,
'query' => [
'match' => [
'title' => 'PHP'
]
]
]

];
$response = $client->search($params);
通过from和size参数指定结果集的偏移量和大小。

  1. 按评分排序

为了获得更准确的搜索结果,Elasticsearch会为每个文档计算一个相关性评分。可以通过以下代码按评分进行排序:
$params = [

'index' => 'my_index',
'type' => 'my_type',
'body' => [
'query' => [
'match' => [
'title' => 'PHP'
]
],
'sort' => [
'_score' => [ 'order' => 'desc' ]
]
]

];
$response = $client->search($params);
这样查询结果将按相关性评分从高到低进行排序。
四、分析
Elasticsearch支持各种强大的分析和聚合功能,我们可以使用它们获取有关数据集的更深入信息。

  1. 聚合

以下代码可以获取“title”字段出现频率最高的前10个词:
$params = [

'index' => 'my_index',
'type' => 'my_type',
'size' => 0,
'body' => [
'aggs' => [
'top_titles' => [
'terms' => [
'field' => 'title.keyword',
'size' => 10
]
]
]
]

];
$response = $client->search($params);
通过size参数指定跳过返回文档,并且仅返回聚合结果。

  1. 分析器

Elasticsearch还提供了许多强大的分析器来对文本进行分析和处理。以下代码演示了如何使用中文分析器来处理文本:
$params = [

'index' => 'my_index',
'body' => [
'settings' => [
'analysis' => [
'analyzer' => [
'my_analyzer' => [
'type' => 'custom',
'tokenizer' => 'ik_max_word'
]
]
]
]
]

];
$response = $client->indices()->putSettings($params);
这里,我们为名为“my_analyzer”的分析器指定了“ik_max_word”分词器。
下面的代码可以使用这个分析器来分析文本:
$params = [

'index' => 'my_index',
'body' => [
'query' => [
'query_string' => [
'query' => '搜索',
'analyzer' => 'my_analyzer',
'default_field' => 'title'
]
]
]

];
$response = $client->search($params);
这样,我们就可以使用中文分析器来分析中文文本了。
总结
在本文中,我向您介绍了如何使用elasticsearch-php的API来创建、添加、更新和删除索引和文档,以及如何使用搜索API来执行简单和复杂的查询。此外,我还介绍了使用聚合和分析器来处理数据的相关技术。
随着数据集规模的增加,Elasticsearch的重要性逐渐增加。只要您熟悉它的API,您就可以通过PHP轻松地利用其强大的搜索和分析能力来优化您的Web应用程序。

资源下载此资源下载价格为1小猪币,终身VIP免费,请先
由于本站资源来源于互联网,以研究交流为目的,所有仅供大家参考、学习,不存在任何商业目的与商业用途,如资源存在BUG以及其他任何问题,请自行解决,本站不提供技术服务! 由于资源为虚拟可复制性,下载后不予退积分和退款,谢谢您的支持!如遇到失效或错误的下载链接请联系客服QQ:442469558

:本文采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可, 转载请附上原文出处链接。
1、本站提供的源码不保证资源的完整性以及安全性,不附带任何技术服务!
2、本站提供的模板、软件工具等其他资源,均不包含技术服务,请大家谅解!
3、本站提供的资源仅供下载者参考学习,请勿用于任何商业用途,请24小时内删除!
4、如需商用,请购买正版,由于未及时购买正版发生的侵权行为,与本站无关。
5、本站部分资源存放于百度网盘或其他网盘中,请提前注册好百度网盘账号,下载安装百度网盘客户端或其他网盘客户端进行下载;
6、本站部分资源文件是经压缩后的,请下载后安装解压软件,推荐使用WinRAR和7-Zip解压软件。
7、如果本站提供的资源侵犯到了您的权益,请邮件联系: 442469558@qq.com 进行处理!

猪小侠源码-最新源码下载平台 PHP教程 PHP开发:如何使用 Elasticsearch 实现全文检索 http://www.20zxx.cn/777684/xuexijiaocheng/qes.html

猪小侠源码,优质资源分享网

常见问题
  • 本站所有资源版权均属于原作者所有,均只能用于参考学习,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担
查看详情
  • 最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,建议提前注册好百度网盘账号,使用百度网盘客户端下载
查看详情

相关文章

官方客服团队

为您解决烦忧 - 24小时在线 专业服务