专业的短链接生成工具
链接域名
短网址有效期
规划搜索产品时,我们该如何着手?
更新时间:2025-5-3 22:23:44 作者:爱短链
作者从什么、什么和如何做三个方面详细介绍了搜索功能的原则,供您参考和学习。
搜索,曾经做过PC流量霸主在互联网时代起着重要的作用。
即使在今天APP在孤岛众多的移动互联网时代,站内搜索仍然是提高产品接触和流量转化的重要组成部分。
例如,电子商务在业内流传App 40%以上的GMV通过搜索贡献。
所以,当我们计划一个搜索产品时,我们主要关注什么,本文希望与您讨论。
01 搜索的本质 让我们来看看搜索的原理。
简单地说,用户的输入(Query)以及系统数据库中的内容(Content)完成匹配(Match)的过程。
这一过程的实现可以概括为三个步骤:一是用户query的解读,即query分析;二是了解系统中存储的数据内容,即匹配和召回数据;最后,对召回结果进行排序,预测用户最想要的是什么。
搜索系统流程图 1.1 Query分析 用户在搜索时输入的内容往往是一系列长句或问题。
机器无法直接识别这种自然语言。
此时,有必要query进行拆解。
首先是分词,即将长句分解成短语或短语。
例如,双11全国购物节将分解为双11/全国/购物节,分解后的单词可以在系统词库中找到。
系统词库一般可以通过常用词库、搜索行为日志、企业产品名称、商品品牌和类别定期更新和维护。
一些开源词库可以在技术上应用,例如jieba、ik等待词库插件。
但是用户的query有时并不总是能准确地分词,比如输入拼音或错别字,系统就要把它们分开query纠错改写。
或者为了更准确地命中用户的意图,需要扩展同义词和语义。
一般通过构造query大部分数据来自用户搜索日志和人工维护,通过校正词和同义词的映射词库来实现。
近年来,由于深度学习的发展,如BERT等NLP在语义扩展应用中引入模型,效果进一步提高。
另外,query分词后的信息并不重要,有时query其中一个关键词实际上是用户想要表达的真实意图。
提取这个词可以帮助后续召回排序阶段更快、更准确地匹配内容,这就是识别和提取关键词的作用。
无论是分词、关键词识别还是语义扩展,上述目的都是针对用户query解释,理解用户的真实意图,为下一个搜索引擎从系统中召回的数据设置一个大致的范围。
1.2 召回 召回,即用户query在此之前,系统需要处理一系列任务。
当然,首要任务是建立搜索系统的数据库。
一般来说,这个过程是搜索引擎的索引构建。
对于电子商务等搜索业务,引擎将将商品标题、商品简介、广告词、品牌、类别等文本字段纳入索引,并与词典建立映射关系query分词后可以快速匹配,从数据库中召回所有命中的内容。
当然,除了标题、介绍等文本信息外,搜索引擎还将构建商品销售、评论、点击等数值字段,并在下一个排名阶段发挥作用。
1.3 排序 搜索召回的数据往往很多,那么哪些内容会优先显示呢?搜索引擎将根据每个因素的价值给予一定的权重,并在综合后对每个数据进行评估。
影响搜索排名的因素一般可分为两类: 文本相关性,主要考虑搜索词和内容的相关性,有许多成熟的解决方案,如经典TF-IDF、BM25算法等; 与电子商务相关的业务,如价格、销售、及时性、信息阅读、共享等。
排序算法和每个因素的权重不是一成不变的,会随着数据的积累而积累badcase分析和迭代优化的最终效果也是对业务理解的考验。
此外,除了相关的排名外,大多数搜索系统还增加了个性化排名的能力。
一般来说,点击率模型是通过搜索日志挖掘、用户标签和数据内容来预测用户偏好的搜索结果。
经过query经过一系列召回、排序等一系列步骤,数据内容按相关顺序呈现给用户,以上是搜索实现的基本原理。
02 用户搜索的故事线 以上解决了什么是搜索问题。
接下来,让我们来看看搜索产品通常具有哪些功能。
搜索的原因是信息过载,特别是越来越多的长尾内容无法有效接触。
用户需要通过搜索快速找到所需的数据,因此搜索功能是基于降低用户使用成本。
从用户的角度来看,搜索过程的故事线如下图所示。
用户搜索故事线 2.1 搜索前 2.1.1 搜索输入形式 在进入搜索之前,通常有几种交互方式将搜索内容输入到系统中。
主流是文本框搜索。
随着语音识别技术的发展,一些企业开始逐步引入语音搜索(本质上仍然是文本搜索后的语音文本搜索)。
此外,许多电子商务产品还具有图片搜索功能。
这三种输入形式可以根据团队实力和业务需求进行规划。
2.1.2 默认框词的底纹 当搜索入口以输入框的形式设计时,通常会有底纹默认词。
对于用户来说,这是一个减少搜索推荐选择的入口,对于企业来说,它是一个营销推广和交通分销的广告空间。
因此,在实现方面,通常结合用户的行为数据(如历史搜索、搜索点击,甚至商品购买、浏览拇指等搜索外部数据)、流行搜索和人工干预进行综合推荐。
底纹默认词 2.2 搜索中 从用户选择搜索框到输入搜索词从用户选择搜索框到输入搜索词。
2.2.1 历史搜索