搜索引擎是什么?中小企业为什么需要搜索引擎?

2021-09-15 10:01科赞网络

对搜索引擎进行原则性的分享,包括一系列搜索的核心数据结构和算法,尽可能地涵盖了搜索引擎的核心原则,但是不涉及数据挖掘,NLP等等。

                                         

                                                                 

                                                                        搜索引擎引题

src=http___www.mianfeiwendang.com_pic_d82329b6446a7711110630d4_2-810-jpg_6-1080-0-0-1080.jpg&refer=http___www.mianfeiwendang.jpg

什么是搜索引擎?


这是一个要提的概念。还有一些不同之处:信息检索(InformationRetrieval简称IR)和搜索(Search),对信息的获取、表示、存储、组织和访问进行研究,搜索只是信息检索的一个分支,其它的诸如问答系统、信息抽取、信息过滤等都可以是信息检索。


文中所说的搜索引擎,一般意义上的全文搜索引擎,垂直搜索引擎的一般原理,如Google、Baidu、天猫搜索商品、口碑搜索美食、飞猪搜索酒店等等。


Lucene是一个非常**而有效的全文检索工具包,Lucene是ES和Solr底层使用的,Lucene也是一个很好的例子。


为何需要搜索引擎?


我们来看看一个实际例子:如何从一亿级数据中找出带有“秋裤”名字的商品。


使用SQL Like


select * from item where name like '%秋裤%'

大家首先想到的**个实现是用like实现,但是它不能使用上索引,要对大量数据集执行一次遍历操作,查询速度非常慢。还有没有比较简单的方法,也许可以说可以添加秋裤分类或者标签,很好,那么如果增加了一项商品类别呢?需要添加无数的分类和标签吗?怎样更简单有效地处理全文检索?


利用搜索引擎

d4c2b151-1c13-ec11-8da7-e43d1a103141 (1).png

回答是搜索,会事先build建立一个倒排索引,通过词法语法分析、分词、构建字典、建立倒排表、压缩优化等操作来建立索引,当查询通过字典可以迅速得到结果。这样不仅解决了全文检索的问题,而且解决了SQL查询速度慢的问题。


因此,淘宝是如何在一毫秒内从上亿件商品中找到上千种秋裤的,谷歌如何在一毫秒内从上百万页的网页上搜寻出符合你关键词的网页,如此庞大的数据量是如何达到毫秒级。


网络推广公司,安徽网络推广,抖音推广,关键词优化公司,百度推广代运营,知乎网络推广,品牌推广公司,合肥网站开发,合肥网站建设,合肥网站推广,SEO推广,全网营销整合推广,网络seo优化,网站推广,网络推广,网站排名优化,网站seo优化,网站优化排名,网络推广外包,引流推广,全网整合品牌推广,问答推广,新闻媒体推广



昵称:
内容:
验证码:
提交评论
在线客服系统