针对你如何使用T-SQL全文搜索来获得像谷歌这样的结果?这个问题,本篇文章进行了详细的解答,同时本文还将给你拓展javascript–如何构建像谷歌这样的拖放圈系统、MySQL全文搜索得不到所要的结果
针对你如何使用T-SQL全文搜索来获得像谷歌这样的结果?这个问题,本篇文章进行了详细的解答,同时本文还将给你拓展javascript – 如何构建像谷歌这样的拖放圈系统、MySQL 全文搜索得不到所要的结果、MySQL中获得更好的全文搜索结果、MySQL全文搜索等相关知识,希望可以帮助到你。
本文目录一览:你如何使用T-SQL全文搜索来获得像谷歌这样的结果?
我有一个数据库,其中包含可以包含长词的字段.我希望能够在这些列中快速搜索关键字或词组,但在搜索词组时,我希望能够像Google那样搜索词组,返回包含所有指定词的所有行,但不是特别的相互命令或“接近”.此时不需要按相关性对结果进行排名.
在阅读了sql Server的Full-Text Search之后,我认为这正是我所需要的:基于文本列中每个单词的可搜索索引.我的最终目标是安全地接受用户输入并将其转换为利用全文搜索速度的查询,同时保持用户的易用性.
问题:全文搜索功能不像Google那样搜索
我看到FREETEXT
function可以采用整个短语,将其分解为“有用”的单词(忽略像’和’,’或’,”等单词),然后快速返回匹配行的列表,即使是一个复杂的搜索词.但是当你尝试使用它时,你可能会注意到,而不是AND搜索每个术语,它似乎只进行OR搜索.也许有办法改变它的行为,但我没有找到任何有用的东西.
然后是CONTAINS
,它可以接受布尔查询短语,但有时会产生奇怪的结果.
看看这个表上的以下查询:
数据
PKID Name ----- ----- 1 James Kirk 2 James Cameron 3 Kirk Cameron 4 Kirk For Cameron
查询
Q1: SELECT Name FROM tblName WHERE FREETEXT(Name,'james') Q2: SELECT Name FROM tblName WHERE FREETEXT(Name,'james kirk') Q3: SELECT Name FROM tblName WHERE FREETEXT(Name,'kirk for cameron') Q4: SELECT Name FROM tblName WHERE CONTAINS(Name,'james') Q5: SELECT Name FROM tblName WHERE CONTAINS(Name,'"james kirk"') Q6: SELECT Name FROM tblName WHERE CONTAINS(Name,'"kirk james"') Q7: SELECT Name FROM tblName WHERE CONTAINS(Name,'james AND kirk') Q8: SELECT Name FROM tblName WHERE CONTAINS(Name,'kirk AND for AND cameron')
查询1:
SELECT Name FROM tblName WHERE FREETEXT(Name,'james')
返回“James Kirk”和“James Cameron”.好吧,让我们把它缩小……
查询2:
SELECT Name FROM tblName WHERE FREETEXT(Name,'james kirk')
你猜怎么着.现在你将获得“James Kirk”,“James Cameron”和“Kirk For Cameron”.查询3也发生了同样的事情,所以让我们跳过它.
查询4:
SELECT Name FROM tblName WHERE CONTAINS(Name,'james')
与查询1的结果相同.好的.缩小结果可能……?
查询5:
SELECT Name FROM tblName WHERE CONTAINS(Name,'"james kirk"')
在发现你需要将字符串括在双引号中(如果有空格)之后,我发现这个查询在这个特定的数据集上对我想要的结果很有用!只返回“James Kirk”.精彩!还是……
查询6:
SELECT Name FROM tblName WHERE CONTAINS(Name,'"kirk james"')
废话.不,它匹配那个确切的短语.嗯…在检查syntax for T-SQL’s CONTAINS function之后,我看到你可以在那里抛出布尔关键字,看起来这可能就是答案.让我们来看看…
查询7:
SELECT Name FROM tblName WHERE CONTAINS(Name,'james AND kirk')
整齐.正如所料,我得到了所有三个结果.现在我只写一个函数来填充所有单词之间的单词AND.做完了吧?现在怎么办…
查询8:
SELECT Name FROM tblName WHERE CONTAINS(Name,'kirk AND for AND cameron')
此查询确切地知道它正在寻找什么,除了某些原因,没有结果.为什么?在阅读了大约Stopwords and Stoplists之后,我会做出一个有根据的猜测并说,因为我要求“kirk”,“for”和“cameron”的索引结果的交叉点,并且“for”这个词不会有任何结果(它是一个停用词和所有结果),那么与该结果的任何交集的结果也是空的.它是否实际上是这样的函数对我来说是无关紧要的,因为每次我在那里进行带有停用词的布尔搜索时,这就是CONTAINS函数的可观察行为.
所以我需要一个新的解决方案.
这是NEAR
看起来很有希如果我可以接受用户查询并在它之间添加逗号,这将…等待这与在CONTAINS查询中使用布尔AND相同.但它是否正确地忽略了停用词?
SELECT Name FROM tblName WHERE CONTAINS(Name,'NEAR(kirk,for,cameron)')
不.没有结果.删除“for”一词,然后再次获得所有三个结果.
总结
以上是小编为你收集整理的你如何使用T-SQL全文搜索来获得像谷歌这样的结果?全部内容。
如果觉得小编网站内容还不错,欢迎将小编网站推荐给好友。
javascript – 如何构建像谷歌这样的拖放圈系统
我已经测试了G一段时间了,我发现朋友拖放到圈子里的东西有一个非常好的效果(你不觉得吗?)
我想知道如何在拖拽时获得类似的效果.使用jQuery将用户放入一个圆圈.它可以给我一个起点,以实现树或方形的这一点.
MySQL 全文搜索得不到所要的结果
MySQL版本:5.7.9
表结构:
CREATE TABLE `promotion` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `keyword` varchar(255) NOT NULL, PRIMARY KEY (`id`), FULLTEXT KEY `building` (`keyword`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
在keyword字段中建立了一个全文索引,表中有大量数据。
用LIKE语句查询
SELECT id, keyword FROM `promotion` WHERE keyword LIKE ''%保利国际广场%'';
查询结果:
1 保利国际广场
2 保利国际广场论坛
3 北京保利国际广场
4 保利国际广场论坛
5 保利国际广场地址
6 ……
用全文搜索
SELECT id, keyword FROM `promotion` MATCH(keyword) AGAINST (''保利国际广场'' IN BOOLEAN MODE)
查询结果:
1 保利国际广场
以上的查询有点像精确匹配了,凡是包含“保利国际广场”的词都没出来,在网上查询了一些资料以后修改成了以下的语句
SELECT id, keyword FROM promotion MATCH(keyword) AGAINST (''保利国际广场*'' IN BOOLEAN MODE)
查询结果:
1 保利国际广场
2 保利国际广场论坛
3 保利国际广场论坛
4 保利国际广场地址
5 ……
这个结果有点像模糊匹配了,但是……“北京保利国际广场”这个词没有匹配到。
请问,如何才能用全文搜索的方法获得像LIKE一样的结果呢?
谢谢大家
MySQL中获得更好的全文搜索结果
本文章介绍一下关于MySQL中获得更好的全文搜索结果,有需要的朋友可看看。
mysql针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的mysql方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为mysql对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为mysql使用自然语言来智能地对结果评级,以去掉不相关的项目。
这篇文章将向您讲述在MySQL中如何进行。
1、设置基本表格
从创建例子表格开始,使用以下的SQL命令:
代码如下 | 复制代码 |
> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL AUTO_INCREMENT, data TEXT); |
以上命令创建了一个简单的音乐专集资料库(主要是整段的文字),然后向这个表格中添加一些记录:
代码如下 | 复制代码 |
mysql> INSERT INTO `reviews` (`id`, `data`) VALUES (1, ''Gingerboy has a new single out called Throwing Rocks. It''s great!''); mysql> INSERT INTO `reviews` (`id`, `data`) VALUES (2, ''Hello all, I really like the new Madonna single. One of the hottest tracks currently playing... I''ve been listening to it all day''); mysql> INSERT INTO `reviews` (`id`, `data`) VALUES (3, ''Have you heard the new band Hotter Than Hell? They have five members and they burn their instruments when they play in concerts. These guys totally rock! Like, awesome, dude!''); 验证数据的正确录入: mysql> SELECT * FROM reviews; +----+--------------------------------------------+ | id | data | +----+--------------------------------------------+ | 1 | Gingerboy has a new single out called ... | | 2 | Hello all, I really like the new Madon ... | | 3 | Have you heard the new band Hotter Than... | +----+--------------------------------------------+ 3 rows in set (0.00 sec) |
2、定义全文搜索字段
接下来,定义您要作为全文搜索索引的字段
代码如下 | 复制代码 |
mysql> ALTER TABLE reviews ADD FULLTEXT INDEX (data); Query OK, 3 rows affected (0.21 sec) Records: 3 Duplicates: 0 Warnings: 0 |
使用SHOW INDEXES命令来检查索引已经被添加了:
代码如下 | 复制代码 |
mysql> SHOW INDEXES FROM reviews; +---------+---------------+--------+------+------------+---------+ | Table | Column_name | Packed | Null | Index_type | Comment | ----------+---------------+--------+------+------------+---------+ | reviews | id | NULL | | BTREE | | | reviews | data | NULL | YES | FULLTEXT | | +---------+---------------+--------+------+------------+---------+ 2 rows in set (0.01 sec) |
3、运行全文搜索
当您拥有了数据和索引,就可以使用MySQL的全文搜索了,最简单的全文搜索方式是带有MATCH...AGAINST语句的SELECT查询,以下是一个简单的例子,可以来查找含有单词“single”的记录:
代码如下 | 复制代码 |
mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST (''single'');+----+ | id | +----+ | 1 | | 2 | +----+ 2 rows in set (0.00 sec) |
在此,MATCH()将作为参数传递给它的字段中的文字与传递给AGAINST()的参数进行比较,如果有匹配的,那就按照正常的方式返回。注意您可以传递不止一个字段用MATCH()来查看-只需用逗号来分割字段列表。
当MySQL收到了一个全文搜索的请求,它就在内部对每个记录进行评分,不匹配的记录得分为零,而“更相关”的记录会得到比“不太相关”的记录相对更高的分数。相关性是由MySQL的一系列区分标准来决定的,查看MySQL的用户手册可以得到更多的信息。
想看到每个记录的评分如何,只需要返回MATCH()方法作为结果集的一部分,如下所示:
代码如下 | 复制代码 |
mysql> SELECT id, MATCH (data) AGAINST (''rock'') FROM reviews; +----+-------------------------------+ | id | MATCH (data) AGAINST (''rock'') | +----+-------------------------------+ | 1 | 0 | | 2 | 0 | | 3 | 1.3862514533815 | +----+-------------------------------+ 3 rows in set (0.00 sec) |
4、使用逻辑搜索修饰符(Boolean search modifiers)
您还可以使用逻辑搜索修饰符来进行更精确的搜索,这通过在AGAINST语句中添加特殊的IN BOOLEAN MODE修饰符来实现,在以下的例子中,将查找含有单词“single”但是没有“Madonna”的记录:
代码如下 | 复制代码 |
mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST (''+single -madonna'' IN BOOLEAN MODE); +----+ | id | +----+ | 1 | +----+ 1 row in set (0.00 sec) |
这一搜索特性通常用于搜索单词片断(而不是完整的词语),这可以通过在IN BOOLEAN MODE语句中的*(星号)操作符来实现,以下的例子展示了如何查找单词中含有“hot”的记录:
代码如下 | 复制代码 |
mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST (''hot*'' IN BOOLEAN MODE);+----+ | id | +----+ | 3 | | 2 | +----+ 2 rows in set (0.00 sec) |
您还可以使用这种方法来查找至少一个传递到AGAINST的参数中,以下的例子查找了至少包含单词“hell”和“rocks”中的一个的记录:
代码如下 | 复制代码 |
mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST (''hell rocks'' IN BOOLEAN MODE); +----+ | id | +----+ | 1 | | 3 | +----+ 2 rows in set (0.00 sec) |
以上的这些例子演示了相对于传统的SELECT...LIKE语句,进行全文搜索的更有效的方法,当您下一次需要编写MySQL搜索界面的时候,您可以尝试这一方法。
MySQL全文搜索
全文索引(fulltext),适用于innodb引擎,字段类型为char,varchar,text。
列:
CREATE TABLE articles (
id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
title VARCHAR(200),
body TEXT,
FULLTEXT (title,body) );
三种类型全文搜索:
1.自然语言(natural language)(默认)(默认不区分大小写,要区分大小写,对索引列使用二进制排序规则)
SELECT body FROM articles WHERE MATCH (title,body) AGAINST (''database'' );
2.布尔(Boolean)
SELECT * FROM articles WHERE MATCH (title,body) AGAINST (''+MySQL -YourSQL'' IN BOOLEAN MODE);
+
代表 AND
-
代表 NOT [ 无操作员 ]暗示
OR
InnoDB
全文搜索不支持使用带有通配符(''+*''
),加号和减号组合(''+-''
)或带正号和减号组合(''+-apple''
)的前导加号。这些无效查询返回语法错误。
InnoDB
全文搜索不支持在单个搜索词上使用多个运算符,如下例所示:''++apple''
。
InnoDB
全文搜索不支持@
在布尔全文搜索中使用该符号。该@
符号保留供@distance
邻近搜索运算符使用。
3.查询扩展(query expansion)
搜索“ database ”的用户 可能实际上意味着 “ MySQL ”,“ Oracle ”,“ DB2 ”和“ RDBMS ”都是应该匹配“ 数据库 ”的短语 也应该返回。
SELECT * FROM articles WHERE MATCH (title,body) AGAINST (''database'' WITH QUERY EXPANSION);
全文停用词(如果一个词被认为是太普通或者太没价值,那么它将会被搜索索引和搜索查询忽略)
SELECT * FROM INFORMATION_SCHEMA.INNODB_FT_DEFAULT_STOPWORD;
要为所有InnoDB表定义自己的停用词列表 ,请定义一个与表结构相同的 INNODB_FT_DEFAULT_STOPWORD表,使用停用词填充它,并 在创建全文索引之前将 innodb_ft_server_stopword_table 选项的值设置为表单中的值 。
CREATE TABLE my_stopwords(value VARCHAR(30));
INSERT INTO my_stopwords(value) VALUES (''Ishmael'');
SET GLOBAL innodb_ft_server_stopword_table = ''test/my_stopwords'';
默认情况下,长度小于3个字符或长度大于84个字符的单词不会出现在 InnoDB全文搜索索引中。
全文限制
1.分区表不支持全文搜索。
2.虽然支持在单个表中使用多个字符集,但FULLTEXT
索引中的所有列都 必须使用相同的字符集和排序规则。
3.''%''字符不是全文搜索支持的通配符
4.对于InnoDB所有DML操作(INSERT, UPDATE, DELETE)与全文索引以事务处理涉及列提交时间。
5.全文搜索可以与大多数多字节字符集一起使用。Unicode, utf8
可以使用字符集,但不能使用ucs2
字符集
全文优化
OPTIMIZE TABLE在具有全文索引的表上 运行会重建全文索引,删除已删除的文档ID并在可能的情况下合并同一个单词的多个条目。
要优化全文索引,请启用 innodb_optimize_fulltext_only 并运行OPTIMIZE TABLE。
今天的关于你如何使用T-SQL全文搜索来获得像谷歌这样的结果?的分享已经结束,谢谢您的关注,如果想了解更多关于javascript – 如何构建像谷歌这样的拖放圈系统、MySQL 全文搜索得不到所要的结果、MySQL中获得更好的全文搜索结果、MySQL全文搜索的相关知识,请在本站进行查询。
本文标签: