云服务器293元/年
阅读模式:

mysql全文索引fulltext index

查看:1942  回复:4  类型:  来源:php自学网  标签 mysql 索引

1.简述

        通过建立mysql的全文索引进行全文搜索的功能。全文搜索可以同时搜索多个列中的多个关键字的记录结果。

        虽然like语句也能达到同样的效果,但使用全文索引效率更高,代码更简洁。

        在MySQL5.6.24以后的版本中InnoDB和MyISAM引擎搜支持全文搜索,比MySQL5.6.24低的版本只有MyISAM引擎支持全文搜索。

        mysql默认不支持中文词的搜索。

        mysql建立全文搜索的字段类型必须是char、varchar和text。

2.建立和删除全文索引

#建表的时候添加全文索引
CREATE TABLE news ( 
    id INT AUTO_INCREMENT NOT NULL PRIMARY KEY, 
    title VARCHAR(200), 
    content TEXT, 
    FULLTEXT(title,content) 
)TYPE=MYISAM;
#在已建好的表上添加全文索引
ALTER TABLE `news` ADD FULLTEXT(title);#单个字段
ALTER TABLE `news` ADD FULLTEXT(title,content);#多个字段
#索引的删除
ALTER TABLE `news` DROP INDEX title;
#查看表的所有索引
SHOW INDEX FROM `news`;

3.sql查询语句

#单字段搜索
SELECT * FROM `news` WHERE MATCH(`字段`) AGAINST('关键词');
#多字段搜索
SELECT * FROM `news` WHERE MATCH(`字段`,`字段2`) AGAINST('关键词1 关键词2');

4.检索方式


     4.1、自然语言检索: IN NATURAL LANGUAGE MODE

     4.2、布尔检索: IN BOOLEAN MODE
          剔除一半匹配行以上都有的词,譬如说,每个行都有this这个字的话,那用this去查时,会找不到任何结果,这在记录条数特别多时很有用,
          原因是数据库认为把所有行都找出来是没有意义的,这时,this几乎被当作是stopword(中断词);但是若只有两行记录时,是啥鬼也查不出来的,
          因为每个字都出现50%(或以上),要避免这种状况,请用IN BOOLEAN MODE。

       ● IN BOOLEAN MODE的特色:
          ·不剔除50%以上符合的row。
          ·不自动以相关性反向排序。
          ·可以对没有FULLTEXT index的字段进行搜寻,但会非常慢。
          ·限制最长与最短的字符串。
          ·套用Stopwords。
 
       ● 搜索语法规则:
         +   一定要有(不含有该关键词的数据条均被忽略)。
         -   不可以有(排除指定关键词,含有该关键词的均被忽略)。
         >   提高该条匹配数据的权重值。
         <   降低该条匹配数据的权重值。
         ~   将其相关性由正转负,表示拥有该字会降低相关性(但不像 - 将之排除),只是排在较后面权重值降低。
         *   万用字,不像其他语法放在前面,这个要接在字符串后面。
         " " 用双引号将一段句子包起来表示要完全相符,不可拆字。

         SELECT * FROM news WHERE MATCH (title,content) AGAINST ('+apple -banana' IN BOOLEAN MODE);
         + 表示AND,即必须包含。- 表示NOT,即必须不包含。即:返回记录必需包含 apple,且不能包含 banner。

         SELECT * FROM news WHERE MATCH (title,content) AGAINST ('apple banana' IN BOOLEAN MODE);
         apple和banana之间是空格,空格表示OR。即:返回记录至少包含apple、banana中的一个。

         SELECT * FROM news WHERE MATCH (title,content) AGAINST ('+apple banana' IN BOOLEAN MODE);
         返回记录必须包含apple,同时banana可包含也可不包含,若包含的话会获得更高的权重。

         SELECT * FROM news WHERE MATCH (title,content) AGAINST ('+apple ~banana' IN BOOLEAN MODE);
         ~ 是我们熟悉的异或运算符。返回记录必须包含apple,若也包含了banana会降低权重。
         但是它没有 +apple -banana 严格,因为后者如果包含banana压根就不返回。

         SELECT * FROM news WHERE MATCH (title,content) AGAINST ('+apple +(>banana <orange)' IN BOOLEAN MODE);
         返回必须同时包含“apple banana”或者必须同时包含“apple orange”的记录。
         若同时包含“apple banana”和“apple orange”的记录,则“apple banana”的权重高于“apple orange”的权重。

    4.3、查询扩展检索: WITH QUERY EXPANSION



分享到:
0 0

*有问题之处烦请在评论中指出非常感谢!
不是我想要的内容,继续搜索:

扫描二维码手机查看

最新评论:
OLG-余祥伟  发表于 2017-09-22 11:31:50  中国广东深圳
沙发
http://imysqldba.blog.51cto.com/1222376/1618487 回复
OLG-余祥伟 回复 OLG-余祥伟 对于刚使用mysql全文索引搜索的童鞋,第一个疑惑可能就是,为什么我搜索xx结果不显示呢?明明我数据里面有。这个问题有很多种原因,其中最常见的就是ft_min_word_len(最小搜索长度)导致的。
2017-09-22 11:32 中国广东深圳 回复
站长 回复 OLG-余祥伟 全英文没事,有中文的词设置ft_min_word_len()会好点点,中文分词最好还是用讯搜
2017-09-22 12:09 中国广东深圳 回复
OLG-余祥伟  发表于 2017-09-22 11:35:33  中国广东深圳
板凳
create 语句后面的TYPE=MyISAM<br /> TYPE=MyISAM 和 ENGINE=MyISAM 都是设置数据库存储引擎的语句 ,(老版本的MySQL使用TYPE而不是ENGINE(例如,TYPE = MYISAM)。 MySQL 5.1为向下兼容而支持这个语法,但TYPE现在被轻视,而ENGINE是首先的用法。 一般地,ENGINE 选项是不必要的;除非默认已经被改变了,MyISAM是默认存储引擎。<br /> 所以直接将原来TYPE=MyISAM 改成ENGINE=MyISAM 就可以了 回复
回复:[主题]
表情:
 提交评论
清空

发布评论:


登录:
  表情:
评论话题
推荐阅读:
php打印九九乘法表   阅读:3076一键分享到QQ空间、QQ好友、新浪微博、微信代码   阅读:16599linux命令中执行php脚本   阅读:2470centos 7搭建zabbix3.4   阅读:1176给网站添加一键新浪微博登录的功能   阅读:3037php文件下载防盗链   阅读:4298php+redis实现消息队列   阅读:2376霍金24岁博士毕业论文在线预览   阅读:2029php显示刚刚、几分钟前、几小时前、几天前的函数   阅读:2869Mysql在大型网站的应用架构演变   阅读:2157centos 7 安装 samba 服务   阅读:2323php 使用 smtp.php 类在线发送邮件功能   阅读:2534分享:淘宝技术这十年   阅读:2059mysql共享锁和排他锁详解   阅读:2682php显示刚刚、几分钟前、几小时前、几天前的函数   阅读:2869centos 7 安装 redis 3.2.9   阅读:3158人性漫画:打工与创业的残酷区别   阅读:1834php中地址引用&的真正理解-变量引用、函数引用、对象引用   阅读:2149Mysql在大型网站的应用架构演变   阅读:2157Nginx 配置文件详解   阅读:1998javascript点击复制内容   阅读:2418给php7安装redis扩展库   阅读:3052php删除一个文件夹内的所有文件夹和文件   阅读:2384php 获取当前前后年、月、星期、日、时分秒的时间   阅读:2477linux top命令详解   阅读:2274面试都会问你为什么你从上一家公司离职的真实意思   阅读:4983centos 7搭建zabbix3.4   阅读:1176面试的时候回去等通知,等电话的真实意思   阅读:10085mysql数据库性能的基本优化   阅读:2192shell脚本统计当前服务器并发连接数   阅读:2731phpexcel 超简单从数据库一键导出数据到excel教程   阅读:3247mysql数据库性能的基本优化   阅读:2192php冒泡排序法   阅读:2964面试的时候回去等通知,等电话的真实意思   阅读:10085linux php7安装yaf扩展   阅读:2440给网站添加一键新浪微博登录的功能   阅读:3037php打印九九乘法表   阅读:3076十张GIF让你弄懂递归等概念   阅读:2326程序员找工作三要素(必看)   阅读:2225php打印九九乘法表   阅读:3076Mysql在大型网站的应用架构演变   阅读:2157给网站添加一键新浪微博登录的功能   阅读:3037javascript获取两个日期间的所有日期   阅读:531php 生成图片,给图片加水印   阅读:2950霍金24岁博士毕业论文在线预览   阅读:2029centos 7 安装 nginx-1.11.10   阅读:4067php删除一个文件夹内的所有文件夹和文件   阅读:2384php显示刚刚、几分钟前、几小时前、几天前的函数   阅读:2869nginx编译安装后对nginx进行平滑升级   阅读:958centos 7 忘记root密码   阅读:1754