如何编写MySQL全文索引插件

1.简介 全文索引插件用于对MYISAM的全文检索特性进行扩展。通过全文检索,我们可以对文档、图片或者视频等丰富的数据类型进行分词

1.简介

全文索引插件用于对MYISAM的全文检索特性进行扩展。通过全文检索,我们可以对文档、图片或者视频等丰富的数据类型进行分词,建立索引,以便进行快速的检索。

目前MySQL仅在MYISAM存储引擎里支持全文检索,而对于innodb,则要在6.0以后的版本中才会实现。

但目前全文索引也有着如下的限制:

1.        只支持MyISAM

2.        不支持中文

3.        如果支持在一个单独表中使用多个字符集,则所有fulltext索引的列必须使用完全一样的字符集和库

4.        MATCH()列列表必须同该表中一些FULLTEXT索引定义中的列列表完全符合,除非MATCH()在IN BOOLEAN MODE

5.        对AGAINST() 的参数必须是一个常数字符串。

 

那么Full Text Plugin在这其中扮演什么样的角色呢。MYISAM本身自带的分词程序会将列里面的数据进行分词存储到全文索引里,同时也会使用分词来处理查询中出现的字符串;Full Text Plugin可以完全接管该功能。

例如,我们可以通过Plugin实现对多媒体数据的分词检索,可以使用自己的算法进行分词,甚至可以改变全文检索的语法。

 

 

2. 如何编写Full Text Plugin

插件的编写主要包括: init、deinit以及parse程序;每次执行sql之前会调用一次init(),执行完成后会调用deinit函数。Parse()函数在执行SQL的过程中进行语法分析

 

1)声明插件

结构体st_mysql_ftparser用于声明一个full text插件

struct st_mysql_ftparser

{

  intinterface_version;

  int(*parse)(MYSQL_FTPARSER_PARAM *param);

  int(*init)(MYSQL_FTPARSER_PARAM *param);

  int(*deinit)(MYSQL_FTPARSER_PARAM *param);

};

字段

类型

描述

interface_version

int

版本号

parse

int (*parse)(MYSQL_FTPARSER_PARAM *param);

语法分析程序

init

int (*init)(MYSQL_FTPARSER_PARAM *param);

初始化函数,函数指针

deinit

int (*deinit)(MYSQL_FTPARSER_PARAM *param);

清理函数,函数指针

 

可以看到,这三个函数公用一种参数类型:MYSQL_FTPARSER_PARAM,这个结构体由MySQL来初始化,但我们同样可以修改其函数指针,以使用自定义的函数,结构体如下:

 

字段

类型

描述

mysql_parse

int (*mysql_parse)(struct st_mysql_ftparser_param *,

char *doc, int doc_len)

默认指向mysql内建的全文分词函数。

mysql_add_word

int (*mysql_add_word)(struct st_mysql_ftparser_param *,

char *word, int word_len,

MYSQL_FTPARSER_BOOLEAN_INFO *)

用于对每个分解的单词进行处理;通常会把这些单词加到一颗树或列表里。并在结束后插入/更新/删除全文索引里的记录

ftparser_state

void *

我们可以在该指针分配额外的内存,用于在不同的API接口间传递

mysql_ftparam

void *

由MySQL内部使用,将信息传递给mysql_parse和mysql_add_word,编写plugin时无需修改

cs

struct charset_info_st *

文档的字符集

doc

char *

需要被解析的文档,例如,我们可以填写一个url,,那么在语法分析程序里。我们可以读取到Url对应的文件,再进行分析

length

int

文档的长度,这是因为doc可能并不是以结尾的,我们在写plugin时需要注意这一点

flags

int

目前仅有一个选项:MYSQL_FTFLAGS_NEED_COPY。该选项用于告诉mysql_add_word需要一份单词的拷贝;内建的mysql_parse()无需指定该Flag,这是因为其使用doc的指针,而doc在离开函数后也是有效的

mode

enum enum_ftparser_mode

操作的类型,主要包括以下几种:

MYSQL_FTPARSER_SIMPLE_MODE :解析程序仅返回需要的单词,剔除停词、过滤词

MYSQL_FTPARSER_WITH_STOPWORDS :用于布尔查询的单词匹配,这种情况下需要考虑所有的单词,包括停词

MYSQL_FTPARSER_FULL_BOOLEAN_ INFO :用于解析一个包含布尔操作符的布尔查询字符串;这种情况下,我们需要

设置mysql_add_word的参数——MYSQL_FTPARSER_BOOLEAN_INFO

 

 

当mode被设置为MYSQL_FTPARSER_FULL_BOOLEAN_ INFO时。我们需要为函数mysql_add_word设置其最后一个参数,我们再看该函数的原型:

int (*mysql_add_word)(structst_mysql_ftparser_param *,

char *word, int word_len,

MYSQL_FTPARSER_BOOLEAN_INFO *);

 

最后一个参数结构体为MYSQL_FTPARSER_BOOLEAN_INFO,也就是结构体st_mysql_ftparser_boolean_info,如下所示:

字段

类型

描述

type

enum enum_ft_token_type

用于标示token的类型,有如下几种:

FT_TOKEN_EOF :

无需设置

FT_TOKEN_WORD :

表示普通的单词

FT_TOKEN_STOPWORD:

停词 ,建立索引时会被忽略

FT_TOKEN_LEFT_PAREN :

表示一个子表达式开始

FT_TOKEN_RIGHT_PAREN :

表示一个子表达式结束

yesno

int

用于支持布尔操作:

>0 单词必须要匹配,对应 +

=0 可能匹配,会增加关联度

weight_adjust

int

关联词的重要性、

>0, 对应于>操作符

 

wasign

char

单词的重要性:

非0 表示噪音单词,会减少关联度,对应于操作符 ~

trunc

char

如果为非0,则单词被认为是一个前缀,所有以此为前缀的都会被匹配,对应的操作符为 *

prev

char

忽略

quot

char*

对应于””双引号操作符

 

linux

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/1942001.html

(0)
上一篇 2025年2月23日 00:48:40
下一篇 2025年2月23日 00:49:08

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • navicat premium怎么上传数据库

    首先,在Navicat Premium中连接要导出数据库的mysql数据库。 填写好连接数据库的信息后就可以连接到需要导出的数据库了。 打开要导出的数据库。 将数据库的结构和数据导出为SQL文件。 相关推荐:《Navicat for mys…

    2025年2月23日 数据库
    100
  • navicat怎么打开数据库

    1、打开Navicat,点击左上角的‘Conection’按钮。 2、点击后,弹出菜单,我们要选择是哪种类型的数据库,根据你本地部署的数据库类型来选就行了,我这里选择MySql。 3、选择后,弹出窗口,在这个窗口上我们先输入数据库的Host…

    2025年2月23日 数据库
    100
  • navicat怎么清除数据库备份

    第一步,打开Navicat。 第二步,打开mysql数据库连接。 相关推荐:《Navicat for mysql使用图文教程》 第三步,点击备份所在的数据库,并选中备份菜单,此时显示已建的备份。 第四步,右击要删除的备份,在弹出菜单中选择“…

    2025年2月23日 数据库
    100
  • navicat怎么备份数据库

    本篇经验将和大家介绍如何利用Navicat for MySQL进行数据库备份的操作,希望对大家的工作和学习有所帮助! 推荐教程:mysql入门视频教程 1、打开桌面上的或者从开始程序中找到Navicat for MySQL,如下图所示: 2…

    2025年2月23日 数据库
    100
  • navicat新建数据库的步骤

    打开navicat工具,连接上您自己的mysql服务器,然后在如图所示的连接上右击,选择新建数据库。 相关推荐:《Navicat for mysql使用图文教程》 在新建数据库对话框中,需要输入数据库名称,选择字符集和排序规则,名称建议使用…

    2025年2月23日 数据库
    100
  • navicat怎么导入本地数据库

    navicat怎么导入本地数据库,为什么我没有找到该导入的功能呢?请看下面方法。 推荐教程:MySQL入门视频教程 1、首先我们打开软件,并且连接上本地数据库,选中连接,右键打开连接,直接双击也可以的 2、在本地数据库中我们新建一个数据库用…

    2025年2月23日 数据库
    100
  • navicat如何设置高级数据库属性

    Navicat是一套快速、可靠的数据库管理工具,在设置高级连接选项卡中还可以设置高级数据库属性,是否设置高级数据库属性不做强制性要求。如果需要设置高级数据库,前提是勾选“使用高级连接”。详细介绍如下: MySQL、PostgreSQL和Ma…

    2025年2月23日
    100
  • 怎么使用navicat连接数据库

      无论是本机安装的MySQL,还是远程服务器上的MySQL,对其进行管理都特别的麻烦,如何对其进行方便简单的管理呢?Navicat是一款管理MySQL数据库的软件,其简洁明了的界面,使我们能更好的管理数据库,对其进行增删改查的操作。 推荐…

    2025年2月23日 数据库
    100
  • navicat怎么创建数据库

      使用navicat快速创建数据库,我们这以创建Mysql数据库为例,其他数据库在navicat中操作都一样 推荐教程:MySQL数据库入门视频教程 1、打开navicat 2、选中数据库连接“root”右键-》新建数据库 3、填写数据库…

    2025年2月23日 数据库
    100
  • 如何使用navicat为数据库表建立索引?

    下面介绍如何使用Navicat为数据库表建立索引的具体操作方法。 推荐教程:MySQL数据库入门视频教程 1、打开Navicat 2、打开数据表所在的数据库,右击需要新增索引的数据库表,然后点击【设计表】 3、此时进入表设计界面 4、点击【…

    2025年2月23日 数据库
    100

发表回复

登录后才能评论