python读取mysql数据写入ES总结准备工作: mysql库的安装 。
python中mysql库用的是mysql-connector,安装执行如下命令:
第一步: 连接mysql , 读取数据 。
通过执行sql语句,读取mysql数据 。
至此,获得mysql的原始数据raw_data。接下来对数据进行预处理,按日期进行分组聚合,然后重命名行和列名,得到dataFrame格式的数据 。
第二步: 连接ES 。
这步没有太多的可解释的地方,就是配置信息 。
第三步: ES主键加密 。
这步的目的是为了保持主键唯一性,防止重复写入 。用的方法是md5加密 。
第四步: 写入ES
至此,一切的准备工作都做好了,数据也有了,主键加密也做了,就开始写入了 。
用main方法执行以上方法:
最后查看一下ES写的是否成功,用查询方法
如果返回以下信息 , 说明ES里成功插入了数据 。
另外,ES删除索引的操作:
全文搜索之MySQL与ElasticSearch搜索引擎 MySQL支持全文索引和搜索功能 。在MySQL中可以在CHAR、VARCHAR或TEXT列使用FULLTETXT来创建全文索引 。
FULLTEXT索引主要用MATCH()...AGAINST语法来实现搜索:
MySQL的全文搜索存在以下局限:
通常来说MySQL自带的全文搜索使用起来局限性比较大,性能和功能都不太成熟,主要适用于小项目 , 大项目还是建议使用elasticsearch来做全文搜索 。
ElasticSearch是一个分布式的开源搜索和分析引擎,适用于所有类型的数据,包括文本、数字、地理空间、结构化和非结构化数据,以下简称ES 。
Elasticsearch 在 Apache Lucene 的基础上开发而成,Elasticsearch 以其简单的 REST 风格 API、分布式特性、速度和可扩展性而闻名,是 Elastic Stack 的核心组件 。Elastic Stack 是适用于数据采集、充实、存储、分析和可视化的一组开源工具 。
Elasticsearch 的实现原理主要分为以下几个步骤,首先用户将数据提交到Elasticsearch 数据中心 , 再通过分词控制器去将对应的数据分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户 。
由于ES是基于RESTfull Web接口的 , 因此我们直接按照惯例传递JSON参数调用接口即可实现增删改查,并且不需要我们做额外的管理操作就可以直接索引文档,ES已经内置了所有的缺省操作 , 可以自动帮我们定义类型 。
再次执行PUT , 会对库中已有的id为1的数据进行覆盖,每修改一次_version字段的版本号就会加1 。
默认搜索会返回前10个结果:
返回的几个关键词:
查询字符串搜索 , 可以像传递URL参数一样传递查询语句 。
精确查询:
全文搜索:
以上两种方法都需要考虑数据更改后如何与ES进行同步 。
使用canal将mysql同步到es中 因为自己项目中需要用到mysql数据同步到es中mysql与es怎么结合,查找mysql与es怎么结合了相关资料最后决定用canal来做,所以便有了本文,下面一起来看如何使用canal吧
根据上mysql与es怎么结合的原理解释,我们知道 canal 会模拟 mysql slave mysql与es怎么结合的交互协议,伪装自己为 mysql slave , 然后向 mysql master 发送 dump 协议 。
mysql master 收到 dump 请求,开始推送 binary log 给 slave(也就是 canal),然后 canal 解析 binary log 对象(原始为 byte流) 。
经 canal 解析过的对象 , 我们使用起来就非常的方便了 。
再根据提供的版本信息,mysql与es怎么结合你会发现 canal 其实相当于一个中间件 , 专门用来解析 MySQL 的 binlog 日志 。canal 解析好了之后,会封装成一个数据对象,通过 protobuf3.0 协议进行交互 , 让 canal 客户端进行消费 。
推荐阅读
- 无限路由器光猫怎么连接,无线路由器怎么连接光猫使用
- sqlserver实现数据备份,sql server数据库数据备份
- 飞行打桩小游戏,飞行打怪游戏
- 魔兽世界与服务器断开,魔兽世界服务器断开连接 解决方法分享
- emacsgo语言 emacs orgmode
- 包含sapfsi的词条
- 云原生虚拟机,云原生虚拟机镜像共享
- 画师解谜游戏,画师手游
- mysql表中怎么关联 mysql 关联字段