J-Tech & 开源之夏|什么是比快更快的向量搜索
【J-Tech & 开源之夏|什么是比快更快的向量搜索】J-Tech Talk
由 Jina AI 社区为大家带来的技术分享工程师们将深入细节地讲解具体的问题分享
Jina AI 在开发过程中所积累的经验
文章图片
本期 J-Tech Talk 邀请到了在开源之夏项目中脱颖而出的杨小燕,分享她负责的项目《支持 Redis 数据库作为 DocArray 的存储后台》帮助更多的开发者高效地进行向量检索。
作为 Jina 生态的底层模块,DocArray 是一种可扩展的数据结构,完美适配深度学习任务。总的来说,DocArray 能够把非结构化数据,统一成同一种数据结构。支持的数据类型包括文本、图像、音频、视频、3D mesh等,并且能够高效地处理、检索、推荐、存储及传输数据。在小燕的贡献下,DocArray 新增了 Redis 数据库的后端存储支持,现在 DocArray 支持了更多向量数据库作为存储后台,如 Annlite,SQLite,Qdrant 以及 Elasticsearch 等。
分享内容
1、什么是 DocArray
DocArray 是一种为机器学习而生的数据结构工具包。
2、如何实现 DocArray 的 Redis 后端存储
添加 Redis 支持,可以使用基于图的 ANN 搜索算法:HNSW,该算法能够最大程度地达到检索召回率和检索时间的平衡。
3、经验分享 - 在开源之夏和世界各地的工程师一起开发的体验
关于讲师杨小燕
Jina AI 开源社区 DocArray 贡献者中国原子能科学研究院的核能科学与工程专业硕士二年级在读,本科毕业于清华大学工程物理系。
文章图片
活动时间
2022 年 9 月 22 日 周四晚 19:00 - 19:45
开源之夏是由中国科学院软件研究所“开源软件供应链点亮计划”发起,并长期支持的一项暑期开源活动,由软件所与 OpenEuler 社区联合主办,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展。
欢迎私信申请报名活动~
推荐阅读
- OSCS开源安全周报第11期(本月微软补丁日修复|OSCS开源安全周报第11期:本月微软补丁日修复 vscode 漏洞,请开发者留意自己使用的 vscode 是否受该漏洞影响
- MySQL|MySQL5.7数据库-表连接&子查询&外键
- 提速还能不掉点!深度解析|提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现
- 开源代码安全 | 保护软件开发生命周期,你需要知道这些正确方法
- GOPS现场 | 对话龙智大规模安全研发技术专家,分享静态代码、开源组件扫描干货
- 我的开源代码被大公司盗用后(有人承认,有人让我滚!!)
- Tippy.js - 免费开源且高度可定制的气泡提示独立组件
- 推荐一款精致的免费开源图标库,前端开发直接引入使用
- [开源福利]|[开源福利] FreeRedis 历时两年正式发布 v1.0 [C#.NET Redis Client]
- 主题狗themes.dog-精选上百种优秀开源网站主题、博客主题、商城模板