AI大语言模型建立向量数据库知识库

[复制链接]
查看: 1162|回复: 0

34

主题

38

帖子

489

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
489
发表于 2023-11-29 00:38:58 | 显示全部楼层 |阅读模式
AI大语言模型知识库,针对某些文档相关问题进行提问时,Langchain会使用向量化之后的提问文本与向量数据库中的文本进行相似性搜索。
大语言模型可能会产生“幻觉”,它们偶尔会输出错误的内容。
Embedding是将高维数据转换为低维向量的技术。它通过学习数据之间的关系和特征,将数据映射到一个连续的向量空间中。这种向量表示可以更好地捕捉数据的语义和上下文信息,从而提高算法的效果。
1、本地AI知识库框架介绍

本地AI知识库的能力,Langchain可以很好地支持用户针对本地文档、数据进行总结、问答由于受到 LLM 最大输入 token 的限制,我们需要根据文本进行分段处理,向量化之后的数据后存入ES向量数据库。后续新增文本数据,仅需用同样 Embedding 模型向量化之后添加到向量数据库中即可。用户在针对某些文档相关问题进行提问时,Langchain会使用向量化之后的提问文本与向量数据库中的文本进行相似性搜索,得到相关性最高的 K 条文档后,将提问和匹配文档嵌入提示工程模板中,最后对LLM提问得到回复结果。具体操作如下

2、访问ai.rztx.cn,左边选择模型可以问答操作,右边是文本向量相似性最高片断推理分析及输出结果。




3、文本知识库上传,登录后台ai.rztx.cn/admin,自定义词库功能可以进行知识库的上传,提取分割生成Embedding向量最终存储ES数据库



随着科技的不断发展,我们相信Embedding技术将会有更广阔的应用前景。依据大语言模型AI小助手能在生活及工作中帮助到大家,谢谢大家的阅读。








本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精选推荐

返回顶部 关注微信 下载APP 返回列表