大家好!我是舰长🙏
最近,关于搭建个人知识库的话题实在是太热门了!今天我来分享一个人人可以迅速构建个人知识库的黑科技。
当我们陷入每天无数杂乱信息的漩涡时,利用 OCR 技术将各种格式的电子文档或纸质文档转化为数字化内容,可以帮助我们系统化地整理知识,使其成为我们专属的"智囊",从而赋能日常生活和工作。
有一个属于自己个人知识库就相当于有一个私人管家,掌管着你所有知识数据,不仅有无数个书架把你的数据信息进行分类储存,又随时在线,帮你找到所需要的知识。
在RAG进入大众视野后,不少尝鲜者率先搭建了个人知识库。随着GPTs这一类"人工智能应用商店"的出现,更多不会敲代码的用户也能迈过技术门槛,拥有自己的知识库。互联网上涌现出很多实用、有趣的案例:
技术博主通过建立知识库,将写作素材、研究资料和学习笔记整合在一起,提高写作效率,并且通过分享知识库内容建立个人品牌。
法律圈人士通过构建知识库,将散落各处的文章资料和专业知识整理合并,不仅便于律师自身的学习和查阅,还能为客户提供更加精准、高效的法律服务。
学生和学者通过搭建知识库,整合研究资料、实验数据和论文草稿,使研究工作更加有序,查找信息更快捷。
1
在工作台界面,上传所有预备导入知识库的文件。我们以搭建LLM前沿研究知识库为例,首批先上传了23份LLM相关研究论文。
在解析快速完成后,点击左下角【多选】➡️【本页全选】,再点击右下角【批量导出】,就能获得转化为Markdown格式的所有文件。
2
确定基本信息后,上传我们在Step1批量解析的md文件。
点击下一步,来到【分段设置】。在自定义模式中,Coze支持自行设定分段标识符(换行、中文句号、英文句号、叹号及问号等)与分段最大长度,并可以勾选文本预处理规则。
进入下一步,待服务器数据处理完成后,知识库就创建成功了。
3
选择【创建智能体】,为你的智能体起名并填写功能介绍。和创建知识库时一样,在这一步我们可以为智能体生成一个合适的图标。
*图标由Coze生成。
点击确认后,我们进入编排页面,在【知识】一栏,选择添加知识库。
添加我们先前建立的知识库。
点选【自动调用】,我们可以定义知识库的召回与回复设置。
如有需要,也可在上方另行调整模型设置。
完成简单编排后,在【预览与调试】窗口,我们可以进行测试。
例如图中,输入问题:"如何通过调整prompt来提高模型表现?"新创建的LLM知识问答智能体调用知识库中的论文信息,给出了高质量回答。
小贴士
部分Markdown文件中可能包含注释格式,用以保存图片解析信息等元素,而Coze平台对包含注释的md文件存在不兼容的现象,在上传过程中,你可能会看到如下报错👇
我们为大家提供一个脚本工具,用于便捷删除md文件中的注释,支持Linux、Windows、Mac系统,有使用需求的朋友可以进入链接下载。
链接:https://pan.quark.cn/s/5295a7e187ed
以上就是本期Coze知识库搭建流程啦,欢迎评论区分享你的实践和妙用!
关注公众号并添加舰长微信,领取智能体学习资料,并参与Coze技术直播讲解
没有评论:
发表评论