2025年1月10日星期五

最新扣子(coze)实战应用,10分钟保姆级搭建教程来了!


大家好!我是舰长🙏


最近,关于搭建个人知识库的话题实在是太热门了!今天我来分享一个人人可以迅速构建个人知识库的黑科技。


当我们陷入每天无数杂乱信息的漩涡时,利用 OCR 技术将各种格式的电子文档或纸质文档转化为数字化内容,可以帮助我们系统化地整理知识,使其成为我们专属的"智囊",从而赋能日常生活和工作。


有一个属于自己个人知识库就相当于有一个私人管家,掌管着你所有知识数据,不仅有无数个书架把你的数据信息进行分类储存,又随时在线,帮你找到所需要的知识。


在RAG进入大众视野后,不少尝鲜者率先搭建了个人知识库。随着GPTs这一类"人工智能应用商店"的出现,更多不会敲代码的用户也能迈过技术门槛,拥有自己的知识库。互联网上涌现出很多实用、有趣的案例:

技术博主的内容科普系统

技术博主通过建立知识库,将写作素材、研究资料和学习笔记整合在一起,提高写作效率,并且通过分享知识库内容建立个人品牌。


法律人的法律搜索引擎

法律圈人士通过构建知识库,将散落各处的文章资料和专业知识整理合并,不仅便于律师自身的学习和查阅,还能为客户提供更加精准、高效的法律服务。


学术研究人员的知识图书馆

学生和学者通过搭建知识库,整合研究资料、实验数据和论文草稿,使研究工作更加有序,查找信息更快捷。

不过,另一个问题困扰着不少朋友——如何将PDF格式的电子文档进行格式转换,让机器可以精准的理解,而不会储存了一堆乱码?

那今天要分享的黑科技就可以派上用场了——TextIn最新PDF转MarkDown工具!


那下面我们就用它演示下,如何在Coze扣子平台搭建个人知识库!


1

step.01

使用TextIn文档解析

实现PDF批量转MD


搭建个人知识库的第一步,是知识数据准备与清理。要将"人类可读"数据转化为"机器可读",我们需要优质的文档解析工具,准确识别PDF等编码格式文件中的文字、标题、图表,并以信息损失最小的方式传递给大模型。

首先,作为暂时没有API需求的用户,我们直接点击在线使用,进入TextIn工作台。记得先扫码领取专属福利,再注册,不然就亏大了!👇


网站指路链接:https://cc.co/16YSNW

在工作台界面,上传所有预备导入知识库的文件。我们以搭建LLM前沿研究知识库为例,首批先上传了23份LLM相关研究论文。


在解析快速完成后,点击左下角【多选】➡️【本页全选】,再点击右下角【批量导出】,就能获得转化为Markdown格式的所有文件。


2

Step.02

在Coze平台搭建知识库


登陆Coze扣子平台后,点击路径:【个人空间】➡️【知识库】➡️【创建知识库】,自行选择文件格式与上传渠道。
添加知识库名称与描述后,可以让Coze自动生成并挑选你满意的知识库图标~


确定基本信息后,上传我们在Step1批量解析的md文件。

点击下一步,来到【分段设置】。在自定义模式中,Coze支持自行设定分段标识符(换行、中文句号、英文句号、叹号及问号等)与分段最大长度,并可以勾选文本预处理规则。


进入下一步,待服务器数据处理完成后,知识库就创建成功了。


3

Step.03

创建属于你的问答智能体


选择【创建智能体】,为你的智能体起名并填写功能介绍。和创建知识库时一样,在这一步我们可以为智能体生成一个合适的图标。

*图标由Coze生成。

点击确认后,我们进入编排页面,在【知识】一栏,选择添加知识库。

添加我们先前建立的知识库。

点选【自动调用】,我们可以定义知识库的召回与回复设置。

如有需要,也可在上方另行调整模型设置。

完成简单编排后,在【预览与调试】窗口,我们可以进行测试。

例如图中,输入问题:"如何通过调整prompt来提高模型表现?"新创建的LLM知识问答智能体调用知识库中的论文信息,给出了高质量回答。

小贴士

部分Markdown文件中可能包含注释格式,用以保存图片解析信息等元素,而Coze平台对包含注释的md文件存在不兼容的现象,在上传过程中,你可能会看到如下报错👇

我们为大家提供一个脚本工具,用于便捷删除md文件中的注释,支持Linux、Windows、Mac系统,有使用需求的朋友可以进入链接下载。

链接:https://pan.quark.cn/s/5295a7e187ed


以上就是本期Coze知识库搭建流程啦,欢迎评论区分享你的实践和妙用!


扫描下方二维码,或点击阅读原文

免费获取1000次试用福利

限时专属福利·先到先得



关注公众号并添加舰长微信,领取智能体学习资料,并参与Coze技术直播讲解



没有评论:

发表评论

复旦开源Hallo:只需输入一段音频和一张照片就可以让人物说话。

之前和大家介绍过阿里的EMO和腾讯的AniPortrait,用户只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的AI视频。最长时间可达1分30秒左右。 感兴趣的小伙伴可以点击下面链接阅读。 阿里最新EMO:只需要提供一张照片和一段音频,即可生成会说话唱歌的AI...