AI I024: 最新扣子(coze)实战应用，10分钟保姆级搭建教程来了！

2025年1月10日星期五

最新扣子(coze)实战应用，10分钟保姆级搭建教程来了！

大家好！我是舰长🙏

最近，关于搭建个人知识库的话题实在是太热门了！今天我来分享一个人人可以迅速构建个人知识库的黑科技。

当我们陷入每天无数杂乱信息的漩涡时，利用 OCR 技术将各种格式的电子文档或纸质文档转化为数字化内容，可以帮助我们系统化地整理知识，使其成为我们专属的"智囊"，从而赋能日常生活和工作。

有一个属于自己个人知识库就相当于有一个私人管家，掌管着你所有知识数据，不仅有无数个书架把你的数据信息进行分类储存，又随时在线，帮你找到所需要的知识。

在RAG进入大众视野后，不少尝鲜者率先搭建了个人知识库。随着GPTs这一类"人工智能应用商店"的出现，更多不会敲代码的用户也能迈过技术门槛，拥有自己的知识库。互联网上涌现出很多实用、有趣的案例：

技术博主的内容科普系统

技术博主通过建立知识库，将写作素材、研究资料和学习笔记整合在一起，提高写作效率，并且通过分享知识库内容建立个人品牌。

法律人的法律搜索引擎

法律圈人士通过构建知识库，将散落各处的文章资料和专业知识整理合并，不仅便于律师自身的学习和查阅，还能为客户提供更加精准、高效的法律服务。

学术研究人员的知识图书馆

学生和学者通过搭建知识库，整合研究资料、实验数据和论文草稿，使研究工作更加有序，查找信息更快捷。

不过，另一个问题困扰着不少朋友——如何将PDF格式的电子文档进行格式转换，让机器可以精准的理解，而不会储存了一堆乱码？

那今天要分享的黑科技就可以派上用场了——TextIn最新PDF转MarkDown工具！

那下面我们就用它演示下，如何在Coze扣子平台搭建个人知识库！

step.01

使用TextIn文档解析

实现PDF批量转MD

搭建个人知识库的第一步，是知识数据准备与清理。要将"人类可读"数据转化为"机器可读"，我们需要优质的文档解析工具，准确识别PDF等编码格式文件中的文字、标题、图表，并以信息损失最小的方式传递给大模型。

首先，作为暂时没有API需求的用户，我们直接点击在线使用，进入TextIn工作台。记得先扫码领取专属福利，再注册，不然就亏大了！👇

网站指路链接：https://cc.co/16YSNW

在工作台界面，上传所有预备导入知识库的文件。我们以搭建LLM前沿研究知识库为例，首批先上传了23份LLM相关研究论文。

在解析快速完成后，点击左下角【多选】➡️【本页全选】，再点击右下角【批量导出】，就能获得转化为Markdown格式的所有文件。

Step.02

在Coze平台搭建知识库

登陆Coze扣子平台后，点击路径：【个人空间】➡️【知识库】➡️【创建知识库】，自行选择文件格式与上传渠道。

添加知识库名称与描述后，可以让Coze自动生成并挑选你满意的知识库图标～

确定基本信息后，上传我们在Step1批量解析的md文件。

点击下一步，来到【分段设置】。在自定义模式中，Coze支持自行设定分段标识符（换行、中文句号、英文句号、叹号及问号等）与分段最大长度，并可以勾选文本预处理规则。

进入下一步，待服务器数据处理完成后，知识库就创建成功了。

Step.03

创建属于你的问答智能体

选择【创建智能体】，为你的智能体起名并填写功能介绍。和创建知识库时一样，在这一步我们可以为智能体生成一个合适的图标。

*图标由Coze生成。

点击确认后，我们进入编排页面，在【知识】一栏，选择添加知识库。

添加我们先前建立的知识库。

点选【自动调用】，我们可以定义知识库的召回与回复设置。

如有需要，也可在上方另行调整模型设置。

完成简单编排后，在【预览与调试】窗口，我们可以进行测试。

例如图中，输入问题："如何通过调整prompt来提高模型表现？"新创建的LLM知识问答智能体调用知识库中的论文信息，给出了高质量回答。

小贴士

部分Markdown文件中可能包含注释格式，用以保存图片解析信息等元素，而Coze平台对包含注释的md文件存在不兼容的现象，在上传过程中，你可能会看到如下报错👇

我们为大家提供一个脚本工具，用于便捷删除md文件中的注释，支持Linux、Windows、Mac系统，有使用需求的朋友可以进入链接下载。

链接：https://pan.quark.cn/s/5295a7e187ed

以上就是本期Coze知识库搭建流程啦，欢迎评论区分享你的实践和妙用！

扫描下方二维码，或点击阅读原文

免费获取1000次试用福利

限时专属福利·先到先得

关注公众号并添加舰长微信，领取智能体学习资料，并参与Coze技术直播讲解

AI I024

2025年1月10日星期五

最新扣子(coze)实战应用，10分钟保姆级搭建教程来了！

没有评论:

发表评论

开源多模态数据标注平台Tiger：大模型训练降本70%

标签