2025年5月1日星期四

企业级智能助手平台开源:一个完整的智能助手、医疗、PDF、旅行规划等

一个完整的智能助手、医疗、PDF、旅行规划等源代码https://www.gitpp.com/grandpp/

一个完整的智能助手、医疗、PDF、旅行规划等
源代码
https://www.gitpp.com/grandpp/grand-ai-hub
可以私有化部署,为企业内部使用
图片
提供用户认证、通用聊天助手、医疗助手专家、出行助手和PDF文档助手等功能。

企业级智能助手通过集成AI技术,能够深度融入企业运营流程,提升效率、优化决策并创造新价值。结合您提到的Grand-AI-Hub项目功能(私有化部署、用户认证、通用聊天/医疗/出行/PDF助手),其应用场景可覆盖以下核心领域:

一、企业内部运营优化

  1. 智能客服与员工支持
    • 通用聊天助手
      :作为企业内部的"知识百科",回答员工关于制度、流程、福利等常见问题(如"如何申请差旅报销?""IT支持联系方式?"),减少HR/行政团队重复工作。
    • 跨部门协作
      :通过自然语言交互,协助员工快速获取其他部门数据(如市场部查询销售数据,财务部获取预算模板)。
  2. 文档处理自动化
    • PDF文档助手
      :自动解析合同、报告、研究论文等文件,提取关键信息(如条款摘要、数据对比),生成结构化摘要,辅助法务、财务、研发部门快速决策。
    • 合规审查
      :结合医疗、金融等行业规则,自动标注文档中的合规风险点。

二、行业垂直领域赋能

  1. 医疗健康领域
    • 为医院提供智能分诊(根据症状推荐科室)、用药咨询(药物相互作用检查)、病历分析(辅助医生快速定位关键病史)。
    • 药企可利用其分析临床试验文献,加速药物研发。
    • 医疗助手专家
    • 患者管理
      :通过聊天界面收集患者症状,生成初步诊断建议(需结合医生审核)。
  2. 金融与咨询行业
    • 数据分析与报告生成
      :整合PDF助手功能,自动分析财报、研报,生成可视化图表和摘要,辅助分析师快速输出报告。
    • 风险评估
      :结合用户认证系统,分析企业客户信用数据,提供贷款/投资风险评级。
  3. 制造业与供应链
    • 设备维护助手
      :通过PDF文档助手解析设备手册,结合传感器数据预测故障,指导现场工程师维修。
    • 物流优化
      :出行助手扩展为供应链规划工具,根据天气、交通实时调整运输路线。

三、企业安全与合规

  1. 私有化部署的隐私保护
    • 医疗、金融等数据敏感行业可通过本地部署避免数据泄露风险,满足GDPR、HIPAA等法规要求。
    • 用户认证系统支持单点登录(SSO)、角色权限管理,确保数据访问可追溯。
  2. 审计与日志分析
    • 记录所有AI交互日志,结合PDF助手分析合同条款变更历史,辅助合规审查。

四、员工效率与体验提升

  1. 个性化工作助手
    • 根据员工角色定制功能(如销售人员的客户信息查询、研发人员的专利检索)。
    • 出行助手集成企业差旅系统,自动规划行程并同步至日历。
  2. 培训与知识传承
    • 通过聊天助手模拟客户对话,辅助销售培训;将老员工经验转化为FAQ库,避免知识流失。

五、创新场景扩展

  • 多模态交互
    :结合语音识别,实现会议实时转录与摘要生成。
  • RPA集成
    :与机器人流程自动化(RPA)工具结合,自动执行AI生成的指令(如根据分析结果自动生成采购订单)。

总结:Grand-AI-Hub通过模块化设计和私有化部署,可灵活适配不同行业需求,从日常办公自动化到垂直领域深度赋能,成为企业数字化转型的"中枢神经"。其核心价值在于降低AI应用门槛(无需从头开发)、保障数据主权(私有化部署),并通过多助手协同覆盖企业全场景需求。


图片
一个完整的智能助手、医疗、PDF、旅行规划等
源代码
https://www.gitpp.com/grandpp/grand-ai-hub
可以私有化部署,为企业内部使用

招聘|量子位智库AI分析师

做最早洞察AI趋势的人~

AI 发自 凹非寺
量子位智库 | 公众号 AI123All

Hi hi hi,未来同事你好~~

量子位智库是量子位旗下的产业链接平台。

量子位以AI前沿科技新媒体被广泛认可,量子位智库则进一步聚焦于提供体系化研究输出。

量子位智库产出报告、榜单,也会组织线上和线下的沙龙,链接AI创新和关注者、供需者,促进产业交流和进步。

目前,有两大板块在招聘纳新——

  • 一、AI行业研究报告

  • 二、AI产品数据榜单

一、行业研究·AI分析师

职责描述:

  1. 聚焦AIGC,围绕垂直场景操作深度产业报告;

  2. 持续跟踪AIGC方向产学研进展,与产业专家建立联系连接;

  3. 协助到主导完成专题研讨会、闭门会、专业榜单等相关工作。

任职要求:

  1. 学习能力强,乐于沟通,能够快速学习新技术新行业;

  2. 擅长逻辑分析,快速建立认知体系;

  3. 善于学习新工具,高效完成信息检索、整理、桌面研究分析工作;

  4. 计算机、经管专业背景优先。

报告成果参考:

《中国AI大模型创业格局报告》

行业最早明确了大模型创业的「6+2」格局。

《智能驾驶年度格局报告》

已经成为了智能驾驶领域最具影响力的年度报告。

报告全文下载见文末。

二、产品数据·助理分析师

职位描述:

  1. 围绕国内AI产品收集用户数据、产品迭代、技术更新等信息,定期更新团队自研数据库及其他资料库;

  2. 通过数据处理、产品试用、交叉对比等方式,就用户数据、产品迭代、行业趋势等进行分析,辅助月度数据榜单及其他AI产品相关内容的撰写发布;

  3. 关注筛选全球AI领域的高价值内容,捕捉市场热点,策划并执行相关内容的编译。

任职要求:

  1. 对AIGC/科技/产品领域抱有热情,有技术相关学业/就业背景者优先;

  2. 能够高效完成信息检索、内容理解等工作,具有钻研精神和数据敏感性,有咨询/分析/研究经验者优先;

  3. 有一定的文字功底和翻译水平,表达流畅,逻辑清晰;

  4. 重点大学本科及以上学历。

榜单图谱参考:

图片

更多关于量子位智库研究成果,可前往主页:

https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f?fromScene=spaceOverview

以上岗位同样欢迎实习投递,我们是年轻人组成的团队,岗位均可转正

工作地点:北京中关村。

简历请发至:zhaopin@qbitai.com

邮件主题注明: 姓名+应聘分析师。

—  —

评选报名2025年值得关注的AIGC企业&产品

下一个AI"国产之光"将会是谁?

本次评选结果将于4月中国AIGC产业峰会上公布,欢迎参与!

图片


一键关注 👇 点亮星标

科技前沿进展每日见



一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

一口气证明49道普特南测试题,R1只答对一道

梦晨 西风 发自 凹非寺
量子位 | 公众号 QbitAI

DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。

在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道

目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover

而未针对定理证明优化的DeepSeek-R1只做出1道

让还没发布的R2更令人期待了。

图片

除测评结果之外,论文中特别报告了"通过强化学习发现新技能"现象。

正如R1带来了"啊哈时刻",Prover-V2也有令人意想不到的能力。

图片

具体来说,在普特南测试中,参数量较小的DeepSeek-Prover-V2-7B用非CoT生成模式成功解决了13个671B模型未能解决的问题。

团队仔细检查该模型的输出后发现,其推理方法存在一个独特模式:7B模型处理涉及有限基数的问题时,经常使用Cardinal.toNatCardinal.natCast_inj,而671B模型生成的输出中明显没有这些内容。

要注意,7B模型是在DeepSeek-Prover-V1.5-Base模型基础上,先使用671B模型在强化学习阶段收集的数据微调,再执行强化学习得来的。

也就是说,7B模型学会了671B模型没有学会的新技能。

图片

那么,DeepSeeK-Prover-V2如何炼成的呢?与前代相比又有哪些改进?

形式化和非形式化数学证明统一模型

DeepSeek数学定理证明DeepSeek-Prover系列模型已推出3款:

  • 2024年3月的DeepSeek-Prover(后简称为Prover-V1)
  • 2024年8月的DeepSeek-Prover-V1.5(后简称为Prover-V1.5)
  • 2025年5月的DeepSeek-Prover-V2(后简称为Prover-V2)

Prover-V1主要探索了通过大规模合成数据集微调DeepSeek-Math-7B,来推进定理证明。

Prover-V1.5在此基础上增加了证明助手反馈的强化学习(RLPAF)和蒙特卡洛树搜索方法。

Prover-V2进一步提出"子目标分解的强化学习",并且基础模型从DeepSeek-Math-7B升级到DeepSeek-V3。

整合DeepSeek-V3的高上下文窗口和强大的自然语言推理能力,把形式化和非形式化数学证明统一到一个模型中。

Prover-V2还继承了Prover-V1.5提出的CoT和非CoT生成两种模式。

图片

接下来,详细介绍Prover-V2的各主要环节。

通过递归证明搜索合成冷启动推理数据

利用DeepSeek-V3作为子目标分解和形式化的统一工具构建冷启动数据集,提示DeepSeek-V3将定理分解为高级证明草图,同时在Lean 4中将这些证明步骤形式化,从而产生一系列子目标。

使用一个较小的70亿参数模型来处理每个子目标的证明搜索,从而减轻相关的计算负担。一旦一个具有挑战性的问题的分解步骤得到解决,就将完整的逐步形式化证明与来自DeepSeek-V3的相应思维链进行配对,以创建冷启动推理数据。

图片

使用合成冷启动数据进行子目标分解的强化学习

团队精心挑选了一组具有挑战性的问题,这些问题无法由70亿参数量的证明器模型以端到端的方式解决,但所有分解后的子目标都已成功解决。

通过组合所有子目标的证明,为原始问题构建了一个完整的形式化证明。

然后,将此证明附加到DeepSeek-V3的思维链中,该思维链概述了相应的引理分解,从而实现了非形式化推理与后续形式化的有机结合。

在合成冷启动数据上对证明器模型进行微调后进行强化学习阶段,进一步增强其将非正式推理与形式化证明构建相衔接的能力。遵循推理模型的标准训练目标,使用二元的正确或错误反馈作为奖励监督的主要形式。

图片

具体训练细节

两阶段训练:

DeepSeek-Prover-V2分两阶段建立互补证明生成模式。

第一阶段用高效非思维链(non-CoT)模式,聚焦快速生成Lean证明代码,加快迭代和数据收集。

第二阶段基于第一阶段成果,采用高精度思维链(CoT)模式,阐述中间推理步骤,用冷启动思维链数据强化学习,提升复杂问题推理能力。

专家迭代:

其中非CoT模式训练遵循专家迭代范式,用最佳证明策略为难题生成证明尝试,经Lean验证,成功的纳入监督微调(SFT)数据集。与之前版本相比,训练问题分布有调整,引入了额外问题和子目标分解生成的问题。

监督微调:

对DeepSeek-V3-Base-671B做监督微调,训练语料库包含两个互补来源的数据:

一是通过专家迭代收集的非CoT数据,这些数据生成的Lean代码不包含中间推理步骤,主要用于强化模型在 Lean 定理证明生态系统中的形式验证技能。

二是冷启动CoT数据,这些数据将DeepSeek-V3的先进数学推理过程提炼为结构化的证明路径,明确地模拟了将数学直觉转化为形式证明结构的认知过程。

强化学习:

采用GRPO算法,与传统的PPO不同,GRPO无需单独的裁判模型,它通过为每个定理提示采样一组候选证明,并根据它们的相对奖励来优化策略。

训练过程中使用二元奖励机制,即生成的Lean证明若被验证正确则获得奖励1,否则为0。

为确保学习效果,精心挑选训练提示,仅包含那些有足够挑战性但又能被监督微调后的模型解决的问题。

蒸馏DeepSeek-Prover-V2 7B

将DeepSeek-Prover-V1.5-Base-7B上下文窗口扩展到32768个token,用DeepSeek-Prover-V2-671B数据微调,融入非CoT证明数据,以便利用小模型生成简洁的形式化输出,提供一种经济高效的证明选项。

此外,对DeepSeek-Prover-V2-7B执行与671B模型训练中相同的强化学习阶段,以进一步提升其性能。

由此得到的模型Prover-V2 671B在神经定理证明方面达到了最先进的性能,在miniF2F测试中的通过率达到 88.9%,并解决了普特南测试中的49道。Prover-V2为miniF2F数据集生成的证明可单独下载。

图片

ProverBench:AIME和教科书问题的形式化

与Prover-V2一起推出ProverBench,这是一个包含325个问题的基准数据集。其中,有15个问题是从近期美国数学邀请赛(AIME 24和25)的数论与代数题目中形式化而来,提供了真实的高中竞赛水平挑战。其余310个问题则取自精心挑选的教科书示例和教学教程,构成了一套多样化且基于教学需求的形式化数学问题集合。该基准旨在能够对高中竞赛问题和本科阶段数学问题进行更全面的评估。

图片

DeepSeek-Prover-V2系列在三个数据集上评测的最后总成绩如下:

图片

DeepSeek全明星阵容

Prover-V2的作者共18人,共同一作Z.Z. Ren, 邵智宏、辛华剑都是参与过V3、R1以及Prover系列前作的主力成员。

图片

作者名单中出现了几位未参与前两代版本(Prover-V1、Prover-V1.5)的研究者。

比如Shirong Ma,清华本硕。公开资料显示,他于去年毕业后即加入DeepSeek,现为DeepSeek研究员,此前参与了从DeepSeek LLM v1到R1以及DeepSeek-Coder等工作。

图片

还有Zhe Fu、Yuxuan Liu

虽然他们都没出现在Prover-V1、Prover-V1.5的作者名单中,但均为DeepSeek资深成员。

在Prover-V1/V1.5同一期发布的《Fire-Flyer AI-HPC》研究中可见其署名。

图片

该研究提出的Fire-Flyer AI-HPC架构,通过软硬件协同设计降低训练成本,解决传统超算架构在AI训练需求上的不足。

不过这次Prover-V2的论文中并未提及在训练或推理基础设施具体有哪些优化策略。

最后还有一位新面孔Hongxuan Tang,暂未了解到具体信息。

Prover-V2发布后迅速引发社区关注,GitHub仓库12小时内即获得350+星标。

图片

在X(原Twitter)、抱抱脸等平台,网友们展开热烈讨论。

Prover-V2核心贡献者邵智宏在个人账号主动推介研究成果。

图片

X工程师@kache特别赞赏道:

感谢你们对开放科学研究的奉献。

图片

普林斯顿大学助理教授Chi Jin表示:

恭喜这项惊人的工作!在miniF2F上攻克最后10%-20%的问题标志着能力上的重大飞跃。当前形式化数学领域的竞争态势堪称激烈,难以置信Kimina仅保持了两周SOTA就被DeepSeek超越。

图片

就连Kimina-Prover核心贡献者@Marco Dos Santos都来送上了祝贺:

祝贺DeepSeek AI团队将miniF2F任务的SOTA提升到了89%!

很高兴看到长思维链方法正在被其他团队独立探索且呈现出一些有趣的差异。形式数学如今比以往任何时候都更受欢迎!

图片

另外,网友们最关注的问题仍然是:R2什么时候发布啊~

图片
图片

论文:
https://github.com/deepseek-ai/DeepSeek-Prover-V2/blob/main/DeepSeek_Prover_V2.pdf
模型:
https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B

DeepSeek-Prover
https://arxiv.org/abs/2405.14333
DeepSeek-Prover-V1.5
https://arxiv.org/abs/2408.08152

参考链接:
[1]https://trishullab.github.io/PutnamBench/leaderboard.html
[2]https://x.com/zhs05232838/status/1917600755936018715

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🌟 点亮星标 🌟

科技前沿进展每日见

企业级智能助手平台开源:一个完整的智能助手、医疗、PDF、旅行规划等

一个完整的智能助手、医疗、PDF、旅行规划等源代码https://www.gitpp.com/grandpp/ 一个完整的智能助手、医疗、PDF、旅行规划等 源代码 https://www.gitpp.com/grandpp/grand-ai-hub 可以私有化部署,为企业内...