01
数据分析 Agent
这个叫 DeepAnalyze 的 GitHub 开源项目是清华和人大联合开发的数据分析 Agent。
开源 2 周,现在 1000 多 Star。
给它一堆原始数据,它能完成从数据准备、分析、可视化、建模、写报告全流程。
可以先看看实操视频:
可以看到无需人工指导,能自我规划并执行完成,对于非专业数据分析人员比较实用,也可以做为专业数据分析师的辅助使用。
开源地址:https://github.com/ruc-datalab/DeepAnalyze支持数据库、CSV、Excel 等结构化数据,也支持 JSON、XML、YAML 等半结构化数据,还可以是 TXT、Markdown 文档等非结构化数据
它可以完成开放式任务,比如说「研究这些数据,找出一些有价值的洞见」,它就会去数据清洗、分析、建模、可视化,最终输出一份专业研究报告。
让数据分析像聊天一样简单。
DeepAnalyze 的模型、代码、训练数据全部开源,你可以自己部署或开发你自己的数据分析助手。
如何使用
克隆此仓库并下载 DeepAnalyze-8B:
git clone https://github.com/ruc-datalab/DeepAnalyze.git下载:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
然后运行下面这些脚本启动 API 和界面,然后能用了。
cd demo/chatnpm installcd ..bash start.sh
02
一键把文档/代码转成 Claude Skills
Claude 前段时间推出了 Agent Skills 。
这是一种模块化能力扩展机制,本质是包含 SKILL.md 文件的文件夹,这个 md 文件可以写专业知识、指令操作和代码脚本。
Claude 处理任务的时候可以动态加载相关 skill,有点像 AI 可调用的静态工具或知识库。
而要介绍的 Skill Seeker 开源项目就很实用了,开源两周就 3K 星了。
它可以自动把文档网站、GitHub 仓库、PDF 转换等成 Claude AI Skills,全程无需手动操作,将智能抓取的信息有机整合,最后整理成 Claude 能直接导入的 .zip 技能包。
开发者写了一篇从 0 部署这个开源项目的文章,挺详细的,感兴趣的可以去看看。
新手教程:https://github.com/yusufkaraaslan/Skill_Seekers/blob/development/BULLETPROOF_QUICKSTART.md03
谷歌开源的时间序列预测模型
这个叫 TimesFM 的开源项目是 Google Research 发布的。
专为时间序列预测开发的预训练基础模型,它是基于一个 1000 亿个真实世界时间点的大型时间序列语料库训练出来的。
算是一个基座模型。
别被这么高大上的名词唬住哦。
简单说,时间序列预测模型就是能根据过去的时间数据,推测未来的趋势。
比如你是开网店的,有过去 100 天的销量数据,丢进 TimesFM 能直接预测未来 12 天的销量,还能知道销量的波动范围。
因为 TimesFM 作为预训练模型,已经提前学会了大量时间序列的规律,不用你从零训练,直接开箱即用。
因为是基座模型,有 2 亿参数,你可以直接把你手上不同时间节点的数据丢进去让它预测,也可以基于它进行微调。
开源地址:https://github.com/google-research/timesfm04
点击下方卡片,关注逛逛 GitHub
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:
没有评论:
发表评论