2025年11月3日星期一

3 个近期 yyds 的 AI 开源项目, 有点绝。

01

数据分析 Agent

这个叫 DeepAnalyze 的 GitHub 开源项目是清华和人大联合开发的数据分析 Agent。

开源 2 周,现在 1000 多 Star。

给它一堆原始数据,它能完成从数据准备、分析、可视化、建模、写报告全流程。

图片

可以先看看实操视频:

可以看到无需人工指导,能自我规划并执行完成,对于非专业数据分析人员比较实用,也可以做为专业数据分析师的辅助使用。

开源地址:https://github.com/ruc-datalab/DeepAnalyze

支持数据库、CSV、Excel 等结构化数据,也支持 JSON、XML、YAML 等半结构化数据,还可以是 TXT、Markdown 文档等非结构化数据

它可以完成开放式任务,比如说「研究这些数据,找出一些有价值的洞见」,它就会去数据清洗、分析、建模、可视化,最终输出一份专业研究报告。

让数据分析像聊天一样简单。

图片

DeepAnalyze 的模型、代码、训练数据全部开源,你可以自己部署或开发你自己的数据分析助手。

如何使用

克隆此仓库并下载 DeepAnalyze-8B:

git clone https://github.com/ruc-datalab/DeepAnalyze.git下载:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B

然后运行下面这些脚本启动 API 和界面,然后能用了。

cd demo/chatnpm installcd ..bash start.sh

02

一键把文档/代码转成 Claude Skills

Claude 前段时间推出了 Agent Skills 。

这是一种模块化能力扩展机制,本质是包含 SKILL.md 文件的文件夹,这个 md 文件可以写专业知识、指令操作和代码脚本。

Claude 处理任务的时候可以动态加载相关 skill,有点像 AI 可调用的静态工具或知识库。

图片

而要介绍的 Skill Seeker 开源项目就很实用了,开源两周就 3K 星了。

可以自动把文档网站、GitHub 仓库、PDF 转换等成 Claude AI Skills,全程无需手动操作,将智能抓取的信息有机整合,最后整理成 Claude 能直接导入的 .zip  技能包。

开发者写了一篇从 0 部署这个开源项目的文章,挺详细的,感兴趣的可以去看看。

图片
新手教程:https://github.com/yusufkaraaslan/Skill_Seekers/blob/development/BULLETPROOF_QUICKSTART.md

03

谷歌开源的时间序列预测模型

这个叫 TimesFM 的开源项目是 Google Research 发布的。

专为时间序列预测开发的预训练基础模型,它是基于一个 1000 亿个真实世界时间点的大型时间序列语料库训练出来的。

算是一个基座模型。

图片

别被这么高大上的名词唬住哦。

简单说,时间序列预测模型就是根据过去的时间数据,推测未来的趋势。

比如你是开网店的,有过去 100 天的销量数据,丢进 TimesFM 能直接预测未来 12 天的销量,还能知道销量的波动范围。

因为 TimesFM 作为预训练模型,已经提前学会了大量时间序列的规律,不用你从零训练,直接开箱即用。

因为是基座模型,有 2 亿参数,你可以直接把你手上不同时间节点的数据丢进去让它预测,也可以基于它进行微调。

图片
开源地址:https://github.com/google-research/timesfm

04

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

没有评论:

发表评论

从0到1训练自己的AI女友 极简Lora数据集生成和训练教程

很多同学可能想训练一个属于自己的Lora,但是苦于没有自己的数据集,也担心训练太复杂学不会,今天为大家提供一个完全在线的Lora训练极简教程 很多同学可能想训练一个属于自己的Lora,但是苦于没有自己的数据集,也担心训练太复杂学不会,今天为大家提供一个完全在线的Lora训练极...