2025年12月23日星期二

NotebookLM 再次升级,来自谷歌的年终礼物

  见字如面,我是艾康。
点击关注👆防止迷路。







 

本文字数 2617,阅读大约需 5 分钟

就在前两天,NotebookLM 给所有 Pro 和 Ultra 用户送上了一份非常棒的年终礼物🎁。

一个全新的功能——数据表格(Data Table)

(免费版的朋友别着急,再过几周也会上线)。

img

说实话,刚看到这个功能时,我内心并没有什么波澜。

毕竟,让 AI 生成个表格,现在随便一个 AI 工具都能做到。

但当我上手体验了一整天后,我发现我错了。

这次更新的魅力,不在于「生成表格」这个动作本身,而在于它能从一堆糟、非结构化的文本里,自动提取出结构化的洞察。

而且,这不只是一个单一功能,而是一个完整的工作流:

  • • 第一部分: 根据你提供的资料,生成结构化表格。
  • • 第二部分: 将做好的表格,一键导出至 Google Sheets,无缝迁移至其他工具场景。

简单三步,快速上手

打开一个 NotebookLM 笔记本,勾选好你要分析的资料来源后:

1、启动数据表格: 在右侧 Studio 区域点击数据表格(Data Table)按钮。

你可以让它自动扫描并生成,也可以点击旁边的铅笔图标,输入提示词进行定制。

img

2、设定表格结构: 在自定义模式下,明确告诉它你想要的行(Rows)和列(Columns)是什么。

比如,要求表格包含「名称、特点、价格、评价」等维度。

img

3、选择输出语言: 这一点很加分。

就算你的原始资料是英文、法文,甚至是匈牙利语,你都可以指定用中文输出表格。

如果觉得每次生成表格都需要手动选择目标语言比较麻烦,可以将默认输出语言设置成中文。

img

点击保存即可。

img

上手门槛基本为零。

为了验证它的实用性,我分别用它跑了几个不同的案例。

案例一:内容创作者的「自我复盘」

作为一个卡拉咪博主,我最大的资产就是过去写的那些文章。

但说实话,写得多了,我自己都忘了哪些文章用了什么技巧。

于是,我把我过去自己觉得写的好的公众号文章一股脑传进了 NotebookLM。

这些文档里不仅有正文,还包含了每篇文章发布后 24 小时、72 小时、168 小时的数据表现。

然后,我让它帮我拆解这些文章的「逻辑骨架」,生成一个包含以下维度的表格:

文章名、目标受众、解决的具体痛点、文章中提到的关键矛盾、作者给出的解决方案。

img

不到一分钟,表格就生成了。

通过这个表格,我能非常直观地看到,那些数据表现好的文章,它们在「解决痛点」和「关键矛盾」这两列上,都有着非常相似的特征。

img

这种隐藏在大量文本背后的关联,如果靠我自己一篇篇去拆解、去分析,不仅耗时耗力,还很容易出现偏差。

案例二:旅行规划「决策看板」

这个场景,也是我觉得非常实用的。

最近打算去南澳岛玩几天。

大家应该都有经验,做攻略最头疼的不是没攻略,而是攻略太杂了。

微信推文、小红书笔记、Vlog 视频、官方公告……信息多到爆炸,但极其琐碎,看得人眼花缭乱。

于是,我先用 NotebookLM 的 Deep Research 功能,让它帮我全网搜了一遍关于南澳岛的资料。

img

然后,重头戏来了。

我点击「数据表格」旁边的铅笔图标,下了两个指令。

第一个指令,生成「景点横向测评表」:

请生成一个表格(出行时间十二月底),包含列:「景点名称、门票价格、最佳拍摄时间、避雷建议、所属区域」。

img

告别了在不同 App 、标签页之间来回跳转,所有景点的核心信息、优缺点、踩坑点,一目了然。

第二个指令,生成「动态行程历程表」:

请生成一个行程表格(两天一夜),包含列:「时间段、推荐活动、具体地点、交通建议(自驾/小黄车)、环境条件」。

可以看到非常清晰,虽然一次都没过去,但也大概知道了整体行程安排。

img

攻略做好后,直接一键导出到 Google Sheets。

在手机上就能随时查看,甚至可以把表格链接分享给同行的伙伴,一起协作修改。

整个过程下来,可以用「丝滑」来形容。

案例三:职场人的「人才快筛看板」

再把视角切换到职场。

假如你是一个 HR,一天之内收到了几十份不同岗位的求职简历,格式五花八门。

过去,你可能需要一份份打开,手动筛选关键信息。

现在,你可以把这些简历全部扔给 NotebookLM,然后让它帮你整理出一个清晰的「人才看板」,包含列:

帮我生成一个表格,包含候选人、工作经验、教育背景、核心技能。

img

表格生成后,同样可以一键导出到 Google Sheets,直接在团队内部流转、讨论

img
img

这才是 AI 进入工作流的样子,而不是仅仅停留在对话框里。

案例四:剧迷的「人物关系图谱」

除了这些正经用途,我也试了试好玩的。

我最近入坑了《怪奇物语》,一口气从第一季追到了第五季。

img

看着主角团们从一群稚嫩的小屁孩,一路打怪升级,成长为能独当一面的少年英雄,真是感慨万千。

但随着剧情推进,人物越来越多,关系网也越来越复杂,尤其是涉及到「逆世界」的那些设定。

于是我突发奇想,能不能用数据表格,给整部作品梳理出一部「人物关系图谱」?

结果完全可行。

img

它同样能非常清晰地列出了:每个角色的出场季、阵营、关键经历、与其他角色的关系,都整理得明明白白。

对于喜欢啃大部头小说或者追长剧的朋友,这个功能简直是梳理剧情的利器。

为什么需要「表格」而不是「对话」?

你可能会问:这些东西,我直接在聊天框里问 AI,它不是也能列出来吗?

确实可以,但效果和体验,会有不同。

数据表格功能相较于传统的 Chatbot,至少有三大优势:

1、更直观的结构化呈现

在聊天界面里,AI 生成的内容是「流式文本」。

如果你只是对比三五个项目,没什么问题。

但如果要对比十几份财报,或者跨年度的营收数据,阅读纯文本会非常低效。而数据表格能将信息整理成清晰的行与列,让复杂的对比研究变得一目了然。

2、无缝对接生产力工具(一键导出)

Chatbot 生成的表格,基本上只能停留在对话框里,需要手动复制,再粘贴至 Excel 表格中,还需要自己处理格式。

而 NotebookLM 生成的表格,可以一键导出到 Google Sheets。

并且在 Google Sheets 还可以直接进行计算、制作图表、或者进行更深入的数据分析。

3、透明的数据溯源

虽然数据表格里的引用,目前还不能像聊天界面那样直接点击跳转到原文段落,但它会在表格右侧清晰地列出来源文件的编号。

这依然为核对数据准确性提供了重要依据,也有效降低了 AI 产生「幻觉」的风险。

img

总结一下。

聊天框和数据表格并不是谁替代谁的关系。

如果你只是想快速问个答案,或者找个灵感,直接对话依然最快。

但如果你想面对几十份的文档、需要做严肃的对比研究、整理复杂的项目资料,那么建议使用NotebookLM 的数据表格功能。

它确保了信息的完整性、结构化和可处理性。

Pro 和 Ultra 用户 现在就可以直接体验了,免费用户则需要再等等。

写在最后

说实话,这次更新之后,我感觉 NotebookLM 已经进化成了一个「全能型选手」。

从最开始的文档对话,生成图片、播客,再到现在生成视频、一键生成 PPT,现在连最考验逻辑的数据表格功能也补上了。

它几乎覆盖了我们日常工作和学习中所有高频的信息处理场景。

如果你还没用过 NotebookLM,我真的强烈建议你去深度体验一下。

这绝对是目前最值得投入时间学习的 AI 工具之一。

如果你对 NotebookLM 还不太了解,可以在往期推荐里看看我之前写过的几篇文章。

 

图片

以上,就是本文全部内容,如果觉得这篇文章对你有启发,点赞、比心、分享三连就是对我最大的支持,谢谢~

往期推荐阅读
•  Obsidian 从入门到进阶合集

• AI把我推成"知名"博主后,我发现了一条产业链

• AI写作的真相:你才是那个最重要的模型

• 善用 AI,实际上对人的要求只会越来越高 

• 用 Gemini 解锁 YouTube 新用法,信息获取效率提升 10 倍

• AI 是如何变强的?Jeff Dean 斯坦福分享解读 

• 别再纠结 AI 味,内容创作应该回归第一性原理

• 微信输入法 + LazyTyper,我找到了桌面端输入的最佳方案

• 有了 NotebookLM 后,还需要 Obsidian 吗?

• 你越是会写作,就越能把 AI 用好

我试了 NotebookLM 学习法后,彻底抛弃传统学习方式

NotebookLM 的这个更新,比 Gemini 3 Flash 更让我兴奋

ICCV 2025 I 浙大&Hedra AI提出MagicID,让AI视频告别"脸崩":双路径机制实现身份与动作的完美融合。

添加微信号:AIGC_Tech,公众号小助手会拉你进群!扫描下方二维码,加入AIGC Studio知识星球!

添加微信号:AIGC_Tech,公众号小助手会拉你进群!

扫描下方二维码,加入AIGC Studio知识星球可以获得最新AI前沿应用/AIGC实践教程/大厂面试经验/算法刷题IT各学科入门到精通学习资料!学习/科研/工作/副业,强烈推荐!

图片

浙江大学与Hedra AI联合提出的 MagicID 通过双路径身份保持机制,突破性地解决了AI视频定制中"身份失真"和"动作僵硬"的核心难题。其创新点在于:1)语义解耦编码,将人脸ID特征与动作/表情特征分离,避免生成过程中的身份混淆;2)动态融合模块,通过时空注意力机制实现身份细节与目标动作的自然融合。实验显示,在保持98%身份相似度的同时,动作自然度提升40%,显著优于AnimateDiff等现有方案。该研究为个性化视频生成提供了新范式。

图片MagicID 的结果。给定少量参考图像,该方法能够生成高度逼真且个性化的视频,这些视频在保持一致的身份特征的同时,展现出自然且极具视觉吸引力的动态效果。

相关链接

  • 论文: https://arxiv.org/pdf/2503.12689
  • 项目: https://echopluto.github.io/MagicID-project

介绍

图片

MagicID:面向ID一致和动态保留视频定制的混合偏好优化

视频身份定制旨在生成高保真视频,这些视频能够保持身份一致性,并基于用户的参考图像展现显著的动态效果。然而,现有方法面临两大挑战:一是视频长度增加导致身份退化;二是训练过程中动态效果降低,这主要是由于它们依赖于传统的静态图像自重建训练。

为了解决这些问题,论文提出了 MagicID,一个旨在直接促进生成身份一致且动态丰富的视频的新框架,这些视频可根据用户偏好进行定制。具体而言,论文提出构建具有明确身份和动态奖励的成对偏好视频数据,用于偏好学习,而不是沿用传统的自重建方法。为了应对定制偏好数据的约束,论文引入了一种混合采样策略。该方法首先利用从参考图像中提取的静态视频来优先保持身份,然后使用基于 Frontier 的采样方法增强生成视频的动态运动质量。通过利用这些混合偏好优化模型使其与定制偏好对之间的奖励差异保持一致。大量实验表明,MagicID 成功实现了一致的身份识别和自然动态,在各项指标上均优于现有方法。

方法概述

图片成对偏好视频数据构建概述。

  • 步骤 1:构建一个偏好视频库,该库包含由微调后的 T2V 模型和初始 T2V 模型生成的视频,以及从参考图像中提取的静态视频。

  • 步骤 2,依次评估每个视频:基于 ID 一致性(使用 ID 编码器 )、动态度(使用光流)和提示跟随性。

  • 步骤 3:执行混合对选择,首先基于 ID 一致性差异和预定义的动态阈值选择视频对,以解决身份不一致问题,然后基于动态度和身份度选择视频对,以缓解动态度降低的影响。

实验

图片与基于调参的方法进行定性比较。可以看出,Dreambooth 和 MagicMe 都存在身份识别保真度较差的问题,而我们的方法则能保持一致的身份识别和自然的动态效果。图片与基于调优的方法进行定性比较。如图所示,ID-Animator 存在身份一致性差和视频质量低的问题。ConsisID 虽然在一定程度上提高了身份保真度,但却出现了严重的复制粘贴伪影,导致动作动态和文本对齐不自然,如最后一个头盔示例所示。相比之下,该方法在身份一致性、动作动态和文本对齐方面均表现出色,显著优于基线方法。

结论

本文提出了一种名为 MagicID 的新型框架,旨在解决身份特定视频生成中面临的重大挑战。通过引入混合定制偏好优化,该方法能够有效保持身份一致性并保留自然的运动动态,克服了传统自重建技术的局限性。

通过两阶段混合采样策略,论文构建了身份偏好和动态偏好的训练对,确保了稳健的身份学习和增强的视频动态效果。框架在生成高质量个性化视频方面表现出色,这为电影和电视行业的应用带来了巨大的潜力,为创作更逼真、更具吸引力的内容铺平了道路。

感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~

图片

NotebookLM 再次升级,来自谷歌的年终礼物

   见字如面,我是艾康。 点击关注 👆防止迷路。   本文字数 2617,阅读大约需 5 分钟 就在前两天,NotebookLM 给所有 Pro 和 Ultra 用户送上了一份非常棒的年终礼物🎁。 一个全新的功能—— 数据表格(Data Table) 。 (免费版的朋友...