2025年2月22日星期六

AI日报 I 字节 OmniHuman-1 内测;海螺I2V-01-Director模型开放;1X发布NEO Gamma家庭机器人

AI日报 2025-02-22

AI日报 精选每日AI新闻、AI产品、开源AI项目和使用教程,尽量只选取大家值得关心和能用的上的内容,让我们一起学习一起进步,如果您也感兴趣欢迎关注哦



字节 OmniHuman-1 在即梦内测

今天看很多大佬发布了OmniHuman-1的内测效果,感觉确实很强。
效果亮点
• 全身动作自然,除了对口型,还有简单的手势、肢体摆动
• 动态背景,背景也会有动态效果
• 支持多人互动(如AI女团表演)
• 支持侧面、仰视等非常规角度图片输入
• 可处理动漫、3D模型等风格化图片(但是估计得是拟人的,起码要有一张人脸和嘴)
• 自动识别音乐歌词并匹配口型

当时公布的时候就很心动,可惜最终确实没有开源,在这是时代字节可算是逆流了,哈哈哈~

即梦:
https://jimeng.jianying.com/ai-tool/video/generate
汗青 AITalk内测:
https://mp.weixin.qq.com/s/P9SbQmJECJhjFMicwdGP5A


海螺AI I2V-01-Director 模型全部开放

海螺AI Hailuo 的 I2V-01-Director 模型,现在对所有用户全部开放了。图生视频和文生视频都可以支持。

核心功能
• 支持左移/右移、推进/拉远、上升/下降等9种基础镜头模式
• 可自由组合镜头(如"左摇+右移"实现环绕效果)或分阶段运镜(如先左摇后右移)
• 独创自然语言镜头描述功能(例:"镜头左摇同时上摇,从小兔子移向天空")

网址:https://hailuoai.video/create



1X发布NEO Gamma:会做家务、能聊天的家庭机器人

今天,挪威的人形机器人公司 1X 推出了最新款家用机器人 Neo Gamma。这是继去年 8 月 Neo Beta 发布后的升级版本,从硬件到人工智能,再到设计美感,都有了很大提升。

 核心亮点

  1. 拟人化动作与交互 
    • 自然行走通过强化学习技术模仿人类步态,手臂摆动自然流畅,还能完成蹲下捡物、自主坐椅等高难度动作
    • 情感耳环头部两侧的呼吸灯设计,通过灯光变化传递情绪(如待机蓝光、工作中黄光),增强人机互动直观性
  2. 家务全能手 
    • 灵活操作20自由度机械手可抓取餐具、吸尘器、快递箱等物品,甚至能搬动比自身重2倍的物体
    • 场景覆盖煮咖啡、擦窗户、整理房间、递送物品等日常家务轻松应对,演示视频显示其能同步处理多项任务
  3. 智能交互升级 
    • 语音聊天内置自研大语言模型,支持自然对话(如提醒喝水、讨论家务安排),响应速度接近人类对话水平
    • 环境感知四向麦克风阵列精准识别语音指令,三扬声器系统提供360°环绕音效,可化身家庭音响
恐怖谷效应:过于拟人的坐姿和叹气动作引发部分用户不适
隐私风险:家庭环境数据采集引发安全性质疑
成本瓶颈::当前定价3万美元,距离普及仍需降本

官网网站https://www.1x.tech/neo



Fal.ai 上线谷歌 Veo 2 模型

谷歌 Veo 2 已正式上线 Fal.ai 平台,Fal.ai 是一个专注于生成音频、视频和图像的AI开发者平台,提供高性能推理引擎和灵活的开源模型API,帮助开发者快速集成AI生成能力到应用中。其特色是通过优化推理速度和可扩展性,降低多媒体生成AI模型的部署门槛。

• 自然运动和逼真的动画
• 720p 分辨率下的高视觉质量
• 24 FPS 下 5 - 8 秒的视频时长
• 支持横屏(16:9)和竖屏(9:16)两种宽高比

使用成本:5秒视频需2.5美元,每增加1秒加收0.5美元

网址:
https://fal.ai/models/fal-ai/veo2/playground



推荐一款开源的MarkDown编辑器 NeuraPress

NeuraPress 是一个现代化的 Markdown 编辑器,专注于提供优质的微信公众号排版体验。响应式设计,支持移动设备。搭配 DeepSeek和微信公众号助手使用,碎片时间也能用手机发有排版的文章了。

特性

🎨 实时预览 - 所见即所得的编辑体验
📱 移动端支持 - 支持手机上直接编辑,搭配 DeepSeek和微信公众号助手使用
🎯 微信风格 - 完美适配微信公众号样式
🔧 样式定制 - 灵活的样式配置选项
📋 一键复制 - 支持复制带格式的预览内容
🎭 模板系统 - 内置多种排版模板,一键切换
🚀 快速高效 - 基于 Next.js 构建,性能优异

没错,今天的内容排版就是用的这个~

开源地址
https://github.com/tianyaxiang/neurapress

演示网址
https://md.leti.ltd/wechat




今日封面图

提示词:Quantum computing interface theme,translucent glass date display "02-22",floating nanobots,neon grid matrix background,electric blue energy waves,sci-fi atmosphere,hyper-realistic rendering

所用Lora:未来科技透明机械
https://www.liblib.art/modelinfo/11b20fd185af49e9a0120fe9a2d7f8e7



AI日报由小刚AI探索收集整理

分享AI新闻、产品、开源工具和使用教程


没有评论:

发表评论

企业级应用开发框架开源,完全免费,可以商业化,快速定制企业的各种应用

含平台后台、管理后台、微信小程序、手机 H5、PC 端等,集成常见业务场景  源代码 https://www.gitpp.com/dpqq-ros-agent/admin-platform-saas 通用的企业级后台管理解决方案 后台管理 集成用户权限、代码生成器、表单设计、...