感谢IT之家网友 USER 的智谱线索投递!
IT之家 7 月 12 日消息,开源智谱 AI 宣布,视频vitara brezza price in bangalore训练了一种新的理解视频理解模型 CogVLM2-Video,并将其开源。模型
据介绍,智谱当前大多数的开源视频理解模型使用帧平均和视频标记压缩方法,导致时间信息的视频丢失,无法准确回答与时间相关的理解问题。一些专注于时间问答数据集的模型vitara brezza price in bangalore模型过于局限于特定格式和适用领域,使得模型失去了更广泛的智谱问答能力。
▲ 官方效果演示智谱 AI 提出了一种基于视觉模型的开源自动时间定位数据构建方法,生成了 3 万条与时间相关的视频视频问答数据。基于这个新数据集和现有的理解开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,模型训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。
IT之家附相关链接:
代码:https://github.com/THUDM/CogVLM2
项目网站:https://cogvlm2-video.github.io
在线试用:http://36.103.203.44:7868/
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
顶: 731踩: 59433
【vitara brezza price in bangalore】智谱 AI 开源视频理解模型 CogVLM2
人参与 | 时间:2024-09-21 11:08:43
相关文章
- 鲁大师CEO田野:NAS免费用,AI自己养,鲁大师AiNAS为用户搭建本地大模型
- 河北沧县:传统银器制作“敲”开致富门
- HORROR美少女贞子手办欣赏:2025年3月发售
- 《熊家餐馆》第三季曝光海报 厨房新气象
- 我国成功搭建国际首个通信与智能融合的6G试验网
- iQOO Neo9S Pro+ 手机维修备件价格公布:显示屏 720 元起,主板 2390 元起
- 新款极氪 009 官宣明天发布,提供全新灰绿色车漆
- 新款极氪 009 官宣明天发布,提供全新灰绿色车漆
- IDC:苹果 Vision Pro 今年销量不超过 50 万台,平价款明年发布
- 北航本科生芯片设计团队基于龙芯龙架构的 Lain 和 EULA 处理器流片成功
评论专区