Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力

by 小互
2024年8月30日
in XiaoHu.AI日报
0 0
0
智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力
0
SHARES
445
VIEWS
Share on FacebookShare on Twitter

智谱AI发布其最新基座大模型GLM-4-Plus以及展示了类似OpenAI GPT 4o模型的视觉能力,能进行自由语音通话和视觉推理,并宣布8月30日开放!

主要更新:
  • 语言基座模型 GLM-4-Plus:在语言理解、指令遵循、长文本处理等方面性能得到全面提升,保持了国际领先水平。
  • 文生图模型 CogView-3-Plus:具备与当前最优的 MJ-V6 和 FLUX 等模型接近的性能。
  • 图像/视频理解模型 GLM-4V-Plus:具备卓越的图像理解能力,并具备基于时间感知的视频理解能力。该模型将上线开放平台( bigmodel.cn ),并成为国内首个通用视频理解模型 API 。
  • 视频生成模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源,其性能进一步增强,是当前开源视频生成模型中的最佳选择。

GLM-4-Plus在多个方面表现出了卓越的性能,在语言理解、指令遵循、长文本处理等多个方面取得了显著提升。

功能和特点:

  1. 语言理解与处理能力:
    • 增强的语言理解:GLM-4-Plus在语言理解、指令遵循、长文本处理等方面的性能得到了全面提升,能够更好地理解和处理复杂的文本任务。
    • 长文本处理:通过更精准的长短文本数据混合策略,GLM-4-Plus的长文本推理效果得到了显著提升,比肩国际先进水平。
    • GLM-4-Plus 在语言文本能力上与 GPT-4o 及 405B 参数量的 Llama3.1 相当。

  2. 模型构造与数据合成:
    • 高质量合成数据:GLM-4-Plus使用了大量模型辅助构造高质量合成数据,以提升模型性能,特别是在推理(如数学、代码算法题)表现方面,更好地反映了人类偏好。
  3. 多模态能力:
    • 图像和视频理解:GLM-4V-Plus作为GLM-4-Plus的扩展,具备卓越的图像理解能力,并新增了时间感知的视频理解能力,可以理解复杂的视频内容并进行时间推理。
    • 文生图与视频生成:配合CogView-3-Plus和CogVideoX等模型,GLM-4-Plus能够在图片编辑和视频生成等任务上展现出优越性能。

视频理解示例:

0bc3baaaoaaaxuacnowqlvtfacgda4eaabya.f10002

【视频总结能力】+【推理能力】+【多轮对话】+【时间问答能力】

  • 用户:这个穿绿色衣服的球员在整个视频都做了什么?
  • GLM-4V-Plus:在整个视频中,穿绿色衣服的球员在场上运球,然后跳起将球投入篮筐。
  • 用户:这个视频的精彩时刻是什么?发生在第几秒?
  • GLM-4V-Plus:这个视频的精彩时刻发生在第4秒,当时穿绿色衣服的球员跳起并将球投入篮筐。

智谱的清言 APP将 迎来“视频通话”功能,这也是国内首个面向 C 端开放的视频通话功能。 清言视频通话能力跨越了文本模态、音频模态和视频模态,并具备实时推理的能力。

可以进行流畅通话,即便频繁打断它也能迅速反应。只要打开摄像头,我们看到的画面,清言也可以看到,同时可以听懂指令并准确执行。

10_1724943191

视频通话功能将于8 月 30 日上线,首批面向清言部分用户开放,同时开放外部申请。

扫描下方二维码申请,抢先体验清言 app “视频通话”功能~

 在线体验:bigmodel.cn

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
338
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
450
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
279
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
617
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
429

Recommendeds

动画自动填色技术:可自动为动画中的线条图着色

动画自动填色技术:可自动为动画中的线条图着色

102 VIEWS
2024年4月3日
GPT-Academic:专门针对论文阅读、写作润色优化的学术GPT

GPT-Academic:专门针对论文阅读、写作润色优化的学术GPT

832 VIEWS
2024年4月20日

Prompt 学习地图 27 | 理论&实践 – Meta Prompts 用提示词设计提示词

300 VIEWS
2024年6月12日
硅基智能开源其AI数字人交互平台 可以轻松创建逼真数字人

硅基智能开源其AI数字人交互平台 可以轻松创建逼真数字人

823 VIEWS
2024年6月28日
PhysDreamer:够识别和理解3D对象的物理材质属性并生成真实物理动态

PhysDreamer:够识别和理解3D对象的物理材质属性并生成真实物理动态

123 VIEWS
2024年4月28日
对标NotebookLM Play AI推出了PlayDialog:可生成自然对话播客、旁白以及自然交互

对标NotebookLM Play AI推出了PlayDialog:可生成自然对话播客、旁白以及自然交互

434 VIEWS
2024年11月13日
StreamV2V:实时视频转换的工具 可以进行视频实时换脸和风格转换

StreamV2V:实时视频转换的工具 可以进行视频实时换脸和风格转换

608 VIEWS
2024年5月28日
教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型

教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型

288 VIEWS
2024年9月10日
LLocalSearch:完全本地运行的搜索聚合器 无需 OpenAI 或 Google API

LLocalSearch:完全本地运行的搜索聚合器 无需 OpenAI 或 Google API

187 VIEWS
2024年4月11日
DisTrO:用你的家用电脑完成的去中心化人工智能训练

DisTrO:用你的家用电脑完成的去中心化人工智能训练

119 VIEWS
2024年9月3日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版