Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力

by 小互
2024年8月30日
in XiaoHu.AI日报
0 0
0
智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力
0
SHARES
445
VIEWS
Share on FacebookShare on Twitter

智谱AI发布其最新基座大模型GLM-4-Plus以及展示了类似OpenAI GPT 4o模型的视觉能力,能进行自由语音通话和视觉推理,并宣布8月30日开放!

主要更新:
  • 语言基座模型 GLM-4-Plus:在语言理解、指令遵循、长文本处理等方面性能得到全面提升,保持了国际领先水平。
  • 文生图模型 CogView-3-Plus:具备与当前最优的 MJ-V6 和 FLUX 等模型接近的性能。
  • 图像/视频理解模型 GLM-4V-Plus:具备卓越的图像理解能力,并具备基于时间感知的视频理解能力。该模型将上线开放平台( bigmodel.cn ),并成为国内首个通用视频理解模型 API 。
  • 视频生成模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源,其性能进一步增强,是当前开源视频生成模型中的最佳选择。

GLM-4-Plus在多个方面表现出了卓越的性能,在语言理解、指令遵循、长文本处理等多个方面取得了显著提升。

功能和特点:

  1. 语言理解与处理能力:
    • 增强的语言理解:GLM-4-Plus在语言理解、指令遵循、长文本处理等方面的性能得到了全面提升,能够更好地理解和处理复杂的文本任务。
    • 长文本处理:通过更精准的长短文本数据混合策略,GLM-4-Plus的长文本推理效果得到了显著提升,比肩国际先进水平。
    • GLM-4-Plus 在语言文本能力上与 GPT-4o 及 405B 参数量的 Llama3.1 相当。

  2. 模型构造与数据合成:
    • 高质量合成数据:GLM-4-Plus使用了大量模型辅助构造高质量合成数据,以提升模型性能,特别是在推理(如数学、代码算法题)表现方面,更好地反映了人类偏好。
  3. 多模态能力:
    • 图像和视频理解:GLM-4V-Plus作为GLM-4-Plus的扩展,具备卓越的图像理解能力,并新增了时间感知的视频理解能力,可以理解复杂的视频内容并进行时间推理。
    • 文生图与视频生成:配合CogView-3-Plus和CogVideoX等模型,GLM-4-Plus能够在图片编辑和视频生成等任务上展现出优越性能。

视频理解示例:

0bc3baaaoaaaxuacnowqlvtfacgda4eaabya.f10002

【视频总结能力】+【推理能力】+【多轮对话】+【时间问答能力】

  • 用户:这个穿绿色衣服的球员在整个视频都做了什么?
  • GLM-4V-Plus:在整个视频中,穿绿色衣服的球员在场上运球,然后跳起将球投入篮筐。
  • 用户:这个视频的精彩时刻是什么?发生在第几秒?
  • GLM-4V-Plus:这个视频的精彩时刻发生在第4秒,当时穿绿色衣服的球员跳起并将球投入篮筐。

智谱的清言 APP将 迎来“视频通话”功能,这也是国内首个面向 C 端开放的视频通话功能。 清言视频通话能力跨越了文本模态、音频模态和视频模态,并具备实时推理的能力。

可以进行流畅通话,即便频繁打断它也能迅速反应。只要打开摄像头,我们看到的画面,清言也可以看到,同时可以听懂指令并准确执行。

10_1724943191

视频通话功能将于8 月 30 日上线,首批面向清言部分用户开放,同时开放外部申请。

扫描下方二维码申请,抢先体验清言 app “视频通话”功能~

 在线体验:bigmodel.cn

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
482
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
336
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
448
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
614
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

T-Rex2:在无需训练的情况下精准识别视频中的目标对象

T-Rex2:在无需训练的情况下精准识别视频中的目标对象

73 VIEWS
2024年3月26日
Gatekeep:将你的问题自动生成包含动画原理的教学讲解视频

Gatekeep:将你的问题自动生成包含动画原理的教学讲解视频

133 VIEWS
2024年3月23日
Claude 推出针对开发者自动生成提示词 并测试提示效果的工具

Claude 推出针对开发者自动生成提示词 并测试提示效果的工具

678 VIEWS
2024年7月10日
DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

180 VIEWS
2024年8月29日
LoG:百万平方米大场景的3D实时视图合成

LoG:百万平方米大场景的3D实时视图合成

225 VIEWS
2024年5月1日
MeloTTS:支持中英混合发音 的多语言文本到语音(TTS)库

MeloTTS:支持中英混合发音 的多语言文本到语音(TTS)库

333 VIEWS
2024年2月27日
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

336 VIEWS
2024年12月25日
Video2Game :将现实世界的视频自动转换成逼真且可交互的游戏环境

Video2Game :将现实世界的视频自动转换成逼真且可交互的游戏环境

194 VIEWS
2024年4月24日
EchoMimic:通过音频和面部标志生成逼真的音画同步肖像视频

EchoMimic:通过音频和面部标志生成逼真的音画同步肖像视频

519 VIEWS
2024年7月11日
将Llama-3 的上下文长度从8K扩展到超过100万

将Llama-3 的上下文长度从8K扩展到超过100万

298 VIEWS
2024年5月5日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版