Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力

by 小互
2024年8月30日
in XiaoHu.AI日报
0 0
0
智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力
0
SHARES
445
VIEWS
Share on FacebookShare on Twitter

智谱AI发布其最新基座大模型GLM-4-Plus以及展示了类似OpenAI GPT 4o模型的视觉能力,能进行自由语音通话和视觉推理,并宣布8月30日开放!

主要更新:
  • 语言基座模型 GLM-4-Plus:在语言理解、指令遵循、长文本处理等方面性能得到全面提升,保持了国际领先水平。
  • 文生图模型 CogView-3-Plus:具备与当前最优的 MJ-V6 和 FLUX 等模型接近的性能。
  • 图像/视频理解模型 GLM-4V-Plus:具备卓越的图像理解能力,并具备基于时间感知的视频理解能力。该模型将上线开放平台( bigmodel.cn ),并成为国内首个通用视频理解模型 API 。
  • 视频生成模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源,其性能进一步增强,是当前开源视频生成模型中的最佳选择。

GLM-4-Plus在多个方面表现出了卓越的性能,在语言理解、指令遵循、长文本处理等多个方面取得了显著提升。

功能和特点:

  1. 语言理解与处理能力:
    • 增强的语言理解:GLM-4-Plus在语言理解、指令遵循、长文本处理等方面的性能得到了全面提升,能够更好地理解和处理复杂的文本任务。
    • 长文本处理:通过更精准的长短文本数据混合策略,GLM-4-Plus的长文本推理效果得到了显著提升,比肩国际先进水平。
    • GLM-4-Plus 在语言文本能力上与 GPT-4o 及 405B 参数量的 Llama3.1 相当。

  2. 模型构造与数据合成:
    • 高质量合成数据:GLM-4-Plus使用了大量模型辅助构造高质量合成数据,以提升模型性能,特别是在推理(如数学、代码算法题)表现方面,更好地反映了人类偏好。
  3. 多模态能力:
    • 图像和视频理解:GLM-4V-Plus作为GLM-4-Plus的扩展,具备卓越的图像理解能力,并新增了时间感知的视频理解能力,可以理解复杂的视频内容并进行时间推理。
    • 文生图与视频生成:配合CogView-3-Plus和CogVideoX等模型,GLM-4-Plus能够在图片编辑和视频生成等任务上展现出优越性能。

视频理解示例:

0bc3baaaoaaaxuacnowqlvtfacgda4eaabya.f10002

【视频总结能力】+【推理能力】+【多轮对话】+【时间问答能力】

  • 用户:这个穿绿色衣服的球员在整个视频都做了什么?
  • GLM-4V-Plus:在整个视频中,穿绿色衣服的球员在场上运球,然后跳起将球投入篮筐。
  • 用户:这个视频的精彩时刻是什么?发生在第几秒?
  • GLM-4V-Plus:这个视频的精彩时刻发生在第4秒,当时穿绿色衣服的球员跳起并将球投入篮筐。

智谱的清言 APP将 迎来“视频通话”功能,这也是国内首个面向 C 端开放的视频通话功能。 清言视频通话能力跨越了文本模态、音频模态和视频模态,并具备实时推理的能力。

可以进行流畅通话,即便频繁打断它也能迅速反应。只要打开摄像头,我们看到的画面,清言也可以看到,同时可以听懂指令并准确执行。

10_1724943191

视频通话功能将于8 月 30 日上线,首批面向清言部分用户开放,同时开放外部申请。

扫描下方二维码申请,抢先体验清言 app “视频通话”功能~

 在线体验:bigmodel.cn

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

Google视频和图像生成模型更新 包括Veo 2、Imagen 3和一个新工具Whisk

Google视频和图像生成模型更新 包括Veo 2、Imagen 3和一个新工具Whisk

363 VIEWS
2024年12月17日
微软开源下一代RAG技术:GraphRAG 利用知识图谱大幅增强语言模型能力

微软开源下一代RAG技术:GraphRAG 利用知识图谱大幅增强语言模型能力

1.1k VIEWS
2024年7月9日
微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI

微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI

285 VIEWS
2024年10月22日
NeuralGCM:Google开发的结合AI技术和传统大气环流模型的天气预测模拟系统

NeuralGCM:Google开发的结合AI技术和传统大气环流模型的天气预测模拟系统

136 VIEWS
2024年7月23日
从基础到实操 11 个人工智能顶级免费课程资源

从基础到实操 11 个人工智能顶级免费课程资源

348 VIEWS
2024年4月6日
Claude发布函数调用工具:Tool use 允许模型与外部系统进行交互

Claude发布函数调用工具:Tool use 允许模型与外部系统进行交互

366 VIEWS
2024年4月6日
Devin:全球首位AI软件工程师 通过了顶尖 AI 公司真实面试,并能完成真正的工作

Devin:全球首位AI软件工程师 通过了顶尖 AI 公司真实面试,并能完成真正的工作

42 VIEWS
2024年3月13日
YOLO v10:毫秒级实时的端到端目标检测开源模型

YOLO v10:毫秒级实时的端到端目标检测开源模型

690 VIEWS
2024年5月25日
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

428 VIEWS
2024年12月22日
OpenAI 推出 SearchGPT 将 AI 与实时网络信息结合 提供生成式UI结果

OpenAI 推出 SearchGPT 将 AI 与实时网络信息结合 提供生成式UI结果

143 VIEWS
2024年7月26日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版