Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home XiaoHu.AI日报

英伟达 ChatRTX 增加了语音图像等多种新功能并支持新的模型

by 小互
2024年5月2日
in XiaoHu.AI日报
0 0
0
0
SHARES
166
VIEWS
Share on FacebookShare on Twitter

NVIDIA的ChatRTX最新更新,首次在3月的GTC展示,增加了多种新功能并支持新的模型,进一步扩展了这款基于RTX加速的聊天机器人应用的能力。ChatRTX利用NVIDIA RTX加速的Windows PC和工作站,结合大型语言模型(LLM),让用户可以查询他们的笔记和文档,并快速生成相关回应。

主要更新内容

  • 新增模型支持:最新版本增加了对更多LLM的支持,包括Google训练的最新开放、本地LLM——Gemma。此外,ChatRTX现在也支持ChatGLM3,一个基于通用语言模型框架的开放、中英双语LLM。
  • 图像数据交互:通过支持OpenAI的对比语言图像预训练(CLIP),用户现在可以通过词语、术语和短语与本地设备上的照片和图像进行交互,无需复杂的元数据标记。意味着ChatRTX现在可以识别和理解图片内容,用户只需用文字描述图片,ChatRTX就能“看懂”图片并进行交流。
  • 语音交互功能:支持Whisper语音识别系统,这允许用户通过语音与ChatRTX进行交互。用户可以直接向ChatRTX发出语音命令或询问,系统会自动将语音转化为文字并生成相应的回应。

RTX Remix的更新

与此同时,RTX Remix也在本周推出了更新,允许模改者在NVIDIA Omniverse平台上使用AI加速工具,将经典PC游戏转变为RTX重制版。他们现在可以在其项目中使用DLSS 3.5及光线重建,仅需几次点击即可实现。这项先进的AI驱动的神经渲染器提升了光线追踪效果的保真度、响应性和质量,为NVIDIA GeForce RTX玩家带来更佳体验。

portal-with-rtx-dlss-3-5-with-ray-reconstruction-comparison-fence-scene-1080-ytshorts.savetube.me

来源:nvidia.com

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
483
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
337
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
449
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
278
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
616
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
428

Recommendeds

PixVerse 发布 V2版本视频模型 支持直接生成最长8秒的视频 著提升分辨率、细节和运动动态

PixVerse 发布 V2版本视频模型 支持直接生成最长8秒的视频 著提升分辨率、细节和运动动态

174 VIEWS
2024年7月24日
Claude 引入上下文检索技术 大幅提高RAG的性能和检索准确率

Claude 引入上下文检索技术 大幅提高RAG的性能和检索准确率

163 VIEWS
2024年9月20日
LLaVA++ : 赋予Phi-3 和 Llama-3 视觉能力

LLaVA++ : 赋予Phi-3 和 Llama-3 视觉能力

232 VIEWS
2024年4月27日
腾讯发布3D开源模型:混元-3D 10秒即可生成高分辨率细3D模型

腾讯发布3D开源模型:混元-3D 10秒即可生成高分辨率细3D模型

938 VIEWS
2024年11月5日
Generative OmniMatte:Google开发出像Photoshop一样 能将视频分解成多个图层的视频编辑技术

Generative OmniMatte:Google开发出像Photoshop一样 能将视频分解成多个图层的视频编辑技术

257 VIEWS
2024年11月27日
InternVL:GPT-4V开源替代方案 最接近 GPT-4V 表现的可商用开源模型

InternVL:GPT-4V开源替代方案 最接近 GPT-4V 表现的可商用开源模型

489 VIEWS
2024年4月29日
DiffusionGPT:由LLM驱动的文本到图像生成系统 集成多个专家图像生成模型

DiffusionGPT:由LLM驱动的文本到图像生成系统 集成多个专家图像生成模型

29 VIEWS
2024年3月6日
Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑

Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑

285 VIEWS
2024年10月23日
Jamba:首个Mamba的生产级模型 开创性的SSM – Transformer架构

Jamba:首个Mamba的生产级模型 开创性的SSM – Transformer架构

39 VIEWS
2024年3月29日
摩根大通人工智能研究部推出FlowMind 自动化金融工作流程

摩根大通人工智能研究部推出FlowMind 自动化金融工作流程

315 VIEWS
2024年4月29日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版