Menu

  • Home
  • Trending
  • Recommended
  • Latest

分类目录

  • AI 工具
  • AI新势力
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
XiaoHu.AI学院
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
No Result
View All Result
  • Login
XiaoHu.AI学院
No Result
View All Result
Home 开源项目案例库 AI 项目

PIXART-Σ:利用Diffusion Transformer(DiT)直接生成4K分辨率图像

by 小互
2024年3月11日
in AI 项目
0 0
0
PIXART-Σ:利用Diffusion Transformer(DiT)直接生成4K分辨率图像
0
SHARES
25
VIEWS
Share on FacebookShare on Twitter

PIXART-Σ是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员共同开发的一个基于Diffusion Transformer(DiT)的图像生成模型。

模型采用了一种独特的训练方法——从弱到强的训练方式——能够根据文本描述生成高质量的4K分辨率图像。这意味着,给定一段文字描述,PixArt-Σ能够创造出与描述相匹配的、非常高清晰度的图像。这对于需要高分辨率图像的领域,比如电影制作和游戏开发,是一个巨大的进步。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

Login if you have purchased

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员

Related Posts

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)  让模型更像人类思考
XiaoHu.AI日报

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM) 让模型更像人类思考

2024年12月25日
485
阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型
XiaoHu.AI日报

阿里巴巴推出QVQ-72B 一个基于Qwen2-VL-72B的新型多模态推理模型

2024年12月25日
341
Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本
AI 工具

Fireworks AI新功能 能够将图像或PDF等非文本内容转化为LLM可理解的结构化文本

2024年12月24日
454
Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音
XiaoHu.AI日报

Hume AI推出全能文本与语音引擎 OCTAVE 根据文本实时生成特定人格特质的声音

2024年12月24日
280
Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型
AI 论文

Anthropic 公布了一种全新的 AI 越狱技术 可以轻松破解所有前沿模型

2024年12月23日
621
INFP:基于音频驱动的双人对话中的互动头像生成  能自动区分谁在说话,谁在听
AI 项目

INFP:基于音频驱动的双人对话中的互动头像生成 能自动区分谁在说话,谁在听

2024年12月22日
431

Recommendeds

Emo 机器人:能够几乎实时模仿包括微笑在内的各种人类面部表情

Emo 机器人:能够几乎实时模仿包括微笑在内的各种人类面部表情

166 VIEWS
2024年3月30日
特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士)

特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士)

306 VIEWS
2024年10月11日
Hedra:上传人物照片+任意语音 可实现人物唱歌、说话

Hedra:上传人物照片+任意语音 可实现人物唱歌、说话

2.7k VIEWS
2024年6月19日
OpenAI音乐生成模型Jukebox曝光 效果惊艳

OpenAI音乐生成模型Jukebox曝光 效果惊艳

105 VIEWS
2024年5月18日
PhotoMaker:利用多个输入图片创建人物ID表示 来生成一致性人物图像

PhotoMaker:利用多个输入图片创建人物ID表示 来生成一致性人物图像

331 VIEWS
2024年7月23日
Meta AI 推出新一代SAM 2 可实时在图像或视频中识别出特定对象并进行跟踪

Meta AI 推出新一代SAM 2 可实时在图像或视频中识别出特定对象并进行跟踪

510 VIEWS
2024年7月30日
SaulLM-7B:一款专为法律领域定制的大语言模型

SaulLM-7B:一款专为法律领域定制的大语言模型

66 VIEWS
2024年3月7日
通过在职位描述中设置隐藏提示来识别由 GPT 编写的求职申请

通过在职位描述中设置隐藏提示来识别由 GPT 编写的求职申请

120 VIEWS
2024年7月28日
ViPer:为Stable Diffusion 提供个性化图像生成方法 记住你的艺术喜好

ViPer:为Stable Diffusion 提供个性化图像生成方法 记住你的艺术喜好

172 VIEWS
2024年7月29日
SuperAnimal:能够自动检测和分析动物的运动行为的模型

SuperAnimal:能够自动检测和分析动物的运动行为的模型

148 VIEWS
2024年7月1日

Copyright (c) 2024 by Xiaohu.AI.

  • About
  • Contact

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Home
  • AI 工具
  • XiaoHu.AI 学院
    • AI 教程
    • AI 课程
  • XiaoHu.AI日报
  • 开源项目案例库
    • AI 论文
    • AI 资源
    • AI 项目
  • 加入会员
  • →社群
  • Login

© 2024 Xiaohu.AI

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
转到手机版