Midtravel是一款生成图像的工具,可能最出名的是在Discord服务器内运行,它正在展开人工智能的翅膀。Midtravel的创作者周二宣布,他们计划在未来几个月内推出“文本转视频”模式。
该公司首席执行官David Holz在“办公时间”Discord会议上表示,该公司将从1月份开始培训其视频模特。这一举措代表着该平台的自然发展,建立在成熟的图像模型之上,以激发生成视频行业的竞争动力。
Discord会议记录包括计划对V6 Niji(Midtravel的漫画/动漫生成器模型)进行的调整,以及对即将正式发布的Midtravel V6的一致性修复。该公司还写道,其待办事项清单要求“开始新视频模型的培训”,这可能在“几个月内”准备就绪
Holz或Midtravel团队都没有分享关于该模型的进一步信息。
Midtravel以强调质量和用户体验而非原始速度而闻名,即使这意味着落后于竞争对手。在Stable Diffusion等其他平台上实现这些功能数月后,该公司推出了修复和外涂等增强功能。在Dall-E 3、SDXL等其他型号,甚至Ideogram或IF等不太受欢迎的生成器中,该功能已成为一种通用功能,之后该公司最近进军基本文本生成。
进入拥挤的场地
此次进军视频领域也是在竞争发布之后。Stability AI最近宣布了Stable Video Diffusion;Meta刚刚展示了其EMU视频生成器,Pika和Runway ML等现有车型正在开拓自己的领域,使Midtravel进入了一个强大的竞争格局。此外,Leonardo AI等其他图像生成器已经实现了视频生成功能,进一步加剧了竞争。
Midtravel最近的v6更新,拥有改进的即时跟随和更逼真的图像,是该公司为保持相关性和竞争力所做的最新努力。如果它的模型表现出一定的凝聚力,它们可能会在这样一个新生的领域获得坚实的基础——即使模型还远远不够完美。
这些事态发展的影响远远超出了企业争夺霸权的范围。随着Midtravel和其他公司的产品创新和完善,创意和媒体行业正处于变革时代的边缘。通过人工智能生成、操纵视频内容并与之互动的能力开辟了许多可能性——从让艺人和广告商更容易,到可能重塑我们对现实的感知。
由Ryan Ozawa编辑。
编辑:web3528btc 来源:加密钱包代币