华人团队、估值过亿、OpenAI联创参投,视频AI生成工具Pika1.0一诞生就叠满Buff,短短几天火爆全网,社区用户超55万,被网友评价为目前最好的视频生成工具,俨然成了同类公司Runway创建的Gen-2的最强竞品。
Pika1.0 背后的公司Pika Labs成立于今年4月,主打"让每个人都成为创意视频导演和制作人"。目前,Pika 1.0能制作 3D动画、动漫或电影等各种类型的视频,还支持画布延展、局部修改、视频时长拓展等编辑功能。网友实测,相比Gen-2,Pika1.0在生成电影镜头方面更胜一筹。
短短几个月,Pika Labs 就已获得5500万美元的融资,估值超2亿美元,该公司的投资人列表中净是人工智能领域的熟脸,包括OpenAI的联合创始人Andrej Karpathy、Hugging Face 联合创始人兼CEO的Clem Delangue。
更值得一提的是,Pika Labs是一个仅4人的华人团队,创始人郭文景、联合创始人兼CTO Chenlin Meng曾是斯坦福大学AI Lab博士生;第三位创始人Karlin Chen 拥有 CMU 的 ML&CV 硕士学位,曾在商汤担任工程师;4号员工Matan Cohen Grumi 是创意总监,他还是一位电视广告导演。
有趣的是创始人郭文景和团队创建Pika1.0 的原因:Gen-2不好用。
Pika1.0擅长做电影
在文本生成视频、图像生成视频的常规AIGC功能外,Pika 1.0不仅能让视频风格实现转换外,还可以直接完成内容编辑、更改画幅等动作。这些功能让 Pika 1.0 将AI对视频的作用力真正从”生成“转向了”制作“。
Pika官方的演示视频显示,输入一段文字,给出人物、场景、风格等需求,这个工具就生成你需要的视频画面。例如,输出“马斯克穿着太空服,3D动画”,一个动画版本的马斯克宇航员就出现了,背后还有已经发射成果的火箭,人物外形、动作、背景等元素都十分生动。
除了文字生成视频,Pika 1.0也支持图片生成视频,输入图片与提示词,图片画面将在你的文字描述中动起来。
如果你想给原有视频换个风格,尽管在文本框里输入风格提示,二次元、像素风都能搞定,将所有风格的视频简单融合,一个”瞬息全宇宙风”的视频就成了。
Pika 1.0还能够进行视频编辑:选定编辑区域输入提示词,它就能根据文本提示词修改特定区域。比如,用鼠标框一下模特的衣服,就能更换衣服的款式和颜色,甚至给大猩猩一键戴上墨镜。
此外,Pika 1.0还能够修改轻松修改视频尺寸,这个技术已经AI生图工具Midjourney 上实现了,Pika第一个将这一功能用在了视频制作上。
有网友拿"生成同一婚礼现场"对比Gen2 与Pika1.0,结论是 Pika1.0更擅长运用电影镜头来提升视频的丰富度,而Gen-2虽然生成的视频质感更好,但在人物行走的处理上出现了明显瑕疵。
Hugging Face 的CEO在看完Pika宣传片后感叹:“2024年,某个主流媒体领域将会充斥AI生成的内容。”
目前,Pika1.0支持用户免费使用,但需要申请名额,有网友形象的形容了Pika1.0当前的火爆情况:
总而言之,支持免费试用的Pika1.0 现在正处于使用名额难求的爆火状态。
55万用户每周产出百万视频
尽管Pika1.0更擅长做电影,但它并不是为专业电影制作而生。“我们开发的不是电影制作工具,而是为日常消费者打造的产品。”Pika CEO 郭文景解释,“虽然我们有创作力,但并不是专业人士,如果有Pika 这样的工具,那我们在AI电影节上,很可能会大放异彩。”
郭文景与AI电影节的故事可以追溯到去年冬天。当时,估值已达5亿美元的初创公司Runway 举办了首届AI电影节,奖金高达10,000美元。郭文景和同几位斯坦福的同学打算利用寒假时间,用生成式AI 制作一部电影,而且对获奖很有信心。
但由于团队并非电影专业出身,即使有Runway 的AIGC工具Gen-2,他们做出来的视频效果也并不理想,最终错失大奖,这让郭文景很沮丧。
遗憾正是Pika诞生的契机:既然工具不趁手,那就自己造一个。今年4月,郭文景和她的同学Chenlin Meng从斯坦福辍学,创办Pika,
郭文景(左)和 Chenlin Meng
两位“铁娘子”说干就干,火速投入到事业中,3个月后,Pika 推出了 Discord 服务器,与Midjorney的使用方式类似,需要用户在服务器的聊天框中输入文本或者图像来生成简短视频,并与社区内的其他人共享。
很快,Discord 上聚集了上万名Pika1.0的用户,如今,这里已经有55万人,而且还在快速增长,每周产生数百万个新视频。
这家只有4人的初创公司也迅速完成了三轮融资,共计 5500 万美元。前两轮由 GitHub的前任CEO Nat Friedman 领投,最近一轮3500 万美元的 A 轮融资来自 Lightspeed Venture Partners。据福布斯报道,目前,Pika Labs的估值在2亿到3亿美元之间。
Pika投资人占据了硅谷AI领域的半壁江山,其中有OpenAI的联合创始人Andrej Karpathy、董事会成员Adam D'Angelo,Hugging Face 联合创始人兼CEO Clem Delangue,Perplexity CEO Aravind Srinivas等。
Lightspeed的合伙人 Michael Mignano 在今年9月投资了Pika,他曾对这个小团队给予高度评价:“对于初创公司来说,最大的优势是速度,这个团队的效率是我所见过的最快的。”
GitHub前任 CEO Nat Friedman 作为投资者之一,也感叹过Pika的高效。据称,Friedman在某一天的下午建议他们增加一个将文本嵌入视频的功能,结果凌晨3点钟,他就被告知,这个功能已经开发完成。
目前,Pika尚未公布太多关于底层模型运作的技术细节,但Pika的效率和产品已经足够让风投们兴奋。而站在聚光灯下的Pika,接下来仍要面对更多竞争。
就在上周,Runway也推出了新功能motion slider(动态笔刷),在图片上一抹就能变成动态视频。而Runway 除了面向消费者外,还与电影制作公司展开了合作。
此外,最受大众欢迎的文生图工具Midjourney也正在开发视频功能。
Stability.ai已经发布了他们的Stable Video Diffusion视频模型,允许用户调整各种参数,如迭代步数、重绘幅度等,以帮助创作者控制画面生成的过程,包括风格、姿势、线条等特征。SD还支持物体的3D合成。
视频类AIGC赛道大有百花齐放之势,工具多了,就看创意够不够用。
编辑:选定编辑区域输入提示词,它就能根据文本提示词修改特定区域。比如,用鼠标框一下模特的衣服,就能更换衣服 来源:加密钱包代币