本集播客邀请了爱诗科技联合创始人Jaden,和我们一起聊聊对于PixVerse R1这个全新的“通用实时世界模型”的探索和思考。从2023年创立以来,爱诗一直是视频生成领域的佼佼者,而这次他们带来的这个全新的技术demo,也让我们看到了视频技术全新的演进方向。
405游局是游戏行业的几位朋友共同发起的播客,我们在这里关注游戏的设计思考,也更关注新技术对于游戏行业带来的可能性。AI和游戏的磨合由来已久,但是生成式AI发展以来,我们越发的相信及期待AI和游戏可以摩擦出更大的火花、创造更多的可能性。我们希望也能深入其中,去观察、参与、见证这一变化的发生。
我们希望在这里邀请更多游戏行业和AI应用方向的从业者,从产品、技术、工具、商业的视角一起聊聊这个话题
一周前,PixVerse R1上线,拿到邀请码体验了以后,我的感觉很像2023年第一次用到Midjourney画图的感受:新鲜、颠覆,也许不太完美,但充满了想象空间。
于是很快地,我邀请到了爱诗科技的联合创始人 Jaden,来 405 和我们聊聊他们在这个产品和这项技术上的思考。也希望这场对话能给更多在新的交互娱乐形式上探索的朋友们带来一些启发。
作为一项全新的技术、一个新物种,在生成质量上,肯定还有很大的提升空间。但是,它的实时生成,它的随时交互以及可以想象的“言出法随”的感觉,会极大的带来一种新的体验。也在这种体验之上,我们更期待未来这项技术可以落地的场景,和带来的新的娱乐交互玩法。
如果对我们聊的内容和话题感兴趣,欢迎添加微信:lingmo1314,备注405游局,加入听友群,给我们提供选题建议,和我们展开聊聊
00:55 PixVerse R1介绍:“Real-time World model”
02:22 测试用户在怎么玩R1?
相比于预设场景,更多内测用户喜欢自定义。既有“现实进入”的场景,也有虚拟场景。
文字 Prompt 的门槛依然太高。 随着实时性加强,语音和手势甚至更精确的眼动信号,才能真正释放“即时创作”的潜力。
目前有两套模型,一套是无限发散,一套是相对收敛。最终应该走向一个相对受限但有足够开放性的系统。
14:19 为什么会在这个时点选择去做实时互动的视频模型?
视频生成是“新一代摄像头”,而不是“AI 导演”。 泛用户需要的是零等待、傻瓜式、及时的反馈。
创作与消费的界限正在模糊,生成与推荐的界限也在模糊。
21:44 技术解析:Omni架构
29:30 R1的用户最开始可能是谁?
31:23 交互视频模型,会先影响或者颠覆哪些行业?
不做“替代”,做“增量”。 它会催生出一种长得既不像短视频、也不像传统游戏的新形态互动娱乐。
38:24 商业化的思考
43:36 对于World model的理解和思考
47:44 随着R1的演进路径,最想攻克的挑战?
不远的未来可以上线1080p,更快的响应速度(<1s),以及产品化
48:32 想招聘什么样的游戏行业相关的同学加入团队?
49:57 推荐美剧《黄石》,推荐游戏《王者模拟战》
评论区
共 1 条评论热门最新