通过GPT-4和DELL-3的结合,使用ChatGPT模拟庞贝古城火山爆发时的历史情景,并展示了多模态人工智能的强大功能。
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
对标记的依赖性:尽管DeWave方法在文中声称可以在没有标记(如眼动追踪)的情况下实现脑电波到文本的翻译,但它仍然依赖于基于标记的对齐过程。
过去一年,不少服装品牌先后尝试过Live Show式直播,他们有的在摄影棚,有的在石洞中,Zara直播更像是对这种潮流的极致呈现。这可能也代表了品牌的某种集体潜意识:直播不仅仅可以为销量服务,还可以在品牌价值塑造上有所作为。
并且,对于容易发生大地震的地区,间隔可能长达数百年,不确定性如此之大,这种预测方法基本是不靠谱的。