许多实验室和公司正在开发类似的技术,将文本转化为图像。谷歌有Imagen,OpenAI有DALL-E,还有一些较小的项目,如Craiyon。这种技术从何而来,你觉得它未来会走向何处?Midjourney的愿景与这个领域的其他人有什么不同?
去年秋天,山姆·阿尔特曼与Open AI创始人之一、领英联合创始人雷德・霍夫曼(Reid Hoffman)展开了一场精彩对话。其中,山姆·阿尔特曼分享了他对于未来AI发展的预测:AI大模型技术,将成为继移动互联网之后,未来最大的技术平台;而以聊天机器人为界面,加上图像、音乐、文本等多模态模型的发展,将诞生大型企业。
将神经网络与人脑类比是值得商榷的。诚然,神经网络的起源受到了人脑的启发,但如今通过训练得到的人工智能的优化过程和人脑的优化过程有很大区别。人脑通过长时间的多智能体的自博弈(self-play)过程不断演化,大脑中的预测模型对于人类的存活和繁衍至关重要。而神经网络的优化实际上是对于大量数据的压缩。
罗恩:我的问题一直是,如果我们拥有自动驾驶,我们拥有自动驾驶的卡车,想法之一是不是可以用我们自己的卡车运送车辆。如果没有足够的司机,我们还可以开展自动驾驶运输。埃隆:如果你就在这个地区,我们会让汽车直接开到你身边。
我认为游戏是一种独特的媒介,作为玩家并不仅仅是被动地消费娱乐,实际上,你是作为一个代表积极参与的。所以我认为这就是游戏在某些方面比其他媒介,例如电影和书籍等更有内涵的原因。从一开始我们就对AI进行了深入的思考,将游戏作为证明和开放AI算法的试验场。
为什么就不是人形的?因为人本身很多任务也干不了。像清洗通风管道,需要蛇形机器人在管道里爬。人在完成很多任务的时候也需要借助工具......当所有人做我们想做的事,必然世界上有必须做、大家不愿意做的。比如居家生活两口子谁做饭、谁洗碗。机器人就是我们可以欺负欺负的另一个物种。
过去的制造业的技术投入是在设备上的投入,流水线上的投入;现在是在数字化流程的改造、数字技术和人才的投入,是在产品的数字化改造上进行投入。
AI的优势在于,不需要设计师进行场景的三维重建,这是一项较为劳动力密集的工作。我们用普通的民用摄像头产品,甚至手机围绕现场走一圈就可以把场景快速地建立出来。而且这些部署的摄像头,可以实现三维高清定位,快速地标定至三维的空间位置中,这样不管厂区还是园区的数字化管理就会非常高效地进行。
直到迪士尼并购了Pixar,乔布斯才变成了迪士尼最大的股东。我觉得做Pixar的创始人和员工是很幸福的。某种意义上,Pixar是一个比Apple更有价值的公司。因为Apple的任何产品总有一天会被用户用旧了丢在垃圾堆里,但是Pixar拍的每部电影永远都活在观众心中。
就比如你现在你有10000张图像,其中30张属于一个类别,但这30张的标签不一致。我们要做的一件事就是构建工具来吸引你注意到这个特殊的数据子集,使你能够快速重新对它们进行标记,从而提高模型性能。
你比如说我们要建立月球科研站,第一个问题你要有能源,所以现在的说法都是希望用机器人上去,用月球的土壤把它3D打印,变成太阳能发电板,然后机器人去一块一块铺设起来,这样的话就有太阳能电站了。所以我想这是必然的一种结合。
我们已经在猴子身上成功运行脑机接口。我们做了大量测试,以确认它是非常安全,并且脑机接口设备是可以安全移除的。人们可能已经看过我们今年早些时候发布的演示,视频中有一只猴子通过大脑中的脑机接口,利用心灵感应在玩Pong游戏。它是彻底无线的,感应式充电,猴子看起来完全正常,但正在通过心灵感应玩电子游戏。