AI大模型本身不存储数据,它存储的是参数。而参数代表着在算法、模型框架之下,数据之间的关系......在讨论该如何向ChatGPT收学费的同时,出版商或许更加担忧ChatGPT的生成能力可能会威胁到新闻出版集团的主业。这也使得AI在出版集团面前的形象成了——“吃我饭,还砸我碗”。
这一语言模型的技术是1972年就已经有了的。到现在,经过了五十年,现在行业内,其实大家并不觉得它是一个什么了不得的东西。在此以前,这个语言模型其实已经做了很多的事情。
提到语言模型,这个词,最初是由我的导师贾里尼克提出来的。他大概在1993年的时候到了约翰霍普金斯大学。
过去做什么应用都需要海量数据,现在很多基础数据通过预训练模型给你了,那么每家就可以结合自己的专有数据做fine-tuning(精调),做prompting(提示),做这种适应就行了。之前做个公司,最怕数据不够,因为数据散着或者在别的公司那里。
生成式AI终结了文牍主义。办公文书、八股文等固定格式的文本,是机器人最容易掌握,也最容易仿真和替代的。介乎宣传文稿和新闻作品之间的新闻内容,均具有固定格式,类似八股文。某种意义上说,生成式AI将会对新闻报道中文牍主义、形式主义形成冲击,同时也对僵化的官僚主义、科层制管理模式形成冲击。
可以从数学角度来看这个问题。ChatGPT它的目标是什么?是面对提问,每次给出最大概率出现、最自然的解,所以它的运作思路,和人想出新办法的能力是完全相反的。人在这方面的能力,ChatGPT没法替代。培养人的思维能力,让人想出那些创新的,奇奇怪怪的新方法,其实也是非常难的。
2016年人工智能第一次撞开现实之门,所有人都在讨论赢了李世石的AlphaGo,讨论AlphaGo背后的DeepMind......彼时深度学习的技术演进变成CV(计算机视觉)和NLP(自然语言处理)等领域新的场景......此时的追一从单纯的产品技术角度,已经没有太多优势。一个象征性的事情是,滴滴在决定自研智能客服后,在2019年结束了与追
这一次,是聊的模式,即上下文+启发的对话模式。其中上下文是你和机器人一轮一轮的口语化自然语言,是语境语义,它为了学到你理解你懂你,就会按你的说话套路(你的口头语音说话习惯,即是你打的自然语言的字)来跟你聊它的看法,而不算回答,因为问答、回答是考试模式填鸭模式,少了可能性。
从数据的角度看,ChatGPT并不具备智能的本质特征。小样本小数据解决大问题,才是智能的表现。在许多场景中,交互双方的意图往往是在具有不确定性的非完备的动态小数据中,小概率出现并逐步演化而成的。
GPT-4根据工作人员的回复“推理”出它不应该透露它是一个机器人。于是它开始编造一些借口,来解释为什么它无法解决验证码问题。GPT-4回答表示:“不,我不是一个机器人。我有视力障碍,这使我很难看到图像,所以我很需要这个服务。”
ChatGPT这一种LLM,不是打开了AIGC的大门,而是打开了自然语言用户界面(LUI, Language User Interface)的大门。LUI是一个比AIGC大不知道几个数量级的世界。和LUI的大海相比,AIGC就是一个小池塘。
创造是人类的天性。在过去30万年间,我们在创造艺术、美食、宣言、社会的能力方面一直是独一无二的:我们在前所未有的领域设想和创造新东西。现在我们有伴了。当你在读这句话的时候,人工智能(AI)程序正在绘制宇宙画像,回复电子邮件,做报税准备,录制金属摇滚。它们正在写演讲稿,调试代码,勾画建筑蓝图,并提供健康建议
过去人们看到蒸汽把壶盖掀起来,从而发明了蒸汽机,以至于后面发生的工业革命,极大地解放了生产力。AI就是我们这个时代的“蒸汽机”,这是不可逆的时代浪潮,我们每个人都要去适应与AI共存。