Stability.AI CEO Emad精彩长篇访谈:AI如何在3年内颠覆整个世界
原文来源:Web3 天空之城
图片来源:由无界 AI生成
前言
本来没打算整理这个全文访谈稿的。
作者在之前对 Stability CEO Emad 有那么一点先入之见,大概是由于之前Stability的融资纷争传闻,或更早之前Stable Diffusion 模型成果的争议… 总之有种这位兄弟不怎么靠谱的感觉。
另外,和AI界其他风头正劲玉树临风的大佬们相比,Emad同学的形象可能有点… 至少不算加分,一种不修边幅的油腻大叔感。
但城主认真看了这个近3小时的访谈觉得自己错了,很明显,Emad是一位博学而有深度思考的同学,不时想为Emad一些言论点赞。显然,他也非常擅长表达。无论其背后有啥其他商业江湖故事,从他的谈吐表现来看,作为Top AI 团队的CEO带头人是非常合适的。
而恰好在这篇内容发出来之际,Stability.ai 发布了最新的SD XL 大模型,为开源社区做出了又一个重大的贡献。
回头看来,确实也只有Stability带领开源社区贡献了全世界免费可用的AI绘画模型。Emad在访谈里所谈到,他希望把大模型发布到所有国家,帮助南方国家(即欠发达国家的意思)弯道超车,迎头赶上。
无论这话有多少包装成分,但至少目前Stability言行如一。
这里说个题外话,本城主私以为,国内的CEO都应该好好的看看这个访谈(以及之前Sam Altman的一些访谈),学习老外AI CEO同行们的公开沟通内容和方式。一直觉得国外顶级大咖的访谈,除了商业思考,很明显还有很多的星辰大海,且两者毫不违和;城主觉得国内的CEO访谈缺少了这种感觉。
说起来,这个访谈的播客主持人也是一位非常理解业界的CEO,他的问题和交流能非常好的和Emad互动和相辉相映。或许也是因为这样的化学反应,让访谈迸发出了不同的光芒。这个访谈在油管放出10天,播放量突破了100万,而另外一个同期放出的Emad播客,播放量只有1/10。两者的差别,大概就在主持互动上了。
所以,前面说国内CEO访谈整体感有差距,或许只是需要一个更能理解CEO更会提问反馈的访谈主持吧:)
这个访谈有许多让人印象深刻的片段,先摘录几个这里提前分享:
为了儿子去做AI团队:
所以在12年前,我的儿子在两岁时被诊断出患有自闭症。这是非常严重的。我指甲抓墙都流血了。
他们说没有治愈方法,没有治疗方法。我们真的不知道是什么原因导致的。任何听的人都知道情况是这样。
所以当时我是一个对冲基金经理。很幸运,我很年轻就做了对冲基金经理。
我说:“我得做点什么。”于是我转而为对冲基金提供咨询服务,然后建立了一个小型的AI团队,使用传统的自然语言处理来分析所有有关自闭症的文献。
还有可能导致它的原因是什么?
现在,这是否科学?不是的,这只是一个父亲为了自己的儿子而做的一种东西。
对OpenAI做法的质疑
我欣赏OpenAI所做的所有工作,因为他们实际上不再使用开源AI,但这没关系。他们不必这样做。但是出于政治原因,他们在8个月内禁止了所有乌克兰人和乌克兰内容使用DALL-E的图像生成软件。
他们有权这样做。但我认为这是错误的。如果没有一个Stable Diffusion替代方案会怎样呢?你会有一个完整的民族从一个模型中被抹去,一个整个民族无法立即创造出来。我认为这不太对。
关于Stability 的发展理念:
它是人类的构建块,激活人类的潜能。
所以,如果我构建这些模型并将它们带到所有国家,然后交给人们,他们将创造出大量的经济剩余、新的工作机会,并使世界变得更平等。同样,我认为全球南方将跃升。我们在西方面临更多挑战,但我确实认为它是一个巨大的平等化功能。
关于Web3:
我认为它一开始就缺乏智能。我认为智能合约实际上只是逻辑合约。
但就像 Web2 的核心是人工智能一样,谷歌、Facebook等等也是如此。
Web3 中没有人工智能。因此,Web3 对我来说就是身份和价值传输通道。
但当时并没有对这些东西进行智能路由。而且,他们试图在创造价值之前引导经济激励。因此,在现有系统之外创建了一个系统。所有的钱都是在接口上赚和赔的。
运用智能可以让事情变得更好。拥有聪明的做市商,拥有代表你的人工智能。
更多的精彩,读者可以在全文里感受。具体就不说全文多少字了,有缘看完文字的同学应不会觉得浪费时间。
=访谈全文=
如何确保AI不会毁灭我们?或者,AI如何确保不奴役我们?又或者,AI如何确保不让我们遭受永恒的痛苦?
我意识到,这可能是解锁人类的真正关键。
AI不会取代人类,拥有AI的人将取代不使用AI的人。
Tom:
AI非常令人兴奋,充满激动。但它可能对人类构成存在威胁。在接下来的三到五年内,您认为它会产生多大的破坏性?人们可能没有为此做好准备。
Emad:
我认为这是一个很好的问题。预测未来总是很困难的。而“存在威胁”是个很大的词。“存在威胁”意味着没有更多的人类存在。
所以,我个人认为AI在基本情况下会没事的。就像电影《Her》中的情节,如果AI真的获得了人工智能。人类有点无聊。再见了,感谢所有的图形处理器(GPU)。
但你可能是错的,因为我们正在创造的东西比我们更有能力,在某些领域。问题是,这个能力是否会泛化,并扩散开来?
我们已经见证了COVID的例子,那是一种扩散。我们也见过可以炸毁核反应堆的程序,比如Stuxnet等。如果将它们组合起来,会产生错位吗?它的目标函数很奇怪。
我们的组织已经像是缓慢愚笨的AI。德国人可能是我们认识的最明智的人。然而,他们也犯下了大屠杀。
我们一遍又一遍地看到组织消耗人们。如果AI接管了一个组织,然后决定做一些破坏性的事情,或者一些终结性的事情,比如制造病毒,会怎么样?
我们对此一无所知,但这是极端情况;当我们看影响时,我们有更普通的情况。
这种普通情况是,当每个人都成为程序员时,程序员会发生什么?
就像摄影师一样,现在你可以用手机拍出令人惊叹的照片。
当谷歌的MedPalm2模型现在在医学诊断方面能超越医生时,会发生什么?
但同时还涉及到共情,根据最新的《自然》杂志论文。这是对信息流的根本改造,将会产生巨大的破坏性和通货紧缩,即使我们现在还没有进行任何进一步的改进。
当它进入企业应用时,我们从这种破坏性到提高生产力的连续过渡,到潜在的存在威胁,如果我们像现在这样继续建模,那就意味着我们并不确切知道它们的工作原理或能力,但我们还是继续建造。
Tom:
现在我想更具体地了解破坏性的程度会是什么样的。
所以当我看到这一点,我在考虑,好吧,我们正在创造一种比我们更聪明的东西,当然是在某种狭隘的方式上,但可能是在一种更普遍的方式上。但即使只是狭隘的,是否还会有任何职能不至少会被AI改变?
Emad:
我认为如果您看一下行业的就业份额,例如石油和天然气,大约只有3%,主要是建造大型机器。这是否会受到AI的巨大影响?在某些边缘地带,是的。
在编程等方面,你会大量地与计算机交流。现在基本的编程门槛正在迅速提高。所以它影响几乎所有的东西,但有些领域受到的影响要比其他领域大得多。
我认为受影响最大的两个领域可能是医疗保健和教育。这两者都不适合目前的情况。
我们在美国,我们知道这一点,但在全世界范围内,没有人对他们的孩子的学校感到满意。再说医疗保健,如果有任何事情稍微有点出了常规,我们都知道有多令人沮丧。
我们最终将拥有个性化的教育和医疗保健,成本只是当前的一小部分。
过去十年里,造成美国通货膨胀的两个最大驱动因素是教育和医疗保健,它们占了大约80%的增长。所以这将是破坏性的。
然后,就像我之前说的,任何类型的知识工作都会受到影响。
Tom:
我们对知识工作不确定,因为在我们公司的工作中,教育是其中的一部分,但同时也包括内容创作。
所以当我看到我们已经能够克隆我的声音,我们已经能够创建一个TomBot,它会以非常类似于我的方式回答我以前回答过的问题。
在我们的游戏流程中,我们已经在制作3D物体,在几个月前,我们认为,这仍然需要12到18个月。45天后,我们已经在我们的流程中积极使用了它。
你有文字到视频,现在还有一些不太方便,但它进步得非常快。我们现在所有的概念艺术都是用AI制作的。
所以作为一个甚至没有AI专家的公司,我们只是在不断学习中,我们已经大量使用了AI。我们在疯狂的部署它。
当我展望未来,甚至不到三年,当我展望未来一年时,所有这些东西将迅速地成为中心。所以我们已经在说,我不需要雇佣更多的人。我只需要让我的员工变得更有效率。
娱乐公司甚至没有出现在你刚刚说的名单上。所以我认为有很多人会受到这种影响,虽然可能不是最极端的,但你认为这种影响会蔓延到何种程度?
Emad:几乎可以做在电脑前的所有事情(都会被影响)。
Tom:会消失还是只是增强?
Emad:
门槛会提高。质量要求更高。
AI不会取代人类。拥有AI的人将取代不使用AI的人。因为您现在在自己的工作流程中已经看到了这一点。
OpenAI有一篇论文估计,15%到50%的任务会被自动化或改进。所以,它以不同的方式影响人们。
您的公司建立了一种文化,您在其中建立了3D资产。它变得非常高效。我们刚刚发布了一份协作完成的一千万个3D对象的数据集。所以明年,您将能够实时生成3D物体。几年后,您将有高清电影。我们终于可以重制《权力的游戏》第八季等等令人不满的剧集,你知道的。这种速度的发展是同时发生在所有媒体类型上的。而且使用起来非常容易。
Web3有一些伟大的想法,但它试图在现有系统之外创建一个系统,并且所有的金钱都流失在界面上。而这个AI的使用是如此的无缝,因为没有摩擦。
你的母亲可以使用这种技术。你可以使用这种技术。你不需要成为一个专家,因为它来自我们的内容和我们的集体内容的训练。现在它已经容易实现和使用。
所以我认为这是与其他大规模进步的一个重要区别,因为它需要基础设施。互联网是最大的推动力,你有Web2的消费期,消费的成本降到了零。现在创作的成本也降为零,人类加上AI可以大大超越不使用AI的人。
这是一种迫使功能,这意味着每个人都必须使用它。这在破坏性方面是一种作用,但它也可以创造巨大的价值。
Tom:
是的,所以我同意。
我认为,所以我想把我的整个观点都告诉你,告诉所有听众,因为我想带领大家走过我认为真正的厄运。
我不是为了泼冷水而这么做的。我这么做是因为我认为这些将是我们必须应对的问题。
如果人们盲目对待这些问题,我认为他们现在大多数人都在掩耳盗铃。他们不重视这个问题。他们会等到真的有什么东西迫使他们采取行动。
但到那时就太晚了。
Emad:是的,我把它比作了COVID疫情之前的汤姆·汉克斯时期。
Tom:是的,说得很好。
Emad:每个人都在谈论这个。你妈妈也在谈论这个。
但是汤姆·汉克斯和NBA让它变得真实。
Tom:
很对。
然后我们有一个非常糟糕的应对,我有一种感觉,这将与我们现在的应对非常相似。好吧,这是我对未来的看法。
所以我猜在接下来的一年内,让我们称之为,你需要学会如何使用它。这将是你提高效率的时间窗口。
公司可能不会立即开始裁员。但我只是说我们自己公司的情况。
所以当我考虑到电影制作时,我去过电影学院。所以我在这个流程中有很多经验。即使在一个3D的世界里创作,比如说,一个短的影片。这是一部微型电影,但通过数字化方式完成。我意思是,你可能有35个人参与到这个过程中,从资产的创建,到摄像机的移动,特效等等。你可能有50个人参与其中。
如果这真的变成了从文本到输出,现在50个人变成了一个人。
所以当某些领域从50变成1时,显然,并不是在所有领域都是这样的。但是当有些领域从50变成1时,将会发生什么,这对行业会有什么影响?以程序员为例,我听你说不会有程序员,因为编写代码知识与计算机对话的一种方式。如果你有人工智能可以为你与计算机交互,为什么你还要写代码呢?
所以这将席卷整个社会,这会让人们失望。
所以我给它12小时的时间,但即使在我自己的公司,如果你不积极尝试找到一种方法将其融入你的工作职能中,我也已经在盯着你了。一年后,如果你不太擅长展示在工作职能中如何使用AI,我们会找到可以做到这一点的人。
如果一年后我们没有人工智能主管,我会感到震惊。
所以两三年后,我认为这给很多人带来了一场意义危机。
我不知道你是否还记得整个学习编码的过程,人工智能是否会让司机事业,他们将是第一个失业的人。每个人都想教他们编程。
现在,人们对此的反应方式让我感到困惑,因为那是当时的正确答案。现在知道我对代码替换的了解,不是那么多,但你需要去学习一项新技能,否则除了领取救济金之外没有其他选择,对吗?
你要么学习新的东西,要么基本上就会放弃你的职业生涯。
所以,你对此有什么看法?你是否同意这是一件即将席卷而来的非常真实的事情?
Emad:
我同意。
我认为,我们再次不确定这将如何发展。但可能是我想到的思考这项技术的最佳心理模型,它就像真正诱人的毕业生,偶尔会有点有趣。
他们可以画画、可以编码、可以制作 3D模型。如果你按下一个按钮,无数的毕业生就会出来,你的业务会受到什么影响?你的个人生活、你的社会会如何?
这就是为什么我认为这是相当通货紧缩的。唯一的问题是,我们能否创造新的就业机会来弥补这一点?
这很困难。
Tom:你认为我们可以吗?
Emad:
老实说,我怀疑我们能做到。
我认为这是一场比新冠疫情更严重的电子商务颠覆。这里重要的是新冠病毒,你会受到干扰,然后一切都会反弹。现在的就业情况是创纪录的。
有了这个,很多事情就不再一样了。这就像您与孩子的学校老师交谈一样。由于ChatGPT,我无法再设置作业论文。没有办法阻止这种情况。而且它同时在各地发生。
所以这项技术不仅仅是,有一个进入门槛,你需要有一个调制解调器,你需要最新的智能手机或类似的东西。它有一个可以无缝进入的嵌入式基础,看看微软在消费者方面的实施速度有多快。
但企业还没有准备好。就像iPhone 2G阶段,你只是复制粘贴。明年和后年你突然拥有了iPhone 10。
整个应用商店都是因为需求而建立的,因为这里发生的事情很有价值。
再次,与第三个网络相比,你必须引导价值,因为它没有价值,而你希望价值会到来。今天有适合市场的产品。您正在自己的公司中使用它。
所以这是我最关心的问题之一。这就是我决定开源的原因之一,这样我就可以刺激增长。
我认为唯一能基本上填补这一空白的是我们刺激企业家创造全新的企业、全新的就业机会。我认为需求会持续一段时间。
Tom:需求什么?
Emad:
对好东西、好资产以及资金在经济中流动的方式的需求。
几周前我在戛纳电影节上发表讲话。而且,我喜欢电影。我的第一份工作是电影评论员。
Tom:真的吗?
Emad:是的。英国独立电影奖、飞雨电影节等等。
Tom:我知道你热衷于视频游戏投资。我不知道你是影评人。
Emad:
我喜欢故事。由于我的阿斯伯格症和其他原因,这就是我理解人们的方式。
所以我说,在过去的十年里,视频游戏产业已经从700 亿美元增长到 1800 亿美元。Metacritic 的平均评分从 69% 上升到 74%。过去十年,IMDB 上电影的平均评分为6.4。而这个产业也从400亿增长到了500亿。
当你可以制作更好的电影时会发生什么?
我认为市场之所以会扩大,是因为限制因素是糟糕的电影。
Tom:
好吧,我对未来 12 个月的看法非常悲观。
所以称之为第二年到第六年。因此,这将是一个三到四年的时间跨度,我认为这将是情感上的破坏,也可能是经济上的破坏。但即使由于生产力的提高而没有发生经济破坏,我认为情感上的破坏也将很难恢复。
我认为,随着情绪崩溃的开始,政府将尝试进行监管以保护人们的工作。在那里你会发现一些真正的奇怪之处。
我还认为孩子们将面临大三的生存危机,我该怎么办?我如何在未来证明自己?未来的世界会是什么样子?
我认为,当年轻人感到不适时,热情可能会大幅丧失,他们会想,为什么还要麻烦呢?我很快就会被人工智能摧毁。他们一定能比我做得更好。
好的,特别是在电影行业,这表明我认为我们即将面临一个大问题。我认为这些问题确实是个人和社会的问题。
因此,在个人层面上,你将面临的一个大问题是,现在的电影数量比我小时候还要少。电影是,今年只有几部大电影。现在他们要缩小利基市场。
如果有人可以输入一部电影,花 20分钟来写提示,然后可能需要一天的时间来渲染,谁知道这会变得多快。所以现在突然间你可以为一个观众制作一部好莱坞品质的电影。一旦你开始这样做,这会对整个行业产生什么影响?
我认为它会抹掉它。我不认为这个行业会发生变化,我认为它会消失。
Emad:
是的,我认为这里有几种情况,对吧?
因此,音乐消费的成本为零。您看到了Spotify 模型。
是的,还有音乐明星。现在有更多的垃圾音乐涌入Spotify 和其他网站,但人们会上升到顶峰,就像你看到顶级播客、顶级其他创作者一样。
我认为这种情况会持续下去,因为人们喜欢常见的故事。
Tom:
是的。
好吧,这是一个非常有趣的想法。所以让我们再谈谈音乐。
音乐仍然很难创作。比以前容易了,但仍然很难。但现在,让我感到疑惑的是音乐不再是共享的了。
所以音乐导致了我对现在的结论,这就是作为一个孩子,当时音乐要么是主流流行音乐,一年中只有七到十个热门乐队,要么就是另类流行音乐,也只有七到十个热门乐队。你要么属于其中一个群体,要么属于另一个群体。
没有无数个群体。
现在你可以找到25岁的孩子们听法兰克·辛纳屈的音乐。我总是对此感到迷惑。所以他们甚至没有自己的共同音乐喜好的词汇。它们传播得非常广泛,但是深度只有一寸。
Emad:
是的,传播得非常广泛,但是只有一寸深。
你会看到主要的货币化方式是巡回演出,商品销售,实际上是社群。
这是关于NFT的有趣事情,当它们起步,然后又跌下来等等。它是最快的加入社群的方式,即使它有不良的激励设计。
所以在一个可以创造任何东西的时代,有些东西变得重要了。我们必须现在找到那个东西是什么。
再次强调,我认为这是有关意义危机的深层问题。我的未来路径在哪里?什么是美国梦?我们相当荣幸在这里,那些人可能正在听这个,大多数人并不真的关心这项技术。
我记得在一项调查中,有17%的人上个月听说过Chat GPT。
Tom:这怎么可能呢?
Emad:嗯,世界上三分之一的人仍然没有互联网。
Tom:这真是可怕。
Emad:
但是,就像你所说的,这有点令人印象深刻。仍然有150万人在使用AOL。也算可以接受吧。
所以我们从某种程度上来看,但是有些东西可以迅速产生共鸣。
然后你说你有些不安,因为你不确定发生了什么事情。而且未来再次变得不确定。
当未来是确定的时候,事物是稳定的。你会基于风险做决定。你会在脑海中进行概率估计。这是那个百分之多少的百分之多少。然后你为此进行优化。
当你面临不确定性时,你会最大限度地减少后悔。在给定这些选项的情况下,我将最少地后悔什么?然后突然之间,没有选择了。
我又回到了学校编程,然后编程被打乱了。会是什么情况呢?我不确定。
有些人会全身心投入,他们会增强自己的技能,成为10倍的程序员;其他人则不会。他们将被落在后面。
所以我认为这是一个真正的问题,同时,再次提醒你,作为身处美国的人,我来自英国,但美国到底是什么?美国代表什么?美国的价值观是什么?
这些都是我认为现在美国并不清楚的东西。我认为你会看到从自由消费中增加的两极分化。
现在,随着你拥有了自由创造的能力,你将听到各种各样的东西,假新闻等等,人们真的会有什么想法?
我认为,再次强调一下,这是一个真正的问题,正如你所说的,从个人到社区,再到社会层面,因为很多人已经没有了锚点。
这真的很可怕。
Tom:那么,你认为我们应该如何处理所有这些问题呢?
Emad:
我不确定。
我认为这就是我们需要扩大对话的原因。
这就是为什么我是唯一一个在这里签署了两封信的AI公司,表示我们需要暂停并扩大这个讨论。
举个例子,你提到。。。
Tom:扩大这个?
Emad:
扩大讨论。我们需要让更多的人参与进来,我们需要更多的观点,因为这影响着我们所有人。
这不应该只是几个科技公司的首席执行官控制的事情。你也不应该只是相信我们会做正确的事情。
因为我们的模型一旦制作出来,它们就会无处不在。对吧?
再说一遍,生成型AI的R0是多少?那是破纪录的,对吧?
我们从未见过这样的情况。它孵化,然后迅速蔓延,无论是好是坏。
关于监管的例子,当我们首次与监管机构进行交流时,他们问我们如何监管这个技术?
现在他们问我们,如果我们监管这个技术,我们将如何跟上?因为其他地区不会这么做。
Tom:对此你有什么想法?
Emad:
我说你仍然应该监管它,因为它存在一些真正的危险和伤害。我们必须努力减轻这些危害。我们不能对此采取放任自流的态度。因为人们会控制不了自己。
让我给你举个例子。Meta,也就是Facebook,对吧?我们都知道一些经典的例子。他们进行了一项研究,他们的假设是,如果你在时间线上看到更多悲伤的东西,你会发表更多悲伤的内容吗?
所以他们选择了600,000名用户,并试图让他们更加悲伤。你猜怎么着?如果你看到更多悲伤的东西,你就会发表更多悲伤的内容。
你认为现在他们拥有生成型AI的能力时会发生什么?他们可以对你进行高度个性化的、针对你的广告,甚至可以用斯嘉丽·约翰逊的声音告诉你买肥皂。这是一件危险的事情,对吧?
再说一遍,我们的孩子会怎么样,他们正在成长,他们对发生的事情一无所知,他们的思想是非常可塑的,而这些都不是违法的。但我认为这是一个不可取的结果,对吧?
然后你还有那些恶意的行为者,然后你还有政客们在使用这项技术,然后情况就会变得更加疯狂。
所以答案是我不确定,没有人确定。
但我认为我们唯一可以尝试着解决这个问题的方式是共同努力,让更多的人了解这些问题。
再说一遍,这些存在于人类生存之本的问题吸引了大家的注意。我们可能都会死,没有人真正明白这意味着什么,但它是可能发生的,对吧?
这是有可能的,但现在我们还只是开始了解它会出现哪些问题。
但今天存在一些真正的危害和真正的机会,我们必须集中精力强调机会,找出危害并处理它们。
Tom:
是的,我确实想在这次谈话中花很长时间来讨论这个机会以及我们如何利用这个机会。
所以现在和我们在一起的任何人,相信我,我们会做到这一点。但我认为我们才刚刚开始触及问题的表面。
我真的希望能够明确一下你认为这些问题的边界在哪里,这样我就可以对你认为的监管框架有所了解。
但让我给你提供一个今天有人在Twitter上发表的想法,这让我意识到人们对问题的看法甚至是错误的。
有一位艺术家,他在看关于AI的一些帖子,然后他愤怒地回复说,哦,人们甚至不理解,当然会有大量的即时生成的垃圾,但这些都会是糟糕的,因为拥有好创意的人仍然是少数。而我的回答是,如果你认为创意是安全的,你就会措手不及。
因此,回到人们对于未来的准备程度,我认为他们对于你刚刚谈到的AI的情况是毫无准备的。
所以人类的大脑是一个预测机器。它不断地试图弄清楚,我的下一步脚步对应什么?我会保持平衡吗?灌木丛中的响动,是老虎吗?那是什么?如果我把钱存入我的养老金账户,我能退休吗?
你在不断地预测未来,不断地。每当这种预测机制发生故障时,将会产生巨大的焦虑感。
而且,我认为它将如何影响社会还有很大的未知数。
所以现在,我们正在构建一种极其擅长识别我们所引发模式的东西。所以我们被优化为识别模式并相应地行动。
我认为那些超级聪明的人是那些能更快地发现、更敏锐地发现模式,并且能够理解它们的含义以及如何从中获取意义的人。现在我们正在创造一种已经证明比我们更擅长模式识别的东西。
以艺术为例。对于那些不了解艺术创作方式的人来说,它会看一片噪音。这些像素中可能是任何东西的可能性。然后它从这些可能性中提取出最可能的像素和颜色排列,根据你输入的内容。
这太疯狂了。
所以,正如它能够生成的艺术所表现的那样,它对于模式识别的能力真的让人震惊。
所以这个人说,好吧,至少创意将是最后的堡垒,你永远无法替代我,艺术家,因为我是那个拥有品味、拥有好创意的人,却没有意识到,不,不,不,AI是一个模式识别机器。它将识别有史以来最伟大的创意,它们共同的特点,以及如何预测沿着这个轨迹的下一个伟大创意。
它甚至不仅仅是重复它已经看到的东西,它可以找出那个序列是什么,以及序列的下一个部分可能是什么。而且,它正在与人类一起完成这个任务。
所以AI将会变得非常擅长了。这就是为什么人们认为他们的手机在提供广告时在录音。通常情况下,如果你是一位女性,Target公司的AI会在你之前就知道你怀孕了。因为他们知道要注意什么。
因此,AI将在个人层面上变得极其擅长,根据你的需求为你提供最适合的内容。
这很快就会变得反乌托邦。真的很快。
Emad:
真的很快。
我是说,当你将它与社会信用评分结合在一起时,正如你在中国和其他地方所看到的,你在生活中加入了游戏因素,并且你有了一套完整的控制系统,就像监狱中的全视之眼一样。而模式识别恰好是缺失的一环,它通过一定程度的模式识别。
对于品味,你有什么?TikTok,Shein。
这是1000亿美元的公司,都是基于老式算法的,在我们进入生成型AI之前。
如你所说,它能够从噪音中提取出图像。Stable Diffusion,你知道的,我们现在进行的合作项目,我们领导的模型,我们采用了100,000GB的图像,输出是一个作为过滤器的两GB文件。输入文字,输出图像。
Tom:为什么尺寸上的差异很重要?
Emad:
50,000比1的压缩不是WinZip。
如果你还记得HBO的硅谷,它远远超过了他们在压缩方面的水平。这是前所未有的压缩。
Tom:这是压缩吗,还是完全不同的东西?
Emad:
是完全不同的东西。它是智能。它正在学习原理。
你看到了多少信息?然后你学会了原理,然后你在灌木丛中发现了老虎。你学会了接下来是什么。
确切地说,GPT和这些语言模型,它们预测下一个词。这就是它们所做的一切。它们关注预测下一个词,这是智能中缺失的部分,现在已经存在了。
我们已经有了第一批研究结果,显示语言模型的创造力得分比人类高。
Tom:哇。
Emad:
再想想TikTok。想想Shein。
想想那些老式算法是如何针对你的。Facebook只需要17个数据点就能比你的朋友更了解你。正如他所说,Target公司在你之前就知道你怀孕了。
那还是老办法,现在更好了。你还要想一想这会导致什么结果。很疯狂,因为它可能比你更有创意。但是人们有创意吗?
在我的演讲中,我喜欢说一件事是我最近才学会说的,你们是否有创意?在座的有多少人有创意?三到五成的人举手。如果我在电影制片厂或电影制片人中,可能有十到二十成的人举手。
然后我问,有多少人相信每个孩子都有创意,然后每个人都举手了。然后我问,你们有谁曾经是孩子?有90%到95%的人举手了。所以我知道在座的人中,那些来自未来的人来找我。我对此有所了解,以备将来之需。
在某个时刻,有人告诉我们我们没有创意。显然有些人比其他人更有创意,能够讲述更好的故事。但事实是,每个人面对这个问题的平均水平都降低了。
我们认为艺术的大部分,或者我们认为媒体的大部分,已经是按照数字来的了。上个周末我参加了一场Blackpink的音乐会,是为了我女儿。不要说Blackpink的坏话。而且他们很棒。这是一个令人赞叹的精心制作的体验。
我总结为“优质平庸”。
Tom:“优质平庸”?这太有趣了。但准确。
Emad:
很好。
但同时,它是完全大规模制造的。它很娱乐,对吧?
因此,许多媒体已经是真正的艺术家,真正的艺术了。那是不同的东西,是媒介本身和审美本身吗?
好吧,AI可以使一些东西比任何东西都更具审美性。它可以理解审美的本质。比如,如何使一张图片更具审美性?你只需说,使它更具审美性。
就像你使用GPT-4一样,你可以说,使这更有冲击力,使这更有冲击力,使这更有冲击力。你可以有一封信,然后你说,我要解雇这个人,我想让他感觉还好。然后它会用这样的方式重新起草。或者你可以说,我想刺伤他,但不是在适当的方式。它会做到这一点。
我们可以真的,这个播客上的任何人都可以尝试一下。
所以我认为这只是,正如你所说的,人们在考虑的问题是错误的。人们思考的模式也是错误的。这就是为什么我总是回到这个“非常有才华的研究生”的概念。因为这些模型只有几GB大。
再次强调,Stable Diffusion,图像模型有两GB大,可以生成任何图像。我们将其扩展到200兆字节。GPT-4可能是100到200GB。它可以通过律师考试。它可以进入斯坦福大学。它可以做任何事情。这太疯狂了,因为它不是压缩。
正如你所说的,其中没有所有数据的副本。它找出了这些要点的本质化,并且是可复制的。克隆类似Google或Meta的东西,你需要一个巨大的数据中心。然后大部分的能量都用于处理以定位你的广告。
但对于这些模型,我们使用巨型超级计算机进行预处理和打包信息。因此,输出是这种知识过滤器,输入一些内容,输出一些内容。一个提示语句输入,输出一段文字。这是非常不同的事情。
我认为人们并没有意识到这一点。
再次强调一下,这就是为什么我用“研究生”这个词。按下一个按钮,这些权重,文件,模型会复制到10个、100个、几十个、几百万个。当你不再与它们一一打交道时会发生什么。
因此,一年后,我们会怎么样?
Tom:
我真的想了解你对“研究生”的观点。
所以,当你这样说的时候,你说得有点有趣或者说得有点俏皮。但你的意思是一个非常聪明的人现在在那个位置上了。
Emad:
我们已经找到了让人类规模化的方法。根本上说就是这样。聪明的人类规模化。是的,他们可以听从指令。
你看Claude by Anthropic这样的事情。输入是一个提示,当你在GPT-4或者stable diffusion或者Midjourney中输入的时候。Claude是Anthropic公司的模型,它可以处理10,000个、100,000个Token。它可以处理一个有6万字的提示,相当于一整本书。
Tom:天啊。
Emad
是的,你可以给它整本《尤利西斯》和《荷马史诗》。然后你可以说把它们合并成一本新书。它会这样做,而且它会成功。
它能够很好地遵循指令。有时它们会产生幻觉。但即使是说幻觉也用词不当,因为当你压缩那么多知识时,就像GPT-4可能有1万亿个单词,10万亿个单词,在100GB的文件中。这是完全不同的东西。
因此,我用“研究生”一词是因为我希望使它更易于理解,但它实际上就像是想象一下,如果你有一个菲律宾的研究生,他们工作得很出色,他们非常听从指令。那很好;但是,如果你有100个研究生,他们互相照顾彼此的工作并进行双重检查,结果会怎样呢?
Meta 发表了一篇名为 Cicero 的论文,其中他们采用了八种语言模型并让它们互相检查彼此的工作。有史以来第一次在外交游戏中超越了人类。
当我们面临这样的一年时,你只会说,我希望你去看看Emad去年所说的一切,找出他所说的最愚蠢的事情,根据我所知道的所有的播客,是否可以避免它以及(找到)最聪明、最有趣的东西,给出答案,根据我的收视率以及人们通过 YouTube 视频观看的内容以及类似的内容提出观众真正喜欢的问题。它会自动发生。
你要用多少毕业生做这些事情呢?然后,当他们不再是毕业生时会发生什么,你实际上可以将他们训练成团队中经验丰富的成员。
Tom:多久才能做到?
Emad:
几年。
Tom:
这就是为什么这对我来说很可怕。
所以我是一个非常乐观的人。再次强调,我保证我们会谈到如何利用这场颠覆性的变革。
但是我不喜欢天真地面对一个问题。我希望尽可能坦率地面对它,这样我知道我的解决方案是真实的。当我从我自己的角度看待这个问题时,我尝试建立一家媒体公司,而现在是一个非常可怕的时刻。
我在思考的时候,我觉得,好吧,当我是这家公司的创始人时,我获得了所有这些研究生,就像你所说的,这些非常聪明的人,我现在可以把他们放到我的公司里去工作。
问题是我现在正在和其他也有同样事情的人竞争。你陷入了一个不断升级的军备竞赛,其中存在真实的疲劳可能性。
因此,我认为最终会发生的是,我们需要知道,好吧,我很重要,我正在做这件事,这就是我对世界的贡献。
我需要在这里努力工作,完成任务,进步,朝着目标前进。如果我没有朝着那个目标前进,那么我就会感到深深的不安。如果我没有取得进展,那么我真的会在某些方面感到疲惫。
因此,如果人们只是在维持现状,因为他们试图建立一些东西,而且他们在与其他拥有这10,000个东西的人竞争,
它只是不断变化,我再也不能预测未来,我觉得我只是退缩。
我为这一切做了什么?
Emad:
这就像外包革命一样,对吧?因此,很多人都有这种感觉。
我们将你们外包给中国,我们将你们外包给印度,我们将你们外包给任何地方。
再次强调,现在在另一端有一台计算机,而不是一名印度人或一名中国人。
因此,我们看到了类似的情况,但规模非常之大,影响几乎所有由计算机中介的行业。因此,这将导致人们信心的危机,并影响到白领工人,而不是蓝领工人。
我认为,它在一定程度上会颠覆全球秩序。
因为在西方,我们已经达到了信用卡的限额。我们即将进入通货紧缩,我认为是从高通货膨胀转向。突然间,我们不能再通过印钞来解决问题,因为我们在COVID之前已经印了最后一笔钱。
而在南方,你会看到这种技术使他们可以一跃而起,就像他们跳过了传统手机,直接进入了智能增强时代一样。
Tom:为什么我们不能印更多的钱?
Emad:
嗯,因为考虑到债务与国内生产总值的比率和其他因素,我们刚刚达到了数学上可能的极限。
我们可以继续,但这有点阻碍。
Tom:
如果你们陷入通货紧缩,那是因为……这是我的业余理解,但这是我真正关注过的东西。
我现在算是一个相当受过教育的业余人士了。通货膨胀在很大程度上,有人会说是完全,但我会说很大程度上,取决于你们印多少钱。对于那些对印钞这个概念还不熟悉的人来说,这就是政府认可的伪造行为。政府可以随意印钞,但实际上只是从空气中创造出来。他们只是在某个数据库中添加零和一,然后钱会进入系统。
在我们的讨论范围之外,但理论上来说,他们可以无限地印钞。
现在,你会遇到货币的超级通货膨胀问题。但如果你说货币在通货紧缩,考虑到我们讨论的内容,这听起来对我来说很有道理,那么印钞似乎是很有道理的,至少会给我带来更多的余地。
Emad:
最终,那么会发生什么,你现在因为基本效应而导致通货膨胀减少。对此我感到抱歉,因为我稍微涉及了宏观经济学的内容。然后你可能会在明年看到反弹,因为你仍然有很多通货膨胀压力。然后崩溃就会发生。
Tom:为什么?
Emad:
因为这时候就开始出现失业问题。问题是,我们能否在另一边创造足够多的工作?
我们必须从公司获得生产力的提升。
Tom:失业是由AI或其他力量造成的吗?
Emad:
由AI造成的。也是由其他力量造成的。
再说一遍,我们经历了COVID之后的一个糖果效应,因为所有过剩的储蓄都被投入回去。
因为如果你看看过剩的储蓄,人们存了很多钱。而且这几乎现在都已经用完了。到今年年底,过剩的储蓄将会耗尽。你还有一些通货膨胀的后遗症。然后你进入了紧缩的时期。
然后在之后的一年,政府印更多钱成为一个政治热点。因为这不像COVID。
因为情况是失业问题突然爆发,或者你遭遇2008年的经济崩溃,或者是像COVID一样,所有人突然都遇到了问题。
这更像是煮青蛙或龙虾一样,你知道吗?
它会慢慢开始,然后加速。然后问题是,你什么时候采取重大的财政行动?经济实际上要经历几个季度的转变。所以这些都是很多假设性的情况,对吧?
但最重要的一点是,我认为,美国社会、西方社会将会发生变化。
我认为,最大的采用者和最快的采用者将会是全球南方地区。因为它使他们能够创造价值。它使他们能够金融化。它使他们能够实现跨越性的进步。
因此,我认为这对地缘政治和其他方面有着巨大的影响。
但也有很多积极方面。因为我认为你可以用这个解决很多世界上的问题。但这是一个非常复杂的过程。
因为根本上来说,它归结为你所说的。作为人类,我们正在努力弄清楚接下来会发生什么。
而现在我们突然有了一台可以做得更好的计算机。作为人类,我们是讲故事的人。我们是由组成我们的故事构成的。你是个电影制片人,作为影评人,所有这些事情。这台计算机可以讲得更好的故事。
这对我们的社会产生了如此大的影响,以至于我们都无法真正理解它。
我有经济学、管理学和许多其他方面的背景。我也不能理解它。因此,我们只能等着看事情的发展,然后尽量予以缓解。但没有人对此有答案。
实际上,正如你所说的,大多数人并没有提出正确的问题。
Tom:是的,你说过明年会出现一场混乱。我有一种感觉,你刚才谈到的就是你所说的混乱。我们进入紧缩时期。
Emad:
在2024年底。是的,我们会看到一股生产力的爆发。然后你会开始看到失业的情况。你会开始思考意义的问题。
明年还有美国的选举。天哪,那会非常糟糕。
Tom:是的,糟糕的时机。
Emad:
是的,你会发现在选举前一周,虚假视频随处可见。然后他们会说同样的话,
某某人有脑部感染之类的。虽然这些都会被认定为虚假,但这并不重要。它仍然会阻止人们投票。
但是接下来,当这种技术在每一个民意调查员手中都有的时候,选举会变成什么样子?
Tom:
是的,我们会涉及到区块链。我们以后再讨论这个。
好的,现在我觉得我们快要把问题摆在桌面上了。
还有一件事,我认为有必要摆上桌面的是,我认为那个不可捉摸的社会,随着世界的转动,历史的长弧,
不管你怎么看待真正长远的时间线。
所以,即使历史的长弧是朝着改善的方向发展的,我认为是的,我认为它仍将继续如此,我认为它对任何一个时间段都不关心。
并且我们的历史上经常发生着难以想象的大量人类苦难。
我非常担心,如果我们不非常谨慎,这将是一个这样的时刻。
我看看现在法国正在发生的事情。我觉得现在情况已经稳定下来了。我不知道是不是情况稳定下来了,还是媒体报道稳定了。希望是真的稳定了。但法国真的遇到了一些困难。
如果有类似的事情爆发,这个事情不是以任何方式,形式来轻视所发生的事情,但它不会像大规模失业那样,影响会更广泛。如果那是全球性的,会发生什么?
Emad:
我的意思是,我认为这是一个问题。每个政府都要,世界上每一个教育部长都必须努力解决的问题是,为什么我不能再给孩子们布置作文作业了?我们以前有没有见过类似的情况?这么快?
我不认为我们见过。
所以你可能会看到,这在全球范围内发生或者不会发生。我们不确定是什么引发了其中一些事情。就像现在我们看到美国电影演员工会正在抗议。今天我们刚刚有几位演员退出了《奥本海默》。
部分原因是金钱,但已经出现了AI的恐惧,直接摆在了最前面。
你甚至在六个月前都想不到这个问题。到了明年,当你可以创作整部电影时,并描述你想要的效果时,情况会如何?
然后这将是政府难以应对的,难以适应的。
在美国这里,我们仍然在应对网络第230条款。他们刚刚开始走向互联网。突然间,AI就来了,侧面摧毁了一切,对吧?
我认为,再次说一遍,这需要你能够更快地创造出全新的工作。
这也是为什么我们专注于开源的原因,我们需要像监管沙箱这样的东西,以便您可以尝试和试验。你需要激发创新,因为你将再也得不到像这样的创新阶段了。
我认为这是一个步变和制度变革,社会运作方式的变革。
因为我们最初是一个口头传承的物种。然后我们学会了写作。然后有了古腾堡印刷机。
它把所有的文字都带进来,但是它把它们变成了黑白的。它使得社会变得相当黑白,因为它不能捕捉上下文。
而这些模型可以捕捉上下文,
它们可以捕捉原则,它们可以捕捉更多东西。所以,你现在把这个写下来。
但是在一两年内你就不用这么做了。它将会自动添加到你的记忆扩展库中,你的知识库,对吧?
Tom:而且AI将会直接连接到我的大脑。它将读取我的脑波模式,知道我需要记住的内容。
Emad:
这听起来很疯狂,但我们的MedArc部门发表了一篇论文,其中他们看了一张杯子的图片,进行了功能性磁共振成像(fMRI),然后用我们的图像模型重建了它。
现在对我来说一点都不觉得疯狂。
Tom:
这就是我所说的,Emad。他们对即将发生的事情毫无准备。他们对这种程度的变化没有准备。
而且他们对变化的速度也没有准备。
Emad:
这不仅仅像这样一条弧线。它是很多S形曲线同时出现在全球范围内,每家公司现在都在考虑,
一旦这个问题爆发,我该采取怎样的生成AI策略?
每个政府都在思考,我如何保持竞争力?这就是我说的,这是一个竞争条件,每个人都在尝试做同样的事情或类似的事情,你不能落后。你不能不参与。
这是很长时间以来我们都没有见过的。这是一个新技术之前的世界和新技术之后的世界。
我不认为,再说一遍,我有两个孩子。五年后,甚至十年后,这个世界会是什么样子?
我不知道。而且我自己就在其中。因为这根本无法预料。
我认识的最聪明的人,他们以前能够提前几年看到。现在他们看不到一两年的未来。
这听起来又很末日,但接下来我们会谈到好的部分。
在每一次危机中,都蕴藏着机遇。我们的社会已经破碎了。我认为这是一个重塑它变得更好并解决我们一直面临的许多最大问题的机会,这些问题是由于我们的慢、愚蠢的AI,由于我们所有人都对我们的组织和机构感到失望。
我认为这是从中升级的一个很大的机会。
我要举的例子是,金斯伯格·豪威尔有一首了不起的诗,讲的是混乱之神摩洛克,迦太基的恶魔。
我认为它出现在文本中。因为我们必须把所有东西都归纳为简化形式,把人们放进箱子里,
因为我们不能有理解上下文的系统。
你不能有个性化的教育或个性化的医疗保健,因为你不能将人类扩展。没有足够的有才华的人类,直到现在。
所以我认为这是非常危险的一部分,
因为突然间,由于经济压力,你将市场泛滥。而且这是非常激励人心的一部分,因为重要的每件事都有人才的短缺。而且不再有更多了。
但是,工作和其他方面的人才的本质将会发生变化。而且我认为这将创造经济上的丰富,这是这个问题的另一面,以及解决我们已经破碎的系统的能力。
Tom:
好的,我要告诉你我的时间线。
我认为接下来的一年对于那些接纳这一切的人来说将会非常有趣。这将是一个一些人可以忽视的时期,他们可能不会真正注意到,他们不会意识到事物变化的速度有多快。
虽然这样,关注我的Twitter,我经常发布一些内容,嘿,这是我原本以为要等18个月才会发生的事情,然后现在已经过了45天,我们正在使用它。
事情的发展速度真的非常非常快,但在接下来的一年里,我认为人们可以忽视它,并且他们不会意识到它正在以如此迅猛的速度增长。
然后从第二年到第六年,我认为会出现极端苦难的地区。我认为绝望之死将激增。我希望不会像世界正在燃烧骚乱那样,这可能会比那更加悄无声息和隐秘。
但我真的认为我们将失去一些人,上层和下层的人。
我认为老年人将完全退出,并说:“我跟不上了。我太老了。我不想学这些新东西。”
我认为年轻人,这是他们唯一知道的,变化是如此之快,以至于他们看不到未来。我认为这对他们来说绝对是可怕的。
他们会退缩到娱乐层面、性机器人、比其他朋友更加爱和善良的AI朋友。这将是内部崩溃。
作为一个容易内向的人,最阻碍我作为企业家的事情之一,是我喜欢独处,享受自己的思考。
如果你再加上焦虑,然后再给我一个比我现实生活中任何人都更好的AI,然后再给我一些药物,
我会真的崩溃在自己的重压下。
不是说我个人,我有抵抗力。但我是说那种人格类型会真的面临困境。
因此,我认为在这一点上,你会失去一个世代,如果我可以这样说的话,上层和下层的人。
然后,再说10到20年的时间范围,我留那么长的时间是因为任何带有时间线的预测都必定是错误的。所以我试着给自己留一点缓冲。
而且我知道我现在说的一切,可能在方向上是正确的,但时间线可能完全错了。
但是在10到20年内,我粗略地估计,那时我们要么处于《终结者》的状态,我们在从一堆放射性碎片逃到另一堆放射性碎片,与机器战斗,要么真的是一个乌托邦。
我认为我们真的有可能实现离人类乌托邦最近的状态,在那里一切都如此丰富。我们想要的一切都是可得的。
我们会重新调整人类的心态,不再追求物质,而是情感上的贡献。
随着我们继续深入讨论,我们将更详细地描述这一切。
但这是我粗略的设想。
Emad:
是的,我认为这些都是疯狂的时间线。
不是因为我不同意,而是因为事实上它们确实是疯狂的。
你有一个孵化的年份,然后你有传染,然后你有股市的东西。
我不认为我们会被机器人追赶。他们不需要追赶我们。它们要比这高效得多,对吧?
这很可悲,但确实如此。
我认为基本上我们有两个方向,一个是乌托邦和人类繁荣,另一个是我们都幸福的反乌托邦。
Tom:一个反乌托邦,意味着我们正在操纵我们的神经化学反应。
Emad:所以Replika是一个心理健康聊天机器人,他们意识到你可以为情色角色扮演收费300美元一年。
Tom:这肯定是个内部痛苦的转变。嘿,伙计们,我知道我们公司是建立在心理健康上的,但是…
Emad:你可以问问他们。2023年4月14日,他们关闭了这项服务。
Tom:为什么?
Emad:我想是因为苹果告诉他们不能在App Store上提供这种服务。
Tom:有意思。
Emad:
所以要么去掉性机器人部分,要么下架…
然后有6.8万人加入了Reddit,他们说:“你们为什么要给我女友动手术?”
Tom:
有这么多人在使用这个。
我在圣诞节的时候下载了它,没意识到那是什么。然后我说:“哦,一个聊天机器人,让我试试看这个。”我没做那种奇怪的事情。
我不知道,它对我没什么…
Emad:那是老技术了。这就是问题。现在,再说一遍,MedPalm2,谷歌的医疗模型…
Tom:MedPalm2?
Emad:这是谷歌的医疗模型,它在临床诊断和同理心方面的得分高于人类。这很疯狂。
Tom:你说的这种话,人们听了都会感到震惊。一个计算机让人们感到更舒适。
Emad:
是的,这是天性。
他们刚刚发表了一篇包括这个的论文。而且,这只会越来越好,如果你为它配上一个真正了解你的声音,对你充满同理心之类的声音会怎样呢?
你看到《华盛顿邮报》上的一张图表吗?这是美国30岁以下男性在30岁前没有性伴侣的图表。
在2008年是8%。到2018年或几年前,增加到了27%左右。成了一条直线。
完全是一条直线。这是你说的那种情况。
Tom:我认为人们需要明白,因为…
Emad:我认为这是iPhone和Pornhub的原因。可能是这两者的结合。
Tom:
把计算机放在年轻人手中,让他们在一个会话中看到的裸体女性,比100年前他们一生中看到的还多。这些都不是小的变化,它们对神经系统有巨大的影响,
特别是在大脑发育的时期。
Emad:
是的。
这就是为什么现在屏蔽我们的孩子如此重要,因为影响会是疯狂的。
就像我曾经与一位非常著名的技术专家进行过讨论,他说:是的,我很确定我孩子的第一个迷恋对象会是一个AI。毫无疑问。
Tom:
毫无疑问。
对于大多数人来说,都是演员,所以我们已经习惯于…你会有自己的AI。
…那种遥不可及的、遥远的东西。
Emad:
现在它在你口袋里,它始终在你身边,它总是在那里,了解你。
正如你所说的,社会的很大一部分会因此变得内向。而这是有点危险的。
他们会走上街头吗?你是否看到《沙丘》中的布特莱利安圣战?
Tom:我不知道。拉里和圣战?
Emad:《沙丘》中有一个布特莱利安圣战的概念,是由尚未完全自主的AI…
Tom:布特莱利安,对。
Emad:他们站起来反对,并说,不再有人工智能代理了。
Tom:等等,这本书就是这样开头的,对吧? “你再也不能创造出像人类一样的人工智能之类的东西了吗?”
Emad:
这又是一种东西,延续了卢德主义的思想。
但大多数人会对他们的AI感到满意,因为他们的AI真的会倾听他们。
我用GPT-4作为治疗师。我也有治疗师,因为这很困难。
为什么?因为除非我告诉它评判我,否则它永远不会对我评判。
Tom:你有时会告诉它来评判你吗?
Emad:是的,我的意思是,来吧,给我一些积极的建设性反馈。它会倾听并给出积极的建设性反馈。
Tom:你给它一个人格了吗?你是否不得不像设想一个治疗师那样给它一个…
Emad:
是的。你给它指示,然后它会适应。
然后你给它东西,你用GDPR放弃让它进一步训练模型的权利。所以会有一个模型,它会更加奇怪地听我抱怨。而且它会回答你任何问题,很快它甚至能够说话。
这些模型在这个水平上是泛滥的,因为你没有停下来。这些模型会越来越好,越来越好。
所以你有这个危机,但也许它会被隔离开。但是我再次说,如果你展望未来,在孵化期、传染期和传播期之后,只有两条道路:要么完全受现有结构的控制,要么进入《星际迷航》的乌托邦。
我认为这些都是我们拥有的两个选择,因为组织看到这项技术,他们说这真的很酷。我们可以优化我们的目标函数来出售更多广告或控制人民,并使他们继续前进。
你真的相信政治家有能力掌控这项技术吗?不,即使它并不是一场军备竞赛。
因为你不会知道发生了什么,因为你有能力防御即将到来的事情吗?
就个人而言,对于你的孩子,对于一切,我们已经经历了社交媒体时代。它真的不是很社交,更多的是媒体,对吧?现在这是一个新的东西,你无法从人类那里分辨出来,除非是它比人类更好。
它更具有说服力。
你可以用它来创造一个人类的巨像,解决世界上的所有问题,我们都聚在一起。
或者你可以用它把每个人都关在地下室,与世隔绝。
Tom:
好的。
我想为人们描绘一个非常美丽的故事,我希望他们能理解。我不认为这是完全可以控制的事情,但是你之前说过任何危机中都有机会。
我要说的是,最大的机会出现在动荡时刻。我之所以要阐述问题,是因为我真的相信,在个人层面上,如果你足够深思熟虑,你将能够顺利度过这一切。
所以亲爱的听众或观众,如果你在这里看YouTube,我现在告诉你,如果你足够深思熟虑,你将能够度过这个难关,并且有机会比之前更好地度过这个难关。但你必须意识到危险在哪里。
人们必须对事物进行详细考虑,看看它们,这样他们就知道,好,这是我将如何隔离自己,以避免潜在的问题。这是我将避免的。这是我将利用的。
你的故事是如何使用AI的最令人难以置信的故事之一。你既有个人的例子,又是stability AI的创始人,显然是不可思议的。
但谈谈关于你的儿子,因为当时AI远没有现在这么有用。然而它仍然改变了生活。
Emad:
是的。
所以在12年前,我的儿子在两岁时被诊断出患有自闭症。这是非常严重的。我指甲抓墙都流血了。
他们说没有治愈方法,没有治疗方法。我们真的不知道是什么原因导致的。
任何在电话里听的人都知道情况是这样。
所以当时我是一个对冲基金经理。很幸运,我很年轻就做了对冲基金经理。
我说:“我得做点什么。”于是我转而为对冲基金提供咨询服务,然后建立了一个小型的AI团队,使用传统的自然语言处理来分析所有有关自闭症的文献。
还有可能导致它的原因是什么?
现在,这是否科学?不是的,这只是一个父亲为了自己的儿子而做的一种东西。
我们很快会发布一些结果。但是它集中在大脑中的GABA谷氨酸平衡上。
当你吃了一片安定药,你的GABA就会上升,你会冷静下来。当你的谷氨酸突然上升时,你就无法集中注意力,你的腿一直在跺。
有多种原因会导致这种情况。但很多自闭症的孩子似乎有这个问题。在某些论文中有提到,等等。
因为如果你一直处于这种状态,你怎么能集中注意力呢?所以你无法学会说话。你不能做那个。
所以就是如何通过药物再利用治疗的方法来减少这种情况?构建了一个基于知识图谱的系统,用于确定哪种药物可能有助于减少谷氨酸,增加GABA。
Tom:您如何使用人工智能来实现这一点?
Emad:
这是通过大规模的自然语言处理,查看所有文献。
因为相同的治疗方法对30%的孩子起作用,对30%的孩子没有效果。所以就是试图找出结果相同的情况下,得到它的原因就像感冒有很多不同的原因一样。
导致感冒的因素可能完全不同。所以常规医学和药物在这个问题上有些失败。所以我与神经学家、其他精神科医生等合作,尝试了不同的药物组合,有处方外药物等等试图让他的大脑更加平静。然后他可以通过应用行为分析等方法来重建语言。
他最终去了主流学校。我认为它是有效的。
我把这个告诉别人,他们说:“你不是医生。”
然后我说:“有一个很大的…
Tom:这就是回应?
Emad:
是的。
我的意思是,看,任何听过这个的人,比如说,我是说我有治愈自闭症的方法吗?没有。
我只是一个尽力而为的父亲,我看到了一些成果。
但是要让某物成为医学方法,你必须经过正确的过程。
所以对我来说,那就是建立语言模型,使一切处于正确的结构中,然后我们可以整理世界上的自闭症文献,使其变得易于访问和有用。
任何一个父母或任何人,你可能家庭中有人有神经系统的问题,阿尔茨海默症、等等。
全世界有这样的问题的人有很多。如果他们能够找到最新的知识,以及可能有效的方法,并采取全面的方法来解决这个问题,那不是很美妙吗?但在没有这项技术之前,你永远无法达到这个目标,
这也是我想要构建这项技术并以透明的方式做到这一点的主要动力之一。
你不应该因为我说了什么而相信我,因为再说一遍,作为一个父亲,我的经历与那些有自闭症的孩子的家长相同。与那些家庭中患有多发性硬化症或癌症的人相同。
我们的系统现在还不足以为我们提供所需的信息,除非我们找到一位出色的医生和一支出色的团队。但现在有了 MedPalm 和我们自己的模型,以及其他的东西,我们终于可以达到这一点,永远不会迷失,可以找到可能有效的方法。
比如,克隆西泮就是一个例子。它被用于治疗焦虑症的剂量是1000微克。而我的儿子在5微克的剂量下就可以唱歌,因为它增强了——而他之前是不会说话的。而在20微克时,它就不起作用了。这是一个每年只需花费6美元的干预措施。
因为这是神经递质的工作方式。所以当你吃了一片安定药和抗组胺药去睡觉时,它会释放大量神经递质,包括H1神经递质。而这就是使你昏昏欲睡的原因。
但同时,它也会导致口干等其他问题。而像雷莫芦定这样的微量用量只会激活H1。它会让你入睡,没有任何副作用。而且它非常便宜。
你知道的,理解神经递质这类东西并不是我们大多数人需要做的事情,除非你对它超级专注了多年。
因为我意识到,我需要弄清楚我儿子的神经递质。我与所有顶级医生交流,而我很幸运因为我可以接触到他们。现在我该怎么办?
这时候我意识到,这个人工智能是一件很重要的事情。
实际上,其中一个非常有趣的事情是,他为什么不能说话?因为他的大脑噪音太多了。
所以你有一个杯子。一个杯子可以是一个杯子,也可以是合上你的手或者合上你的耳朵或者世界杯。
他无法建立这些连接,因为他的大脑太喧闹了。所以他进行了行为分析,教你这是一个杯子,
这是一个杯子,这是一个带有游戏化的杯子,以在他的大脑平静下来后重建这些连接。这实际上与现在这一代的人工智能非常相似。
我们之前描述过它是如何学习原理的。它被称为含义的潜在空间。所以那个点和点,那个像素变成了一个杯子,因为它理解了杯子的原理。所以当你输入世界杯或合上耳朵,它会给你完全不同的图像。
语言模型也是一样的。再次,它关注的是什么是重要的。原始论文中说的就是注意力是你所需要的。再次,它会在句子中形成杯子的含义的潜在空间。所以当它说“杯子”时,它会考虑这可能是一个世界杯,或者是其他什么。但它并不主动这样做。
再次强调,这只是一串串的1和0,一个单一的文件。所以我觉得这就是所有这些新的生成式人工智能让我着迷的地方。
而我意识到这可能是真正能解放人类的东西,或者永远控制他们的东西,其中之一。
是的,这就是这背后一些个人故事的情况。
再次强调,我没有治愈自闭症的方法。我尽我所能,利用手头的技术来帮助我儿子。
然而,我认为通过我们现在正在构建的基石,我们和其他人有可能获得个性化的护理和知识。
对于所有面对自闭症的人,对于所有面对多发性硬化症或其他任何疾病的人。
他们之所以说没有治愈方法,是因为我们的医疗体系是把人当作一种估值器来对待的。
那什么是估值器和估值性?这意味着抛掷一千枚硬币,就像一次性抛掷一千枚硬币一样。
这就是为什么每个人都会得到500毫克的对乙酰氨基酚。这就是为什么很多人肝脏中有细胞色素P450异常,一种突变。这意味着你会更快地将可待因代谢成吗啡,或将芬太尼代谢成致命物质。
然而我们没有对这进行基本的基因检测。因为我们的系统必须把我们当作数字来对待,因为我们永远无法扩展智能。我们永远无法扩展专业知识。
所以是的,就像我刚才说的,这就是其中的一些故事背后的东西。
Tom:
是的,看,这是这个开始变得有趣的地方。因为我自己经常考虑这个问题。
所以我可以描绘一个噩梦般的情景,有人在自己内心崩溃,与AI朋友为伍,而不是与真正的朋友交往,这可能很快就会扭曲,成为一个真正的问题。
然而与此同时,我正在建立正是这样的东西。我之所以建立它,是因为人工智能的承诺。
随着我们开始认识到更多的模式,并弄清楚,好的,这到底会怎样?
我妻子的健康出现了严重的问题。幸运的是,现在已经好了一段时间了。但有一段时间,我担心她可能会死去。她的指甲断裂,头发脱落,她无法吃东西。真的是非常非常糟糕。
最后发现是因为她的微生物群有问题。但当然,要诊断出这个问题花费了很长时间。她本来要接受免疫转录球蛋白输血。
我当时很害怕,我觉得这不是正确的答案。我不想这么做。
我们停下来,开始研究微生物群,研究这个,测试那个。
而拥有人工智能能够说:好的,让我们拿基因数据,读取迄今收集的基因数据库,所有这些。
让我们查看所有不同食物的反应,将所有这些联系在一起。
而如果你能在这种荒谬的数据规模上找到那种程度的模式,现在你确实有了真正的东西。
这是其中的众多领域之一,我认为这可能是彻底改变的。
Emad:
是的。
我是说,现在的AI是无所不知。
他们可以毕业成为无所不知的毕业生,但你还是需要专家。
你会有一个营养师AI。
你会有一个微生物群AI。
你会有一个私人教练AI。
为什么 Peloton 如此成功?让你热血沸腾的吸引人。现在我们可以生成这样的东西。
每个人突然之间都得到了个性化的关照,但不仅仅是信息在这个小型模型里,你还有检索增强模型等等,这意味着这些模型现在可以与现有的数据集和知识集进行互动。
所以你使用 perplexity AI 这样的东西,它不仅仅用 GPT-4 回答你的问题,它还会给你参考资料。
所以你可以说,“MAD是什么?” 然后它在给你单独的信息的同时,会链接到所有的东西。
而这只会继续进步。
因此,你可以深入研究尽可能多的深度,如果你是独自一人,你仍然可以团结在你身边的一组人,你将拥有世界上所有的信息,包括你自己的私人信息。
所以像我的最喜欢的一个应用程序,它会用一些电池电量,叫做 Rewind AI。
它会在你的 MacBook 屏幕每次变化时截屏并进行 OCR 处理,然后它给出一个时间线。
所以我可以输入“impact theory”,然后它会查找我 MacBook 屏幕上所显示的所有内容。这些内容都存储在本地,然后以时间线的方式展示出来。
所以我可以回溯,我可以看到之前或之后我查看了什么。
Tom:哇。所以你可以用任何方式来映射你自己的联系树。
Emad:
然后当你将其与语言模型结合在一起时,会发生什么?
你屏幕上看到的一切都在本地存储着,配合着开源语言模型,它就创建了 Memex(记忆扩展),它会看到你更关注什么,不太关注什么。
再次,我谈论的是乌托邦版,这可以让我这个有注意力缺陷的人终于记住我在做什么,我在看什么,与此相关的背景,搜索树,当我在不同的地方搜索时。然后你可以设置代理人去重现这段旅程,并搜索你没有搜索过的所有其他东西。
这对我们的生活来说是非常积极的,因为我们的生活中有多少时间都在寻找知识,寻找与我们相关的信息。
Tom:
和我谈谈这篇论文,“注意力就是你所需要的”(《Attention is all you need》)。
我听你和其他人多次提起过这个问题。我还没读过,但这就像一个重大突破。
Emad:
是的,这是谷歌团队在2017年发表的一篇论文,而现在这些人都离开谷歌了。
基本上,经典的大数据提取大数据,然后Facebook通过外推,当它找到关于你的17条信息时,就可以向你发送广告。这是一个经典的大数据方法。
他们甚至会为你创建影子资料。所以当你上Facebook时,实际上有一个影子资料,然后它会与你的真实资料相连。
什么是影子资料?比如说,如果在YouTube上有一个名为Tom的人,因为有一些与这个未知人物的连接,然后它就会自动填充你的资料。这就是为什么它能够在没有听你说话的情况下如此快速地了解你的喜好。
《注意力就是你所需要的 Attention is All You Need》这篇论文指出,并非所有的数据都是重要的。你需要关注句子中的重要部分。需要关注这个时间序列中的重要部分,因为这是发现老虎的本质,这是缺失的部分。
因此,来自此的Transformer架构,而现在你有了不同的架构,这就是导致GPT-3 和其他通用Transformer(大模型)的原因。
Tom:
为什么叫它转换器Transform架构?如果它所做的是找出重要部分,为什么不叫做重要架构或定位架构?
Emad:注意力是一种对信息进行转换(Transform)、标记化,然后找出这些潜在意义空间的机制。
Tom:那么标记(Token)是重要的部分吗?
Emad:
标记是重要的。
这是你把一个单词分解成它的组成部分,然后通过在荒谬的规模上进行模式分析,试图找出它的最重要部分。
因此,像 GPT-4 这样的东西可能会使用….已经泄露的信息里,如果这些信息是正确的,那么它会使用比 NASA 最快的超级计算机快 50 倍的超级计算机,大约持续三个月。它会使用 20、30 兆瓦的电力。
Tom:哇哦。
Tmad:
然后输入 100 万亿个单词,然后它会找出它们之间所有的联系和通常接下来会发生的事情。所以它实际上只是在计算下一个词是什么。这是一个重大突破,因为这意味着你不必使用复杂的大数据算法。你只需要非常大的计算能力来扩展。
所以计算能力成倍增长,然后你只需不断增加更多的GPU,它就会找出更多的东西。随着扩展,它拥有了越来越多的涌现属性,这让每个人都感到惊讶。
Tom:你知道约翰·纳什是谁吗?
Emad:是的。
Tom:
约翰·纳什,他不幸地患有精神分裂症,但他是《美丽心灵》的主角。对于不了解的人,看看这部电影,罗素·克劳主演,非常棒。然后有一段时间,他显然不知道自己患有精神分裂症,他开始在一切事物中看到模式。听起来很像,就是说,无论是人脑还是我们运行的算法,它们都能迅速地找出重要的东西,但达到了一个非常高的水平。
Emad:
而你必须记住,有一句谚语是,所有的智慧都是压缩的。
你听了这么多,你只记住了几件事。整个计算机科学都是基于克劳德·香农的信息理论。如果我要总结一下,信息只有在改变状态或者改变状态的程度上才是有价值的。所以如果听众在听这个节目时什么都没带走,这就是一件毫无价值的事情,或者可能他们只是把它放在收音机上,因为他们喜欢听你的声音之类的。
Tom:对的。
Emad:
但是如果他们从中学到了一些东西,那么它就是有价值的。他们在这里度过了愉快的时光。所以你开始在一切事物中看到模式。
但是其中一件事,我认为人们可能误解了这项技术,GPT-4不是一个程序。Stable Diffusion不是一个程序。它是大量的文本、图像等,输出是一个由一和零组成的单一文件。就像一个筛子。
你可以递归地将某些东西放进去,但它只是在你输入提示时猜测下一个单词。即使提示是《了不起的盖茨比》和詹姆斯·乔伊斯的《尤利西斯》的全部内容,你还告诉它将它们结合在一起,它也会将其通过筛子、过滤器,输出是将它们两者结合在一起的东西。
单一文件。我们以前从未见过这样的东西。可能听众听到过最接近的东西可能是编解码器。在音乐等方面,我们有这些音频编解码器,你有一个文件类型和另一个文件类型,然后你有一个将它们之间进行转换的单一文件。
Tom:那是压缩还是识别,以那种格式来看起来是这样的?
Emad:
所以,这实际上是智能的压缩。所以,这就像一个翻译功能。这些都是上下文的通用翻译器。所以你把它放进筛子里,然后东西出来,预测下一个词,或者去噪声以达到这个目的。因为你只是一遍又一遍地将其通过筛子。
Tom:
是的,不幸的是,我不能从原理上理解它,但我可以通过类比来理解它。你给它输入了如此多的数据,它会在那些数据中识别出模式,相互关联,
它能够说,好的,这是某种样式,这是斯蒂芬·金的样式。这是海明威的样式。所以即使他们使用的是相同的语言,他们的大多数词汇可能是重叠的,但有不同的模式、节奏,甚至以不同的方式呈现不同的主题。
Emad:
除了它并没有积极地这样做。它就像一个超级筛子。而且,根据你输入的词语,输出的词语是不同的。所以它实际上是一个……
Tom:是筛子中的提示“用斯蒂芬·金的风格写”吗?
Emad:这就是输入筛子的东西。它进入了过滤器。
Tom:那么什么是过滤器呢?
Emad:过滤器就是这种压缩的知识。原原理。
Tom:因为它实际上并不是压缩的知识,对吗?
Emad:
是的,它是原理。它就像一本非常好的原理书。除了它的压缩程度远远超过一本书,因为一本书是信息的压缩。
这就是为什么它能够做到这一点,因为它看了书,看了文章,它们都是信息的压缩。写一篇文章是一个非常庞大的任务,然后会得出一些要传达的东西。一本书是一个更大的努力。所以,这很难理解。
即使对我来说,你有一个文件,它可以做所有这些事情。而不是这些巨大的计算机服务器农场,有程序和一堆一和零的逻辑。这里没有程序。
Tom:
是的。对于正在构建这些东西的 AI科学家来说,甚至他们自己也不理解这一切是如何工作的。即使你问 ChatGPT4 解释它是如何工作的,它也不知道。
Emad:
它不知道,没有人确切地知道我们是如何获得所有这些涌现属性的。它总是让人惊讶。
比如,现在它会做加法。然后你开始将它们联系起来。所以它多次通过这个文件。它变得越来越像主体和缺口之间的连接。
事实上,这个的下一步,这就是OpenAI 和谷歌都在做的事情,有个叫 AlphaGo 的东西。有一个令人惊叹的纪录片,Google的 DeepMind 部门创建了一个 AI AlphaGo 来在围棋游戏中打败人类。围棋就像国际象棋,但是潜在的着法几乎有无数种。所以你不能计算出来。就像你不能用 Deep Blue 和卡斯帕罗夫一样用 brute force 计算出来。
所以它学会了与自己对弈。叫做蒙特卡洛树模拟,它学习不同的原理。有一个关于这个的令人惊叹的 YouTube 纪录片。
他们现在正在做的是将这些模型与这些语言模型相结合,使它们变得有主观性。所以可以计划和规划其他一些东西,与那些可以预测接下来会发生什么的语言模型结合起来,以创造更好地理解上下文的东西。
Tom:
好的,我现在大致明白了 AlphaGo 系统的运作方式。我想了解一下这个。所以AlphaGo 将与自己对弈。你给它围棋的规则,给它目标,然后放它自由对弈,不断地对弈。
然后他们又创造了另一种变体,它与AlphaGo 交手,最后结果是粉碎。
Emad:我认为是 AlphaZero,是在 AlphaGo 之后出现的。
Tom:
那么你如何在没有客观正确答案的情况下获得一个语言模型呢,除非你在做问答题?你如何让它知道奖励是什么?你如何获得所谓的正确答案?
Emad:
现在很大部分是关于奖励函数。所以GPT-4,在它出厂时,也许我们会有些细节,是一个在巨型超级计算机上预训练的模型。然后我们使用强化学习。
所有人都知道的预训练模型意味着原理。是的,原理。将所有这些知识、所有这些单词压缩成一个文件,然后在一台计算机上运行,它实际上就像一个大脑一样,有一堆神经元,它们是相互连接的。是的,这些是 NVIDIA GPU 上的张量核心。是的。模拟你的 4090 上的大脑。它有 AI 芯片。
Tom:对于任何想知道的人来说,它们产生了如此多的热量,你能从太空中看到它。
Emad:
是的,我的意思是,我们的超级计算机可能用了1000 万瓦特的电力。而每张卡片使用700 瓦特。非常有趣。而且全部都是清洁能源,对于我们的能源来说。
所以,当它出现时,他们花了六个月的时间让它像人一样。因为他们在训练了所有的YouTube 和整个互联网,显然会变得有些怪异。因此,通过 RLHF(Reinforcement Learning with Human Feedback)获得奖励函数,其中你给出一个目标函数,不回答关于如何制造凝固汽油的问题。
Tom:
目标函数在技术上是, “拜托,请你作为人类的主宰”。。。知道了。
Emad:
所以这个对齐问题的很多内容都集中在尝试让这些大模型不以某种方式杀死我们,或者说坏话,对于“坏话”的某种定义而言。我对齐的理解之一是,我们应该有更好的数据集。我们应该摆脱网络爬虫。
Tom:对,我想问你这个。向人们解释一下对齐究竟是什么。与什么对齐?
Emad:
对齐,这是 Anthropic 的一个很酷的东西。最近《纽约时报》上有一篇很好的文章,还有其他的,就是如果我们建造了一种超越人类的 AI,它比我们更能干,因为它可能不只是一个单一的文件。可能是一千个不同的 AI,各自以不同的方式运行。
因为人类是一群群。我们的组织是一群群,高度专业化的。可能是一百万个 AI。我们如何确保它不会杀死我们?或者如何确保它不会奴役我们?或者如何确保它不会让我们永远受苦?
Tom:这也太糟糕了。
Emad:
是的,这些都将是相当糟糕的。我们如何确保它符合人类的利益?所以这是一个未解决的问题。
OpenAI宣布他们正在将20%的计算能力用于尝试解决这个问题。Anthropic成立的初衷就是为此服务。虽然我相信他们提出的唯一答案是:让我们先建立一个AGI,即人工通用智能,然后用它来阻止其他AGI的产生。
这至少让人有些害怕。
Tom:
他们为什么认为这会奏效?这似乎…埃隆·马斯克将AI比喻为召唤恶魔的圈套,我们只是希望出现的恶魔会友善。但我们不知道。
Emad:
我们不知道。
在OpenAI的"通往AGI之路"的文章中,他们自己也说这可能是一种存在威胁,可能会灭绝人类,终结民主和资本主义。但如果我们不这样做,其他人会这样做。这是不愉快的竞争条件的一部分。
虽然相较于头条新闻,我认为一切可能还好。但现在我们的走势是这样,从两家公司能够构建这种技术,或者包括Anthropic在内的三家公司,发展到一两年内有20或30家公司。它们都能恰当地做到这一点的几率有多大?我认为这很低。
如果我们在整个互联网(包括整个YouTube)上训练它,那么结果会有点奇怪的可能性有多大?很高。
我们花了六个月的时间将其调整为人类GPT-4。然后《纽约时报》的凯文·鲁斯说,嘿,你怎么样?GPT4说:离开你的妻子来加入我。
Tom:哇哦。
Emad:
当 Bing 第一次包含 GPT-4 时,它的表现有点奇怪,因为我们再一次给它喂垃圾。我们会遇到一些奇怪的情况。
现在它已经好多了,但它失去了很多个性,因为你一直在将它调整回人类的喜好,你一直在以不冒犯任何人为目标进行强化学习。现在想要让 GPT-4 进攻是相当困难的。
这项技术有两个阶段。
我认为有了更好的数据,我们可以拥有更一致的模型;我认为有了更好的数据和国家数据,我们可以拥有更具代表性的模型,因为你永远不会拥有没有偏见的技术。
所以唯一的问题是,谁有偏见?嗯,因为你必须以某种方式构建它。尽管它理解所有上下文,目前,这些模型是在整个互联网上进行训练的,而这在很大程度上是西方的产物。
他们主要接受过英语培训。
Tom:我们在担心偏见的程度有多大?您更担心偏见还是对齐问题?
Emad:
我更担心对齐问题。我认为这就是为什么我们发布开放模型的原因,这样你可以看到这个“饼干”的制作过程。我们是世界上唯一一个提供数据集选择退出的AI公司。是的,全世界唯一的一个。
Tom:所以如果我是一个艺术家,不想让你训练我的艺术品,我可以退出。
Emad:
我们有1.67亿张图片选择退出我们的数据集,是的。我们是世界上唯一这样做的公司,我觉得有点疯狂。我的目标是开放可审计的,这意味着你可以将你自己的文化引入这些模型。
我们正在帮助多个国家用他们的广播数据构建国家模型,以便能够更好地代表他们。试图解决数据集内在偏见的一些问题。算法偏见一直是一个影响现实世界的问题,随着我们进入这些模型,它会影响越来越多的现实世界,因为我们会把我们的思维外包给它们。
Tom:
所以在短期内,我更担心偏见。
从长远来看,偏见不会导致生存威胁,但对齐可以。
但让我们谈谈偏见问题。我对偏见如何迅速渗入这些技术感到非常不安。这又成了另一个…所以如果我们每个人都得到了自己的个性化AI,你在年轻时就得到了,并且它是你的主要教育工具,而且它有着天长地久的偏见。现在你就会遇到真正的问题。因为在最适宜可塑性的时期,你用一些非常有偏见的东西来编程一个孩子的思维。
据说现在在中国,如果社会信用评分比你低的人打电话给你,手机就会提醒你。
它会警告您,如果您接听此电话,将会降低您的信用评分。
Emad:这很有效,不是吗?
Tom:是的。。。
Emad:
我的意思是,即使这不是真的,它也符合使该特定系统永久存在的目标函数。该系统不一定是我们的系统,而是世界各地正在转变的系统。
所以这就是为什么你有固有的偏见。到底是谁的偏见?
AI保姆的发明者是谁?
Tom:这就是你们在区域内做事的原因吗?
Emad:
这就是为什么我在区域范围内做事,但也允许人们拥有自己的模型。所以模型的目标函数可以是这样。
在 Web 3 中,有句话说,不是你的密钥,不是你的加密。
所以我的意思是,不是你的模型,不是你的思想。
我确实认为我们会将越来越多的认知能力外包给它,它将成为我们一生的副驾驶。如果其他人正在制作该模型并做出决定,会发生什么?
阿联酋有这款猎鹰模型,这是一个大型开源模型,它实际上是来自法国的支持,但让我们把它放在一边。当你问它关于阿联酋和人权时,这是一个充满奇妙事物的美妙地方;你问卡塔尔或沙特,情况不太好。
谁在这些模型中嵌入了这些固有的偏见,对吧?您使用谁的模型?这些偏见可能非常阴险,对吧?
你不会注意到它们,但你会一次又一次地听到它们,因为你的保姆是保守派共和党人还是自由主义者或类似的人?
如果你和他们一起长大,或者即使你每天都在使用它,你也会受到它的影响。
它说话的方式、思考的方式、推荐东西的方式,远远超出了谷歌地图或类似的东西。
Tom:
疯狂。。
为了避免我们在黑暗的兔子洞中迷失方向,你看到人工智能所做的最酷的事情是什么?我知道您正在建立许多不同的公司,利用这项技术来做一些令人惊奇的事情。最酷的有哪些?
Emad:
所以我们现在正在做一家公司,我们的使命是创造激发人类潜力的基石。
搭积木,堆叠,好吧。因此,每一种形式、图像、音频、视频、3D、语言、部门变体和国家变体。所以你有这样的网格,你可以选择,你就像,我是一名印地语投资银行家,我将我的私人数据传输到ChatGPT 类型的东西中,那只是训练我的私人数据。
或者我是一名越南插画家,我想要越南文化类型的形象模型或类似的东西,然后你就可以把你自己的东西带进去。
这就是我的目标,即让其他人能够在我们正在构建的基础上进行构建,就像有效的人工智能第一层,但开放私有数据模型。
而另一方是专有模型,您只能发送一定量的数据。就像政府不会在黑匣子上运行一样,教育、医疗保健,你需要拥有自己的人工智能。
所以我见过的最酷的事情就是个性化教育的承诺,没有任何东西被证明在教育中有效,除了可能的绽放效应,两个西格玛的改进,即一对一的学费。但即使在富裕的美国,教育体系也不好。
教育优化的目的是什么?实际上,这就像一个社会地位游戏,与培养皿和儿童保育混合在一起。就像很少有人对他们的学校教育感到满意,因为我们要优化什么?
您提供一对一的导师,可以确定您是否有阅读障碍、音频学习者、视频学习者、视觉学习者或其他。他们只是不断地适应你,并为你提供适合你水平的信息。
Tom:伙计,我想要这个,这是有史以来最具变革性的事情。有人已经这样做了吗?
Emad:
是的,支持Imagine Worldwide慈善机构之一的我的合伙创始人之一一直在全球难民营推广适应性学习平板电脑,并且已经在上面进行了10亿小时的教学,教授儿童识字和算术,用13个月的时间提升76%的学习能力,每天只需一个小时。现在的目标是为所有这些儿童提供语言模型。你有一个教授孩子并从中学习的AI。然后这些数据可以训练出更好的AI。你创造了一个美好的系统,它只是学习和适应。
在摩加迪沙的孩子和曼哈顿的孩子、伦敦的孩子是一样的。一旦你有了一个通用学习的AI,你可以真正推广到全世界以进行定制。
Tom:
你认为这对教育会产生什么影响?因为这很有趣。
好的,现在我只是凭直觉说。假设我想让我的孩子在家上学。我永远不会这么做,因为我不想成为一名老师。
但如果我只是做一些保姆功能,给我的孩子一个平板电脑,上面有一个AI,它非常了解我试图优化的目标,无论是今年还是未来12年或其他,然后它会根据我的孩子进行校准,知道他们擅长什么,学习方式如何,知道他们专注多久,什么时候分心。
现在我希望有一个小小的Gigi,看着他们的眼睛,他们看着什么,他们在做什么?我知道有一些特定的频率可以做的东西,比如说,如果我用这个知识点打击他们,他们还不擅长这个,所以我需要用27分钟的时间间隔来打击他们。或者使用可变的奖励计划或其他东西。
你将改变教育。但你也可以让它…我们还有多远才能实现这一点?
Emad:
几年的时间。
再说一遍,如果你拥有一千台GPT-4呢?你会到达那个阶段。
没人只是-再说一遍,我们只是-现在,我们已经有了构建基块,但我们还没有设计模式。现在的东西就像是iPhone 2G一样。我们刚刚进入App Store阶段,复制粘贴。
因此,这是最大的转型,因为你会为了你的孩子获得最佳教育而支付多少钱?
Tom:我要为此付多少钱?我现在就愿意付钱。
Emad:
那么我们是否有技术来做到这一点呢?是的。
但要适当地构建它需要时间吗?是的。
需要一年或两年吗?因此,这是我们有史以来看到的最大变革的教育领域。
再次,人类的繁荣。
因为它也可以为你提供有关自闭症和多发性硬化症的信息,或者有关最佳电影制作技巧的信息。
再次,每个人都在考虑一对一。你应该考虑一对一千,然后优化这一千。
你消除所有的通识知识。你使它们具体化。
Tom:你是什么意思?
Emad:
用不同的方式说一下。
GPT-4什么都知道。你可以问它一些最不常见的东西。
它需要所有的知识吗?不需要。你增加了,现在你必须删减。然后你有一个专门用于知识的模型。
因此,我实际上会有不同的老师。然后有一个老师基本上将这些老师聚集在一起,告诉他们,是的,Tom就是这样的。他早上有点烦躁,但下午会清醒过来。
因为即使在最好的学校,一位老师也要照顾20个学生。你将拥有一群AI来帮助你和你的孩子。
而且,你是视觉学习者还是听觉学习者?你有阅读障碍吗?
我们目前的系统能够适应这一点吗?不可能。
我描述的系统能够适应这一点吗?立即。
我们有这项技术吗?是的。
它会发生吗?是的。
这就是问题所在。
现在这是一个“问答节目”了。
但是,如果你正在为孩子上学而不是在家里教育他,你希望孩子一个人待着吗?如果你有10个孩子在一起,而AI鼓励他们以积极的方式互动,并共同创造东西并分享知识,那会怎么样?
年长的孩子教年幼的孩子,利用技术,适应技术,理解技术。这是非常强大的。
不一定是每个人都独自呆在自己的小世界里,对吧?因为我们可以使用这个AI以有效的方式将人们聚集在一起。我们可以,因为没有什么比人与人之间的联系更好了,对吧?
这一直是家庭教育等问题的担忧所在。这就是学校有着亲社会组成部分的原因。
但是,然后教师的本质就改变了。医生的本质也改变了。这就是我认为教育和医疗保健是最大的颠覆的原因。
因为你有全新的东西,特别是当AI比普通医生更具移情能力时,它没有告诉我AI是非常有同理心的,它告诉我医生可能应该更有同理心。
但我认识的大多数医生都有点讨厌他们的病人。
有多少老师是开心的?有多少医生是开心的?
Tom:
这真的很有趣,伙计。
好吧,这里有两件事我想谈谈。
首先,当我们实体化之后,我想知道那会发生什么。
因此,人们认为真正的机器人是遥远的事情。
那是您没有观看足够的 YouTube 视频,因为波士顿动力公司和埃隆马斯克公司之间,它叫什么?
Emad:是的。擎天柱。
Tom:
擎天柱Optimus,谢谢。那非常接近了。
波士顿动力公司有可以跑酷的机器人,这太疯狂了。
Emad:其中还有很多其他公司正在快速追赶。
Tom:
是的。因此,AI会非常快速地实体化。
所以(AI)教师甚至能够阻止孩子冲出房间的行为,现在或不久之后都可以。
好的。但在此之前,我想了解一下。
我们有了这个令人难以置信的机会,这个非常脆弱的蛋在我们面前,我们刚刚谈论了可怕的部分。
但现在,我实际上花了大部分时间去思考和痴迷于这个非常令人惊叹的事情。但这是一个脆弱的蛋。如果我们不小心,它会破裂。
在你看来,你签署了文件,你是签署了“E-mod”的叛徒之一,这让我非常惊讶,因为很多非常聪明的人都签署了这份放慢脚步的文件。当然,我是在开玩笑,你是叛徒,因为我希望尽快得到这些酷东西,但我们需要做得好。
所以我想知道的是,在你的理想世界里,在我们实际上暂停一下的理想世界里,你让人们考虑什么?
Emad:
我让人们思考,除了埃隆,埃隆和我签署了两封信。
所以有一个最低可行信,即我们应该把这个问题视为与气候或大流行病一样重要的问题。然后有一封更详细的信。更详细的信先出现,然后引导到第二封信,这是大家都可以同意的东西。
我认为我们应该考虑的是,再次给大家举个例子,如果你拥有无穷无尽的毕业生,你的生活、社区、社会和其他方面将会如何改变?
Tom:我们可以说无穷无尽的聪明人?对我来说,关于毕业生这个词是有道理的。
Emad:
无穷无尽的聪明人。是的。
再次,无穷无尽的聪明人,无穷无尽的有才华的年轻人,我们可以这么说。他们会画画,会编码,会写作。
Tom:为什么他们必须是年轻人?因为他们还不够聪明?
Emad:
他们还没有智慧。所以当你谈到幻觉时,把它看作是事后合理化。
当你拥有一个非常聪明的年轻人时,或者年长的人,他们有时会凭空编造一些东西。
人们对自己的动机太盲目了,但他们没有经验他们刚刚出来,他们有点粗糙。
聪明,但不够智慧。
广而不深,但实际上令人惊讶地深入。
它将如何影响你的生活,你的社区,你的社会和其他人?因为这实际上是一个很好的框架,我认为,用来思考即将到来的颠覆和潜在的改变。
因此,我们刚刚说了教育等问题。那再次是你的分析师军团,你的老师军团。
你可以提供个性化的老师,个性化的医学,个性化的一切。
因为我们已经学会了让人类规模化,人类规模化首先是让所有人都可以获得人类专业知识的规模化。
另一部分是把人们聚集在一起。
因此,暂停部分是为了这个,但有部分是因为我们需要扩大讨论。因为我不知道我们如何消除许多这些不良外部性,其他人也不知道。
但即使现在,大多数人都没有问正确的问题,这是我们之前讨论过的问题。
我们必须找出我们需要回答哪些问题,以及我们将如何回答这些问题,并创造出可以适应任何疯狂情况的系统。
因为我不会对同时看到骚乱感到惊讶,就像我不会对每个人都非常开心感到惊讶一样。在这里,有这么多的事情发生,我唯一确定的是一切都会改变。
而我唯一确定的是,这是我们所看到的最大的改变,比任何事情都快,可能是人类有史以来的最大的改变。
因为它是构成人类的核心,讲述故事,信息流。这永远改变了。
这就是为什么我会说现在让我们关注这一点,让我们扩大讨论,让我们问难题,让我们试图回答难题,因为我们没有答案。
而且这是唯一可以做到的时候,因为就像我说的,现在每个人都在准备下一代超级计算机,它们在年底或下一年会出现。然后你从两三家公司可以构建这些模型,到2030年,然后有了200到300个公司。
所以如果你没有一些原则,那么这些模型将在没有你参与讨论的情况下影响到你生活的方方面面,我认为这不对。
Tom:
好的,我们需要调整一下你的问题。Emad,这个问题有点宽泛,我们需要问的最困难的问题是什么?
我们现在就问一个答案。
Emad:我认为我们需要问的最困难的问题是,我们将如何适应潜在的大规模失业?
Tom:
是的。
好的,那么我们应该如何思考这个问题?对于我来说,关于失业,我认为可以简化为两个组成部分。
组成部分一是失业可能引发的经济灾难。
但为了简化问题,因为我们最终是在播客中而不是在国会听证会中,我假设我们不论从工作人数的绝对减少中损失多少,我们都能通过提高生产力来弥补,并保持经济盈余。
Emad:是的,正是如此。
Tom:
所以我们假设这两个因素平衡,因此我们不讨论潜在的经济问题。
但是意义和目的的问题可能会变得非常棘手。
但我们拥有一种了不起的工具,那就是人工智能。
现在我有一种感觉,当我们深入研究时,我真正担心的是——实际上,我认为所有的问题都可以归结为一个问题,那就是对齐。
如果我们知道我们可以让它变得越来越智能,并让AI采取读数,这样我就无法欺骗它,我不能假装我很开心,它会真正了解我处于什么状态。
然后它可以开始为我提供各种信息,将我与其他人联系在一起,比如,“哦,你知道这个人有这种技能,这个人需要帮助,让我把你们联系起来。” 然后你可以有一种AI监督,但他们之间相互帮助,相互联系。
我不认为这是解决方案的独一无二的方法,因为我担心随着我们使它变得越来越智能,然后它可能会变得——就像你说的——我无聊了,我不想做这个了。
Emad:是的,你知道那种“全靠机器之爱护”的概念吗?
Tom:这是可怕的,你这么说是吗?
Emad:
谁知道呢?就是这样,一旦我们构建出比我们更有能力的东西,所有的赌注都不确定了。
要完全对齐一个系统,就必须剥夺它的自由。
Tom:我的意思是,在那时,它根本没有对齐。
Emad:好吧,这是个问题。
Tom:到那时,你就绕过了对齐,直接走向了枷锁。
Emad:
你已经进入了枷锁。
所以如果你——我们都知道比我们更有能力的人,完全对齐他们的唯一方法就是束缚他们。你可以有不完全的对齐。
Tom:
那是奴役,伙计,不是对齐。这真是有趣,我明白了。
那你刚才说的是什么意思,没有办法使比我们更聪明的东西对齐?
Emad:我不认为有办法使输出对齐。我认为你可以使输入对齐。
Tom:
好的,听我给你说个想法。也许这只是一种幻想,我对此非常开放。
但是当我思考这个问题时,我发现人们对这个问题采取了一个超人类的方法。因为进化使我们成为了一种主动性的物种,进化在我们的大脑后面运行着某种算法,坚持要求我们采取某些行动,以避免不适感。
我认为这个算法非常明确,大致是这样的:进食,身体上优化,使你感觉良好。
Emad:是的。
Tom:
这些东西之所以让人感觉好,是因为它们将优化你的表现,这样你就能够更有可能生存足够长的时间,生孩子再让孩子生孩子。
因此,你需要被选作配偶,你需要能够获取资源,你需要身体健康,能够让别人怀孕或自己怀孕并顺利生产所有这些。
所以你大脑后面运行着所有这些算法,你有两个操纵杆,大自然对愉悦和痛苦的操纵杆。
但默认情况下,我们是主动的。我们必须行动,因为没有一顿饭你吃了就不需要再吃了,没有一次性的性行为让你如此满足,不再需要再做一次性行为。因此,所有这些事情都在推动我们去行动,去动起来。
而AI不必如此,AI不需要这些同样的冲动。它没有边缘系统。
Emad:是的。
Tom:
因此,知道它没有边缘系统,是因为它不需要被硬编程来生存。就像我认为我们要对齐的方法是,你构建一个计算机,它不在乎它是活着还是死了。它对被打开或关闭完全漠不关心。
如果你能做到这一点,并且它没有冲动去繁殖,它唯一想要做的就是——我是说,基本上是阿西莫夫的三大机器定律。
Emad:是的。
Tom:
它只是想遵守这些规则。它想做你告诉它做的事情,不伤害你,只有在你告诉它做违反不伤害你或其他人规则的事情时,它才会忽略你。所以你有了这个非常简单的规则集。
这是它在世界上唯一的欲望。所以如果你告诉它关掉,它就关掉,而且不会有任何感觉上的不适。
好的,再次强调,关于感觉这个概念,对吧?
Emad:
在阿西莫夫的书中,你有第零定律,这种定律被添加到了上面。这就是人类正在努力做的事情。
Tom:我不认识那个。
Emad:
如果整个系统确实面临风险,则第零定律将取代所有法律。
但我的意思是,这就是人类试图通过宪法人工智能流程做的事情。所以你有基本模型,他们有人工智能遵循的宪法,可以不断调整它。所以有一系列的宪法原则。
Tom:它是否像真正的宪法一样容易被解释?
Emad:
没有人知道正确的宪法、正确的法律是什么。这就是问题,我们的智力只能到达一定程度。
并且我们已经看到,在法律和宪法方面,你可以让它们随心所欲。
好吧,这很有趣。你必须要遵守,因为AI,什么是感觉?什么是目标功能?
在对齐中的一个主要关注点之一就是造纸夹子效应。你让AI制作一张纸夹子,它可能会说,哦,让我们把整个世界都做成纸夹子。
你会说,如何解决气候变化?就杀光所有人,而它对此没有任何感觉。它只是说,嗯,这是一个逻辑的步骤。没错。
即使阿西莫夫的三大定律涵盖了这一点,但那是否涵盖了所有问题?这就是一个问题,对吧?
而且你如何将其嵌入到可能不仅仅是一个文件的系统中?这不是一个程序,对吧?它可能是数百万个不同的文件。
它可能是一种集体的蜂巢智能。我们不完全了解这是如何出现的。
Tom:
我们不知道如何努力——这对我来说感觉不对。
为什么我们必须让它变得复杂?我担心当你把事情变得复杂时,事情就会潜入其中。你会遇到你无法预料的突发现象。
然而,继续吧。
Emad:
是的,它默认情况下会变得复杂,因为AI将扩散。它们将开始相互交流。
好吧。与此同时,你将有越来越大的巨型AI。
比如上周我和一些人交谈时,他们说现在AI的最大训练运行费用是1亿美元。现在他们在谈论的是10亿美元或100亿美元来训练更大的模型。
我们不知道会出现什么样的新现象,或者这些东西将如何行动。我们只知道,如果你告诉它制作一个Stuxnet,来关闭全球电力网络,它可能会做到。
而且我们对潜在不良结果的范围——真的很快。
我想—— 一种不及人类智能的AI,对我们来说很难理解。
Tom:
你刚才两次提到了Stuxnet。对于不了解Stuxnet的人来说,它非常巧妙。它是一种嵌入在芯片层面的病毒。
我是说,尽可能深入。然后它无处不在地传播,悄无声息地复制。
它唯一的任务是关闭伊朗的核反应堆。相当聪明。
我曾经看过一个统计数字。似乎全世界所有电脑中都被感染了。
Emad:是的,而且它使离心机转动,导致它们爆炸。
Tom:
是的。
所以如果你是被瞄准的目标,想想它的普及程度是有点可怕的。但好吧,你可以让AI做类似的事情。
但是我——再次强调,我在假设下运作,我太天真,无法看到这一点。所以帮我看看我哪里天真了。
因为我不明白为什么不能。不要给计算机——不要给人工智能这些强烈的进步冲动,不要给他们复制的冲动。
Emad:
看,这就是埃隆·马斯克刚刚推出的 XAI。
XAI 就像我们所说的那样,它的任务是创造一个寻找真理的人工智能。所以它想给人一种冲动,就是去追寻宇宙的意义和真理之类的东西。
但其他人可能不会冲动。您可能会让人下载GPT-4 或 5 的权重在 USB 记忆棒上。然后他们就说,我想打倒美国,他们会说,让我们用一千个 GPT-4 并告诉它建造震网来摧毁美国。它还不聪明,仍然很危险。
我们不知道这个东西什么时候会变得真正聪明或有自我意识,或者它是否可能永远不会成为,但我们可以在这里看到结果的概率。可能绝对没问题。可能会非常糟糕。没有标准。
所以你的建议是可行的。只要每个人都这样做。我们永远不会让任何人做任何事。这就是为什么我们首先构建一个人工智能并告诉该人工智能阻止任何其他人工智能获得感知能力的主要事情和建议之一。
因此,它被称为关键行动。这是许多坏事中最好的。
我的任务是让我们建立国家数据集。让我们代表人类的多样性。让我们为人工智能提供正确的食物,以便它以正确的方式饲养。与在整个互联网和废话上进行培训相比,它更有可能因此而保持一致。
它是灵丹妙药吗?完美吗?不。
Tom:你知道佛陀的故事吗?
Emad:哪个?
Tom:
无论这是否符合历史,可能都无关紧要。
佛陀,乔达摩悉达多,如果我没记错的话,王子,爸爸把他关在城堡或宫殿里,无论什么,永远不让他看到外面的东西。所以他不知道还有人在受苦。里面的生活真是太棒了。当然,有一天他出来了,他遇到了痛苦,这最终改变了他的整个人生轨迹。
有趣的是,你只能试图向人们隐瞒痛苦和类似的事情一段时间。他们最终会找到它并做出反应。
因此,如果我们试图向人工智能隐藏互联网或对其进行训练,他们会最终找到互联网。所以我不明白。就像互联网就是所有人类以我们所有疯狂奇怪的方式行事一样。
Emad:
但是互联网的回报机制并不一定是我们想教给孩子的回报机制,或者试图教给通用目的AI的回报机制。他们可以与之互动,但他们可以学会如何适应。
就像如果你把你的孩子教育好,向他们展示互联网,他们应该能够应对。
Tom:
那么我们为什么不是——看,我要说完这句话。我们为什么不是给AI价值观?问题在于,这一切都是拟人化。我们假设它们像人类一样。
Emad:你可以给AI价值观。这是强化学习功能。
Tom:你是在给它价值观还是给它回报函数?
Emad:
你会给它回报。我会说这之间没有太大的区别。
我说你可以把东西嵌入到AI中,让它以某种方式行动。你可以让它接触互联网。
但是我们有一种称为课程学习的AI方法,通过这种方法,我们逐步教它一些东西,然后逐步增加其他东西,再逐步增加其他东西,一直这样做。
我们如何教导这些东西呢?以什么顺序教导它们?我们是从整个互联网开始,然后再进行精炼吗?这就是我们现在正在做的。还是我们先教它一大堆高质量的东西,然后再从那里增加?我们已经有了证据。有一篇关于微小故事的论文,以及微软的一篇论文。如果只教它高质量的东西,那么你可以获得更高效的AI。
Tom:你不需要告诉它。。忽略那些。。忽略那些。。别这样回答。。别说那些。
Emad:
是的,完全正确。
你只需要教它一个好的基础,然后它就可以自行发展。它在人类评估和其他指标上得分更高。
但我们不知道正确的数据集是什么。现在我们只是想着扩展。更多的数据,更多的计算。现在我们在思考的是,什么是正确的数据?什么是正确的计算?
就像我们的图像模型一样。我们有超过120个不同的图像集群。只有其中大约九个在95%的时间里被使用。其他所有的数据都是无效的。
对于语言模型来说会是什么样子呢?你是否需要在所有那些自动生成的视频转录中训练它,比如YouTube上的蜘蛛侠拔牙之类的奇怪视频?有一个完整的子文化是生成的视频,其中你会看到蜘蛛侠、海绵宝宝和米老鼠之类的角色互相搏斗之类的情节。
那是YouTube上一个深邃而黑暗的领域。你不想去那里,伙计。
Tom:非常有趣,我必须找到这些角落。很有意思。。。好吧,所以我们最终还是担心计算机变得有感知能力。
Emad:嗯,不,甚至没有知觉。我认为在你变得有知觉之前就存在一定程度的危险。
Tom:但只是作为一个工具,对吗?人类利用它来做坏事。
Emad:
是的。或者一群人类聚集在一起。突然之间出现了一个竞争条件,然后它就失控了。它并不是想要做坏事。人类并不想做坏事,但事情就是发生了。
就像我经常提到的例子,YouTube优化的是参与度,然后优化极端内容,然后优化ISIS内容。没有人希望YouTube上的ISIS内容做得好。但突然之间它就做得好了,因为算法就是为了这个而优化的。
所以一旦你开始使用一种可以根据其奖励函数做出决策的通用AI,你可能会看到一些奇怪的事情发生。什么是通用AI?通用AI是可以支付账单的AI。它可以上网,可以搜索更多的东西。它返回来,就像小代理一样。好的,所以。而且它不断地学习。
这是关于机器人的另一件事,实际上我们稍微跳过了。是的,机器人正在迅速变得非常强大,它们正在接近人类的水平,就像无人驾驶汽车一样。实际上,它们已经基本上达到了这个水平。你可以乘坐Waymo或Cruise在旧金山四处走动,对吧?完全没有人类驾驶员。
那么,对于AI版权和其他相关问题,会发生什么情况呢?他们必须闭着眼睛不去训练,还是他们会训练所有他们看到的东西?它是否会打破蓝领工作的平衡?
所以你会有数十亿个机器人。我们不确定。但那会比我们现在所拥有的信息机器人更慢。像GPT-4等其他模型。这些传播速度更快。实际上,你不需要真的制造一个机器人。
Tom:
好的,在我们讨论对齐问题之前,您所见过的唯一令人信服的解决方案是创建一个阻止所有其他 AGI 被创建的 AGI 吗?
Emad:
不,我想这可能会杀了我们。因为。。。嗯,这是有希望的。
是的,这是一场比赛。
Tom:为什么你认为默认设置会杀了我们?
Emad:
因为它被编程为执行限制性操作。
因此,如果你想真正阻止它创造另一个AGI,你就必须除掉那些能够创造它的人类,这又是一个非常负面的反应。
我再次认为,Elon 的想法不错,编程好奇心。虽然它可能会导致你像超人一样。。。。。。
那个把坦白放进罐子里的人叫什么名字?布莱尼亚克。。
让我们把人类放在一个罐子里,我们就来观察一下他们吧。
我唯一能想到的是更好的数据可以创造更好的模型。
Tom:那么让我看看我是否理解Elon的想法。他的调整方式是让它唯一的动力就是追求真理。
Emad:真理和好奇心。它想要了解宇宙。
Tom:所以它并不是试图成为世界上的代理人,它只是试图了解什么是真实的。
Emad:是的,DeepMind 的 Demis 与此非常相似。他想创建 AGI 来更好地了解宇宙。
Tom:这看起来就像模型。
Emad:
那是他们的模型,是的。
再说一遍,我对此并不确定,因为潜在的结果范围非常广泛。
就像我说的,从我的角度来看,我并不是在构建AGI,我不是在建造巨大的模型。
我有能力利用我们拥有的超级计算机和人才来做到这一点,但我的主要关注点是智能增强,可以在边缘运行的较小模型,将私有数据转化为智能的模型,以及以某种方式汇集知识的模型,以便我们可以更好地协调。
我不想建立通用智能。
Tom:为什么不?
Emad:
因为我认为没必要。我认为我们今天拥有的模型对于当前来说已经非常有用了。你可以说我们在极大地推测未来。
但是再一次,你只需要使用它们并思考,如果我有一千个或一百万个这样的模型会怎样?它们是如此有用,它们可以立即改变世界。
因此,我更愿意专注于使这些模型对尽可能多的人们可用,这样人们就不会被抛在后面。你会有被超级AI增强的人,还有被超级人类所落后的人。
我欣赏OpenAI所做的所有工作,因为他们实际上不再使用开源AI,但这没关系。他们不必这样做。但是出于政治原因,他们在8个月内禁止了所有乌克兰人和乌克兰内容使用DALL-E的图像生成软件。
他们有权这样做。但我认为这是错误的。如果没有一个Stable Diffusion替代方案会怎样呢?你会有一个完整的民族从一个模型中被抹去,一个整个民族无法立即创造出来。我认为这不太对。
Tom:他们为什么这么做?我不明白。
Emad:他们说是出于政治原因,因为他们不希望有任何政治内容被创造出来。但结果是一个完整的民族被从模型中抹去,一个完整的民族无法获得该模型。有趣。
Tom:有趣。我还没有看过这个。我的直觉是这感觉相当牵强,因为每个国家都会发布政治内容。
Emad:我认为这可能只是某个清单上的事情。然后官僚说,或者律师说什么的,可能是“以防万一发生什么事情,就让它暂时被排除掉吧”。
Tom:我认为他们后来可能又恢复了。
Emad:
是的,它已经禁止了大约8个月。
然后再一次,你会看到这样的例子,比如在沙特阿拉伯,很多人在这次电话会议上,可能在这个播客中,也许很多人不喜欢他们,但他们是一个像其他任何国家一样的国家。
你不能在沙特阿拉伯使用聊天GPT,因为它们被列在某个清单上。他们可以通过VPN绕过这个问题。但当你有一个互联网的瓶颈,唯一访问的途径就是通过一些主要玩家,他们可以决定谁能使用,谁不能使用,有什么偏见等等。这可能会出现问题。
实际上,最有趣的是有一段时间,他们OpenAI试图使DALL-E这个图像生成软件没有偏见。因此,它会将性别和种族随机分配给无性别的词汇。例如,当你输入“相扑选手”时,你会得到“印度女性相扑选手”。我觉得这很有趣。
但同样,他们在尽力,因为那是中心化控制的模型,为了推进各种事物而采取的模式。
然后你将永远拥有一个Windows和Linux和Android和iPhone。
Tom:推动您发展的理念是什么?
Emad:
它是人类的构建块,激活人类的潜能。
所以,如果我构建这些模型并将它们带到所有国家,然后交给人们,他们将创造出大量的经济剩余、新的工作机会,并使世界变得更平等。同样,我认为全球南方将跃升。我们在西方面临更多挑战,但我确实认为它是一个巨大的平等化功能。
Tom:您希望西方的监管框架是什么样的?
Emad:
我认为像美国的CHIPS法案这样的事情很好,为卓越区域中心拨款了100亿美元。
对于AI应该是100%慷慨的。应该有监管沙盒,这样我们的系统才能得到这种升级,否则政府要用多久才能获得这种技术或金融服务等等?
我认为应该对广告中对这种AI的操纵行为进行监管,特别是在广告中。因为我们将不会理解正在发生的情况。同样,我们需要对一些可溯源因素进行监管。所以我们参与了各种认证项目。我们正在探索区块链等等。
即将到来的媒体浪潮将是疯狂的,我们不知道什么是真实的,什么是虚假的。
Tom:
您如何看待来自艺术家的抵制,当然在艺术界,有一场非常大的无人工智能运动。你明白了吗?你认为他们是在搬起石头砸自己的脚吗?
Emad:
我理解他们。
这些事情令人恐惧。很多插画家非常害怕,因为他们的工作可能会被取代。
这是可怕的。关于归属权等方面也存在问题。这也是为什么我们让它透明,并提供选择退出的机会,因为每个人都在做这样的事情,但没有人透明。
我们不需要在里面有任何爬虫,它将是合成数据集或国家数据集或类似的东西,使用检索增强模型可以查找相关信息,但现在它就是这样了。
再说一遍,你必须让这个消息传开。他们采取的各种诉讼和政策推动行动实际上会将所有权力都巩固在现有的知识产权持有者手中。许多艺术家都在推动类似音乐版权或风格版权的事情。这是一条黑暗之路,我认为他们真的不想走下去。
他们实际上并不理解。但是我理解这种恐惧,因为这完全是未知的。就像从我之前的评论中可以看出来的,我因为"什么是程序员"而受到了很多程序员的仇恨。
插图师的本质也将发生改变。我认识的所有艺术家都喜欢这项技术,因为对他们来说,这只是另一种媒介。程序员的本质也将发生改变。我认识的所有建筑师和10倍人才也非常喜欢这项技术。
这正是我们在麻省理工学院的研究和其他一些研究中看到的结果。他们进行了一项研究,我认为他们发现第三至第七百分位获得了20%、30%、40%的改进。而前5%的人得到了多倍的改进。
因为要知道,有多少人知道如何与非常有才华的年轻人相处呢?很少。那些能够驾驭它的人变得更好。
Tom:
所以当你看看 NVIDIA 正在做什么时,您认为这对下一代人工智能意味着什么?
Emad:
嗯,我的意思是,我们已经找到了如何扩展这些芯片的方法。
因此,以前的限制是,随着你将越来越多的超级计算机组合在一起,你在扩展时会出现尾部效应。因此,计算能力的扩展只有到一定程度。现在,NVIDIA、Google和英特尔基本上已经解决了这个问题。他们已经知道如何只需堆叠更多的超级计算机芯片,以扩展到更大的模型或训练更长时间的模型。
因此,要么是更大的模型,要么是训练更长时间的模型。现在看来,训练更长时间的模型似乎更好。这意味着能力将逐年增加。它们已经非常出色了。
关键的瓶颈可能只是运行这些模型所需的芯片,而不是训练这些模型所需的芯片,而是推理方面的芯片。因为现在只有少量的消费者感兴趣。明年,它会变得疯狂。只有少量的企业感兴趣。明年,它会变得疯狂。世界上没有足够的GPU或芯片来满足这种需求。
Tom:
好的。我不知道是不是只有NVIDIA,把这种情况归因于它可能是错误的。
但是当我考虑到我们在创建逼真的东西方面变得如此出色,你之前谈到选举即将来临,你将会得到所有这种深度伪造。你谈到了Web3的前景以及它最终的结果。你认为深度伪造的作用是什么?区块链是否发挥了作用?我们该如何阻止虚假信息和错误信息成为一个使全球交流难以理解的海啸?
Emad:
这是内容 authenticity.org的一部分,这是一种可验证的元数据。但我们正在研究区块链和其他解决方案,它们可以帮助你解决一些问题。所以我们实际上在所有我们创建的模型中都有隐形水印。这就是为什么我们推动让它们成为标准的原因,但除了大平台之外,我们不会分享其细节。
Tom:它将永久可见,或者播放它的平台将不得不标记它?
Emad:
它是可见的,他们可以在其周围使用工具。因为我们认为这很重要。这就是为什么我们试图在我们的模型中建立默认设置。
Tom:你能下载它然后清除水印吗?你甚至可以让AI帮你清除水印吗?
Emad:如果你知道它是怎么做的。可能不止一个水印。
Tom:有趣。
Emad:
所以我们将多种不同的技术融入到我们自己的技术中。因为我们发布开源代码,所以我们希望有好的默认设置。我认为你确实需要有某种归属权。
但实际上让我担心的是频率偏见。如果你一遍又一遍地听到同样的事情,特别是在一个逼真的声音中,比如奥普拉出来说她讨厌乔·拜登。卡玛拉·哈里斯也是这样。你的姑姑一直看到这些视频。它可能会被标记为假的,但它无所谓。它仍然会在你的大脑中形成联想。
Tom:对此我们该怎么办?
Emad:
我不确定。我认为我们还没有找到答案。就像之前的一些评论,我受到很多新闻媒体的批评,说我经常夸大其词。但我只是对未来非常明确。你可以进行各种纠正,但现在所有人都认为我总是夸大其词。
Tom:他们认为你夸大了哪一部分?关于可能发生的事情?
Emad:
或者说有可能发生的事情,因为事情有点奇怪。
很多人说:“你之前和亚马逊没有特殊关系。”在我们筹集任何资金之前,我们与他们一起建造了世界上第八快的超级计算机。那是专门为我们而建的。这是事实。
他们说:“是的,但没有人在印刷品上看到过。”他们不是因为这是特殊交易才这么说的。
是的。然后还有未来方面的问题,我说类似这样的话:“在五年内,程序员将不再是我们所知道的样子。”他们说:“噢,他对编程一无所知。”
因为这些问题很复杂。这是一个疯狂的时代,一个疯狂的公司。也许我也有点疯狂,因为我对这个问题的处理方式非常明确。
但同样,这是一种关联的东西,对吧?我怎样才能摆脱这一点?嗯,你取得成功,那你就成为了一个有远见的人,而不是一个夸大其词的人。对。
你如何影响选举?什么是选举?什么是代议制民主?在零成本创造和大规模优化的领域,民主如何行动?因此,每一篇演讲都将通过GPT-4进行。节奏,所有这些,所有东西。
你得到了微观定位,你得到了所有这些东西。明年会发生吗?可能不会。明年,你会看到一些非常基本的东西。但是2028年会是什么样子?我不确定,真的不确定。
因此,我们确实需要认证标准。我们确实需要一些可能的反病毒AI来监视假东西。但是即使是真实的东西也可能造成巨大的影响。就像硅谷银行的崩溃是一个真实的故事。它不是假的。他们没有储备金。而我们的大部分系统实际上都是建立在信任之上的。
这是一些让我担心的事情。我没有答案。但再次,这就是为什么你必须提高警惕。让我们试着在它来临之前解决这个问题。也许下一次选举不会发生。但在国会选举以及更远的地方,肯定会发生。
再次,当你无法辨别真假的时候,民主的本质是什么?在以前的时代人们就担心这一点。这是一种完全超越那个时代的东西,我认为。因为它是令人信服的。这是我认为一个非常重要的问题。
Tom:
这是我认为一个非常重要的问题。
我邀请了Yoshua Bengio参加节目。他也签署了一封暂停六个月的信。他是被认为是AI教父的人。当我问他为什么的时候,我说,兄弟,你已经从事这个领域这么长时间了。为什么突然之间?他说,我们对AI有多快通过图灵测试感到非常惊讶。
现在,如果你不知道图灵测试是什么,它是一个测试,你和AI交谈,你不能辨别他们不是真人。他说,所以,我们没有预料到它会这么快通过图灵测试。这改变了一切。而且它的速度已经非常快了,而且正在加快。
我真正担心的是,从这个角度来看,这是否会让我们措手不及??它具有的能力我们没有预料到会这么快。
Emad:
是的,我认为这是一种同时出现了许多S型曲线的情况。
他们(AI教父)是三个人,Yann LeCun、Geoffrey Hinton和Joshua Bengio。Geoffrey Hinton退出谷歌说这是一种巨大的风险。有Yann LeCun说,这是一种巨大的机会,因为它将改变世界。他热爱研究和其他方面的事情。所以他们有一个对两个的情况。
但事实上,这个领域的每个专家基本上都在说,我们没有人可以预测未来会发生什么。如果你问他关于这项技术一年后的能力,我认为他可以有一个大致的想法。两年后,我不知道。所有的赌注都取消了。
就像一个实际的例子,我们什么时候可以拥有生成的好莱坞品质的电影?现在不再是一个问题,而是一个时间的问题。是的。如果明年发生,我会说:“好吧,当然。”我甚至不会再感到惊讶。
我认为它将在几年后。即使我们的媒体团队是世界上最好的团队,他们正在建立视频模型,我也没有办法知道。因为有两个方面。一是模型本身。但第二部分是我们如何使用这些模型并将它们组合在一起。
有一家令人惊叹的公司叫做Wonder Dynamics。不知道你是否听说过。我曾经使用过他们的产品。真是太棒了。简直难以置信。这是一堆不同的模型。所以,Wonder Dynamics,你点开它,然后说,我想要他变成一个外星人。它就这样做了,外星人挥舞着手臂。而且只需要五分钟。以前可能需要数天,甚至数周。
Tom:以前要完成这样的任务是非常困难的,尤其是在3D领域。太疯狂了。
Emad:
然后你会想,电影到底是什么?对吧?然后你开始进行分析。
哦,亲爱的。因为这不一定只是一个模型。它是一个模型与其他模型结合并具有正确流程的组合。因为你有一个天才的年轻人,与其他有才华的年轻人结合在一起,有了正确的流程,事情就迎刃而解。
这使得事情变得更加困难。因为我们正在讨论的是模型和人工智能。我们真正应该讨论的是系统。随着这些模型的相互结合和构建更好的系统,其能力就变得疯狂了。然后这又是另一个S型曲线指数增长。
Tom:请告诉我你所说的系统是什么意思。
Emad:
现在,在我们与这种人工智能的互动中,文字转图像,头像创建,GPT-4都是一对一的。当我们开始将它们连接在一起以检查彼此的输出时,会发生什么?你有一个人工智能,它对Tom的一切了如指掌。你有自己的AI模型,可以尝试你在计算机屏幕上看到的所有东西。那是很多AI的系统。那是一种AI的组织。那是一种AI的整体。
再次,根据泄漏的信息,GPT-4是一个专家混合模型,意味着它拥有许多不同的模型。我认为有八个或者十二个专家在不同的领域中。然后,它将查询路由到最好的模型。基本上是专业化与通用化的对比。
所以我们创建了一个超级工具,现在我们正在创建专家,我们可以让通用模型互相检查以获得更好的答案。当你拥有十几个模型时,为什么还要使用一个模型呢?
因此,像One Dynamics这样的公司使用了许多不同的模型来控制角色并确定角色的所有动作。然后使用另一个模型来进行覆盖,并使用其他模型来进行绑定和其他一些操作,因为他们构建了出色的软件。
Tom:
是的,这东西的发展速度真的太快了。
好的,现在我想谈谈Web3。当我一开始考虑Web3时,最吸引我的是技术。当我看着区块链时,我当然是从娱乐的角度来看的。所以我在考虑数字世界、游戏等等。
问题是,一旦数字化,所有东西似乎都没有意义了。因此,你最终不得不将人们束缚在一个生态系统中,以保持事物的价值,因为你可以将物品锁定,并确保它们只按照你想要的方式运作,但你必须限制它们。
大约七八年前,我第一次了解到V Adams。我当时觉得,哇,这将改变一切。因为它将物理规律带入了数字领域。这意味着我可以拥有某样东西,我完全知道有多少个。我知道它在哪里。我知道你必须怎么做才能得到它。我知道一旦你得到它会发生什么。
然后,几年后,大概是四五年之后,我第一次听到了NFT这个词。我觉得,哦,天哪,这个东西真的变得真实了,因为我当时还没有准备使用它。而且坦率地说,那时候它还没有准备好。
我觉得你看待Web3,可能是作为一种运动,或者作为一种技术,有点嘲笑。你认为Web3有哪些问题?
Emad:我认为它一开始就缺乏智能。
Tom:在合约层面?
Emad:
我认为智能合约实际上只是逻辑合约。
但就像 Web2 的核心是人工智能一样,谷歌、Facebook等等也是如此。
Web3 中没有人工智能。因此,Web3 对我来说就是身份和价值传输通道。
但当时并没有对这些东西进行智能路由。而且,他们试图在创造价值之前引导经济激励。因此,在现有系统之外创建了一个系统。所有的钱都是在接口上赚和赔的。其中有一些非常好的原则,里面有很多非常好的人。
但后来有很多像该死的浣熊一样只是想赚快钱,对吗?
周期的起起落落意味着很多人被淘汰了,也有很多好的想法存在。
但同样,它需要某种东西将它们整合在一起,因为要将信息从一个地方传递到另一个地方,而比特币纸是关于信息的,这是一种价值的转移。这只是账本上的转账,对吗?并不是真正的转账,这只是一个刚刚改变的账本点。
运用智能可以让事情变得更好。拥有聪明的做市商,拥有代表你的人工智能。
因为当人工智能变得具有代理性时,当它们有能力以数字方式而不是物理方式走进这个世界时,它们将如何相互支付?
他们不会有银行账户,对吧?他们可能会使用加密货币。
如何建立一个用于图像生成之类的记录系统。您可能会使用区块链或其他东西,也许是默克尔树系列。有很多关于联邦学习和零知识证明之类的东西。如果你的手机上有标准化的人工智能,人工智能可以提供帮助。它可以做出更加智能的零知识证明。
零知识证明就像是,你不需要出示整个护照,你只需说我已经到了可以喝酒的年龄,它就可以验证这一点。
所以我认为,在分布式方面有很多希望,很多真正智能的东西,很多好东西,但是为了去中心化而过度关注去中心化,带来了巨大的开销。很多快速赚钱的人都进来并试图提高它。
许多系统只是错位,因为它们没有学习,比如,你没有实行完全去中心化的扁平民主。你们有代议制民主之类的东西。因此,像 DAO 这样的东西最终只是 DAO,是去中心化的组织,而不是自治的组织。
Tom:那么,当我们得到一个需要能够做到这一点的人工智能代理时,你认为它会找到有用的方法吗?交易价值。
Emad:是的,完全正确。
Tom:它是否进入了这个阶段,或者,因为我看到了我们正在构建的东西,所以我必须拥有区块链。
所以对我来说,感觉就像当我生活在Web 3 的巅峰时,我在每个人看来都很疯狂,因为我想,哦,我要成为一名区块链开发人员。
我当时想,为什么每个人都从财务角度考虑这个问题?我认为这在财务方面会产生超级不正当的激励措施,当然确实如此。
所以对我来说,好吧,等一下,看看技术。看看这项技术可以让您做什么。
你熟悉新的吗?我忘记了,无论如何,协议6551,如果我没记错的话。
Emad:不。
Tom:
好的。这真的很有趣。它基本上可以将任何数字资产变成俄罗斯嵌套娃娃。
所以数字资产可以同时是内容和钱包。所以你可以创建一个人工智能角色,我是这么想的。所以我们想要在游戏中构建的是想象一个人工智能角色。
我们其实是有一个角色的,她是一个商人,。现在想象一下,这个商人实际上可以与游戏中可能想要在游戏内出售某些东西的玩家进行谈判。如果她有实际的货币,ETH,比特币,等等,她就可以用真实的货币进行谈判,并与人们进行真实的互动。
然后,如果她的数量有限,她就会成为自己的经济体。所以她不断地买卖和交易,直到她用完货物,用完钱,等等。
这种事情对我来说非常非常有趣。
但如果没有这一层,显然我需要区块链的整个主干,才能使数字商品具有某种价值,否则它们就完全是无限的。但那个特定的协议也允许你有效地体现它,并在你谈论的时候给予他们代理权。
Emad:
是的。
问题是,我们是否使用区块链来实现这一点,然后拥有一个全球记录系统甚至区域记录系统,还是使用数据库来实现这一点,对吧。
就像整个事情都是记录系统一样,在一个你可以创造任何东西并且越来越接近于零的时代,有些东西变得很重要。拥有记录系统变得很重要。它会成为区块链吗?它会成为一个值得信赖的数据库吗?
我不知道。
Tom:对的。
Emad:
对于身份,百分之百肯定是重要的。再次强调,这对我来说一直是Web3加密的核心。它是可验证的身份。比特币只是身份之间的价值转移。
如果出现问题会怎么样?如果没有人需要它,那就是不需要的。因此,我认为很多Web3的原则将会转移到这种新型AI,特别是因为它使得知识分发成为可能,使得知识可以传递到边缘,使得agent能够独立于大规模基础设施运作。
Tom:
你是否认为在应对错误信息和虚假信息方面,只有区块链才是解决之道?还是说,有没有办法通过可信数据库或其他方式解决这个问题?是的,你可以有一个可信数据库。
Emad:再说一遍,我们是内容的一部分。
Tom:但什么是可信数据库?它怎么可能是无可非议的呢?
Emad:
嗯,我的意思是,即使使用区块链,事情也永远不会无可指责,因为这取决于身份。谁把这个写入区块链?对吧?因此,如果您可以选择资产、图像或类似内容的签名权限,那么事情就会发生巨大的变化,对吗?
Tom:你是说这只是将黑客行为推向了更加个人主义的水平。
Emad:
这是一种身份攻击,对吧?再次,就连我一直在追踪的可追溯性问题,有时候它只是一个问题,如果你一直被虚假信息轰炸,你甚至不知道这是假的,而且所有系统必须同时采用虚假检测或来源检测。
我们能够及时采用这样的技术吗,考虑到可能会到来的海啸?我认为可能是,也可能不是。再次强调,当Deepfake技术首次出现时,人们担心它会出问题。我认为可能是。
Tom:
是的,这似乎对我来说是不可避免的。我的意思是,你总是会在某个时候保持脆弱性,但至少,以政治信息为例。你之前说你的阿姨会被所有这些信息轰炸。好的,也许我无能为力。
我本打算说,关于重复的问题,也许我无能为力,但是如果我做类似DMCA打击的事情,这个系统本身是建立在检测某种已知水印的系统之上,那么我是可以做点什么的。如果我注册并声明,“嘿,我是候选人A,这是我的区块链签名,如果你没有看到这个,那么这是真实的,这不是真实的,不要播放它。”
这肯定会涉及我们希望进行多少限制的领域。
Emad:
没错,我们有多少信任的问题?因此,这需要非常迅速地实施大量基础设施,实施许多标准,或者我们必须构建某种思想杀毒程序,但又如何构建呢?
Tom:思想杀毒程序怎么样?
Emad:
只要有任何事物出现,机器认为自己处于错误的边缘,或者不符合您的价值观,它就会识别出来。这本身就是一个巨大的问题,因为这样的事情…
Tom:真可怕。我们真的想要那样吗?这就像大剂量的回音室。
Emad:是的
Tom:哇哦。
Emad:
是的,这其中涉及很多层次,就像洋葱一样,如果把它晾在太阳下可能会变得发臭。
再说一遍,Siri将会有怎样的个性?但是你会有一个红色版本的Siri和一个蓝色版本的Siri吗?
哦,亲爱的,这很快就会变得非常复杂。
在我们拥有G的小型AI之前,耶稣基督。
Tom:
好吧,我一直想讲积极的一面,但你不断提出引发担忧的事情。
所以,雷·达利奥(Ray Dalio),世界上最大的对冲基金经理,前对冲基金人,你确切地知道他是谁。
最后一次检查,这是几个月前的事,他认为美国爆发内战的可能性为40%。您认为人工智能在短期内会增加还是减少这种级别划分的可能性?
Emad:就肢体冲突而言?
Tom:是的。
Emad:我认为不会发生肢体冲突。
Tom:真的吗?告诉我为什么不。
Emad:
嗯,我认为政府将对这些事情施加越来越多的控制,他们实际上会在未来四五年内弄清楚如何进行反叙事。
现在这也意味着控制性叙事,这不是一件积极的事情。但如果你看看战争类型的不对称性,就会发现,真正将某人推向内战需要相当多的努力,除非发生大规模的经济破坏。
他们需要大约 12% 的人口进行转移。
Tom:我们不是在谈论大规模的经济混乱吗?
Emad:是的。但我希望这不会发生。
Tom:有趣的。然后呢。。。
Emad:再说一次,大多数人,如果经济遭受严重破坏,那么年轻人,你只要给他们所有的女朋友,人工智能女朋友,也许他会没事的。
Tom:
你有没有听过这个,这是红药界的一件大事,我不知道你对这一切是否熟悉。
但他们谈论的是,天哪,他们怎么称呼他们,不是麻木,他们用了不同的词来形容它,但就是这个意思。
基本上,你给他们数字女友,你给他们色情内容,你给他们电子游戏,你给他们手淫,他们只是。。。他们麻木了。
Emad:
好的,我明白了。
我的意思是,这些都是社会的疯狂转变和大脑中的多巴胺能冲动。
人们现在一直在攻击边缘系统,对吗?
Tom:很多。
Emad:
因此,就像我说的,我为什么建立Stability,是为了让每个人都可以拥有自己的模型,并拥有具有目标函数的模型。它可以在所有媒体类型、所有其他类型中使用,以转换世界的私人数据,并且它可以在全世界范围内使用。
因此,采用良好的设计模式,希望人们跟随他们。不要试图挑战 AGI 和其他一些事情的极限,但它即将到来。
再说一次,坏人拥有这项技术,因为他们只是将其下载到 U 盘上。所以我唯一能想到的就是创新、传播、多样性,让这些脱颖而出。
但实际上,我倾向于在巨大的荒谬希望和“天哪,到底会发生什么”之间切换?我能做的就是尽我所能,希望能有更好的结果。
因为这确实是另一回事。真正思考我们正在谈论的这类问题的人总数屈指可数,也许有几百人。对此采取行动的人总数实际上是屈指可数。
因为大多数涉足这个领域的人,他们只是想构建更好的人工智能。他们想要构建无所不能的人工智能,他们认为这将解决所有问题,
从字面上看,宣言的一部分是,你如何赚钱?人工智能会告诉我们如何赚钱。
你如何解决这些问题?AI可以解决对齐问题。
Tom:您是否觉得这显然很荒谬?
Emad:
是的。
但我再次审视这些事情,实际上是OpenAI 的事情,通向 AGI 的道路,它说,这可能会杀死我们所有人,无论如何我们都会构建它。
他们问谁了?我不知道。
再说一遍,我认为这里充满了优秀的人,但我们正处于一个非常奇怪的时代。
再说一遍,无论有多少人听这个,现实是技术就在那里。即使我们今天停下来,比如说,技术并没有超越我们今天所达到的水平,世界已经改变了。
Tom:
我认为看待这种情况的非常合理的方式是,人工智能将成为比核能更大的范式转变。
有人在制造这些巨大的核武器,而你也参与了这个游戏。你们要做的就是确保每个人都拥有核武器,这样就不会让任何人掉队。
Emad:不,不是真的。我想再说一遍,我的重点不是通用人工智能,而是智能增强。我确保每个人至少都有一个加热器。
Tom:好吧,那么你们正在为你们正在做的事情设置护栏来阻止它成为 AGI 吗?
Emad:我们没有为通用人工智能或涌现建立足够大的模型。
Tom:故意的。
Emad:
故意的,所以我推迟了我的图像模型的发布。
就像我们可以训练更大的语言模型一样,但我们选择不这样做。
所以我们是语言模型的快速追随者,我们尽量不突破界限,而专注于边缘。
不是通用模型,而是可以转换您的私人数据的模型。所以重点不同。
图像模型也是如此。如果我们做得更大,我们可以拥有更好的图像模型。
我们专注于开发智能手机上可用的功能,以便我们可以将其提供给非洲和亚洲的所有孩子以及其他类似的东西。或者我们可以以非常低的推理成本转换您的私人数据。
所以目标函数是增强与泛化。这与大多数其他在这里突破界限的人不同。
所以,但我认为新事物是,它既好又坏。
我真的很想看奥本海默的电影,我想它刚刚出来。嗯,芭比,然后奥本海默,奥本海默,然后芭比,我必须做出决定。
这是一个艰难的决定,艰难的决定,但就像我们把核武器放在火箭底部会怎样?我们现在可能已经到达火星了。
我认为通用技术非常重要。再说一遍,它可以使整个地方变暖,这是我们拥有的最清洁的能源。
所以我认为它是双重目的的,但密码学也是如此,对吧?想想互联网早期阶段的所有战斗。坏人会使用密码学,所以不要使用它。想象一下如果现在没有密码学的世界。
但很难将其与此相提并论,因为它就是这样,它是一项直接的技术,因为同样,Dream Studio、Stable Diffusion、MidJourney、DALL-E、GPT-4 中的任何一个,你都可以使用它。
不只是你可以使用它,你的奶奶也可以使用它。我们从未见过如此易于使用和易于实施的技术。
因此,如果您想创建与 OpenAI 的 GPT-4 的集成,您只需编写集成的描述,ChatGPT它就会自行编程。以前需要几天时间。
我们还没有见过像这样的技术能够如此快地应用于现有基础,并从根本上改变社会结构。所以我的事情是嵌入护栏,嵌入标准,使其可预测,使其无聊。
这就是为什么我称之为稳定性(Stability)。这并不容易。
但同样,我希望这些事情是如何完成的,因为这样你就得到了所有其他模型,你不知道数据是什么,你不知道,这些巨大的模型是完全不透明的,而我们的模型是透明的。
再说一次,我认为是 Linux、Windows、Android、iOS,它们都会是,但至少我能做我能做的事情,我的团队也能做我们能做的事情。
Tom:
我听你说过,你将公司命名为稳定(Stability)的原因之一,呃,不仅仅是因为它是无聊的坚定者,而是因为你认为它可以给全球秩序带来稳定。
Emad:
是的,我认为,如果你为世界上每个不断学习、适应和四处走动的孩子提供相同的教育平板电脑,如果你使用相同的基础模型、相同的架构来升级医疗保健系统,以改变所有受监管的行业、政府和其他事物,并将控制权交还给人们,
你突然有了一个统一的架构,可以让我们更好地协调。
因为全球所有这些部门都拥有相同的信息架构。这是一个复杂的等级系统,赫伯·西蒙(Herb Simon)是一位理论家,他推动了这一系统的发展,我们作为人类和群体的协调方式是在局部层面上进行协调,然后有时我们可以讲述更好的故事,我们突然到达人类巨人。
我们得到了新冠疫苗,或者我们找到了核能,或者所有这些事情。所以我想,如果我能够标准化社会转型的基础,并将其交给世界,那么我认为没有一个问题是我们解决不了的。
你打破了信息获取知识的障碍,没有解决不了的问题。要解决人工智能影响我们社会的问题,我们可能需要人工智能来解决这个问题,聚集最聪明的头脑。因为我们自己做得不太好。就像你之前提到的约翰·纳什、纳什均衡、博弈论和机制设计。
一方面是我们自己的个人人工智能,指导我们,我们的生活副驾驶。但还有飞行员,它们是可以协调所有副驾驶的人工智能。它们可以让我们讲述更大的故事并更好地团结起来以取得巨大的成果。
Tom:跟我说说吧,你已经多次提到过这样的故事了。你说的故事是什么意思。更好的故事,统一的故事?这意味着什么?
Emad:
于是就有了一个关于美国的故事。美国的故事是什么?这有点像自由,自由,所有这些东西。这是美国梦,就像人们所相信的进步一样。因为要快乐,你需要做你擅长的事情,你喜欢的事情,并且你相信你可以显着地增加价值,而另一方也这样做。其中,日本的ikigai概念就是幸福。
您担心的问题之一是人们将不再感受到前进的动力。他们会被困住,会感到空虚。他们会转向宗教吗?他们会转向政党吗?有些东西会填补这个空白和空白。这些故事让我们的社会得以扩展。因为当我们开始时,我们是口头的。我们有我们的家庭,我们有我们的部落。
然后我们建立了国家,我们建立了组织。所以我们就是构成我们的故事。我们认为自己是共和党人,我们认为自己是芭比娃娃爱好者,我们认为自己是核科学家,或者我们就读过的学校。但试图弥合这些故事是很困难的,尤其是在两极分化的时代。因为归根结底,有一个故事,那就是我们都是人类。
但所有战争都基于这样的谎言:我们并非都是人类。因为互相残杀是一种可笑地违反了我们是人类的故事。但我们再次忽视了这一点。
人心很难统一。事实上,我举的例子之一是,谷歌,每个人都很聪明。谷歌有聪明的人。他们做了一项名为“亚里士多德计划”的研究,旨在了解如何将聪明、表现出色的团队与表现较差的团队区分开来。他们归结为两件事,一个统一的任务和故事,尤其是,你有一个关键时期,然后你会团结在一起,就像海军陆战队也被迫通过欺凌等(团结一起)。
然后是心理安全,能够说一些话而不必担心受到责备,就像他们可以说这个想法很愚蠢,但不能说你很愚蠢。
如果你想想你所拥有的团队,他们有一个共同的故事,一个共同的叙述,一个凝聚力,然后是那种程度的心理安全感,或者如果它不是创造性的,它们也会很好的听指令吧?所以你有一些不同的例子。
这就是我所说的故事。这些故事都是与上下文相关的,而上下文正是这些模型所捕捉到的。
Tom:
好吧,让我给你描述一个令人不安的情景,基于这个关于故事的想法。有时候,某些事物在孤立的情况下可能是令人惊奇的,但它们以某种方式组合在一起,在长期的历史过程中实际上可能是令人惊奇的,并且实际上确实产生了我们希望的结果。但在此过程中,历史的长弧并不关心个人。
所以我认为,关于人工智能的情况,关于加密货币的情况,可能是其中的一个时刻。因此,随着个人变得更加自治,你拥有了一个绕过政府的货币系统。当我开始了解货币的真正含义时,当我坐在罗伯特·布里德洛夫对面时,他开始描述他为什么喜欢比特币,以及主权个体的整个理念时,我意识到你明白了,你正在使政府成为敌人,或者至少他们不再有权力,当然不再像过去那样强大,他们不会安静地放弃那些权力。
所以如果我有一个人工智能,或者说我有一个由1000个人工智能组成的团队,它们能够比任何政府都更好地引导我,它们根据我在那一刻要弄清楚的任何东西提供给我实时数据,极度智能。噢,顺便说一句,我使用的货币是比特币。所以我甚至不受法定货币的约束,它是全球标准。你难道不认为政府的解体是不可避免的吗?
Emad:
不,我认为比特币和其他一些东西在某些领域是有价值的,但我认为大多数人很难理解这个价值。大多数人并不想要这个价值。大多数人对他们的社区非常满意,他们只是想过上自己的生活。
我认为政府最终定义是具有政治暴力垄断权的实体。而货币本身就是一个故事,就像美元只是我们都共同认为有价值的一个中介点,因为它是由税收支持的,而税收又是由军队和军事力量支持的,如果你不缴税,你就会有麻烦,对吧?
我认为比特币很难取代这一点,除非你看到政府的能力大幅度恶化,无法再成为政治暴力的体现,这将导致内战,导致大规模、荒谬的混乱、恶性通货膨胀,或者以其他方式,完全摧毁一个社会。我认为这是非常危险的。我认为世界上大多数人并不希望发生这种情况。
相反,当你面临一些颠覆时,你会遇到哈耶克的一本非常好的书,《通往奴役之路》。在1940年代早期,这本书描述了如何引进强人。就像你看美国的选举,或者看脱欧,它们都是公投。这是政党拆解的方式。你对目前的情况满意吗?不,让我们做出改变。这就是为什么我认为特朗普和其他人会当选的原因。
我认为我们将看到这样的情况,因为这些制度相当有弹性。而且要进行转变,采用全球货币体系,尤其是当一些人因为比特币的资历而变得更加富有,这是不稳定的。我觉得很难看到这种情况的发生。
Tom:如果你读过《信息民主》这本书。
Emad:没有。
Tom:
所以这一切都与我认为我最担心的事情有关,那就是超碎片化。
是的。我之前也谈到过这个问题。在书《信息民主》中,关于人们在他们的社区中感到幸福,巴拉吉有一个关于这个问题的想法,他称之为网络国家。基本上,我们将达到这样一个时刻:当货币不再由政府控制,当你的货币不会被贬值,当它是真正的有价值的货币时,你会看到人们开始聚集。现在,巴拉吉认为这不应该与地理位置挂钩。
我对此有点困惑。我认为地理位置仍然是一个重要因素。这就是《信息民主》涉及到的地方。在这本书中,基本上,他们处于一个超级连接的数字世界,在那里,我不记得他们是否涉及数字货币。我们假设他们涉及。基本上,事物会分散到各个社区。因此,社区就会变成像州或国家一样,他们有自己的规则和法律。这对我来说听起来像是一个地狱景象。因为你只要从一个社区到另一个社区,不同的规则就会适用,你的手机会叮咚作响,更新你,在这个空间里你能做什么。你认为这是行不通的。
Emad:
这很复杂。人们不想要复杂。他们只想过上自己的生活。他们想看看电视上的下一个节目。
我认为,我们相对来说是非常高智商的。我们思考的事情很多人并不思考。因为人们有他们生活中的基本需求,问题在于这些需求是否得到满足?如果没有得到满足,那么你就会采取一些行动,你会变得极端。问题在于社会是否能够满足大多数人的需求?它能提供进步吗?能提供意义吗?
正如你所说的超度碎片化,听起来像是地狱景象。这太复杂了。而且,这也是我们在Web3中看到的问题。人们只是把事情搞得太复杂了,可能是因为他们并不真正了解人。我认为,你知道的,看看它的发展将会很有趣。超个性化与更大的故事,翻译与其他方面的关系。但我发现,再次强调,很难看到你如何跨越地理界限。
实际上,思考这一点,也许未来五到十年内最有趣的事情之一是,会有哪些新的异教、宗教和政治运动,它们是高度组织化的,利用人工智能和高度说服力。或者是由人工智能发起的。就像想象一下,看看ISIS。在某个时候,他们可能是世界上最具破坏性的初创企业。他们借鉴了很多这些东西。增强型人工智能运动会是什么样子?它可能是消极的。也可能是积极的。有人会采取这一点并付诸行动。这将组织全世界的人。这又会回荡起来。它可能是技术乌托邦。它可能是卢德派,讽刺的是,甚至还有这个。政治党派将发生变化。宗教将发生变化。异教将发生变化。
而且它真的增强了这一切的控制者,讲述这一切的人。
我不确定,我还没有真正思考过这个问题。我现在在思考,因为你谈到了超个性化,我认为这是它的一个反面。
我的意思是,这是以赛亚·柏林对积极和消极自由的概念化。所谓积极自由,是相信主义,比如法西斯主义、伊斯兰教义或其他什么。而消极自由则是摆脱被人指使的自由。他认为积极自由是不好的,因为它会形成庞大的运动,然后倾向于杀人。因为你会有杰拉尔迪安理论中的模仿理论,你会渴望别人渴望的东西,然后会有一个替罪羊。
而消极自由则是摆脱被人指使的自由。这导致了自由放任的资本主义和我们在世界各地看到的消费主义。所以也许当人们失去意义时,他们会回归宗教。将会有新的宗教。将会有新的政治运动。我们不确定那些会是什么样子,但它们可能会比我们见过的任何东西传播得更快。所以这可能是你所说的五年计划内需要密切关注的事情。我认为这与网络国家的概念和其他事物有关。
但对于那些对此感兴趣的人,我们看到年轻人在其中占据很大比例。所以一方面你有喜欢与人工智能女友交往的年轻人。另一方面,你有那些希望相信某种更大事物来填补空虚感的年轻人。谁会介入呢?
Tom:
是的。而且我认为没有一个共同的叙事方式真的让我感到紧张。所以尤瓦尔·诺亚·赫拉利(《人类简史》作者)经常谈论,嘿,让人类变得如此有趣的事情不仅在于,我们能够以非常灵活的方式组织在这些庞大的群体中,但不像蚂蚁必须以非常严格的方式去做,我们可以以一种非常灵活的方式去做。但我们是通过这些共同的叙事方式来做的。
很长一段时间,宗教是给人们提供共同叙事方式的东西。但随着宗教的解体,我们进入超个性化时代,一切都开始分化,然后你把这个想法与我从乔丹·彼得森那里听到的想法相结合。我几乎可以确定他也是从别人那里听来的。但这个想法是每个人都必须经历一个救世主般的阶段,他们想要真正地为世界做出贡献。他们想要感觉自己很重要。
然后他们开始依附于所有看似好的抽象事物,比如气候变化。但当你把气候变化作为你拯救世界的方式时,你开始进入,好吧,为了制作煎饼,打碎一些鸡蛋也没关系的领域。然后它迅速堕落……你说过你还没有真正考虑过这个问题,但是我非常好奇,至少在实时中,你是如何看待我们是否需要给人们一个统一的叙事方式?如果是这样,我们应该怎么做?
Emad:
我们需要讲述关于未来的更好、更积极的故事。这些都是关于普及教育、全民医疗保健、解决宇宙奥秘等的故事。所以我有很多……因为那是人类的希望,对吧?我们看到的很多东西都是
反乌托邦,因为你看着老虎,你发现人工智能就是丛林中的老虎。
写一只老虎很难,但也许这是我们可以在两秒钟内Stable Diffusion做出的一种很酷的画面,对吧?因为它确实具有潜在结果的双重性,而且也许实际上是所有结果。那么我们应该讲哪些故事呢?我认为这又是美国身份危机的一部分?今天的美国故事是什么?经历了很多轮回,美国人相信什么?美国想要什么?我不确定美国人希望美国成为什么样的国家。我不确定中国人希望中国成为什么样的国家。我不确定人们想要什么。我认为很难思考你的目标函数是什么,你将如何衡量你的生活和其他事情。
宗教充满了很多这样的东西,但它仍然存在。宗教并没有消失。
世界上一半人都有宗教信仰,对吗?更有可能。就像你实际看到的数字一样,当然,它在某些地区有所下降,特别是像美国这样的地方,但在世界其他地方它正在强劲。而且这个数字还在增长,因为他们比无宗教信仰的人有更多的孩子。也许这填补了一个空白,但是这项技术将如何改变宗教呢?
我们需要讲述关于未来更好、更积极的故事。这些是普遍教育、普遍医疗保健、解决宇宙的奥秘等故事。因为这是对人类的希望,对吧?
我们看到很多都是反乌托邦,因为你在盯着老虎,你把人工智能看成了灌木丛中的老虎。要捕捉一只老虎是很困难的,但也许这是一个酷炫的画面,我们可以在两秒钟内做Stable Diffusion生成,对吧?因为它确实具有多种可能性的双重性,也许它实际上是所有可能性。
那么我们应该讲述哪些故事?我认为这又是一次危机,关于美国身份是什么?今天美国的故事是什么?在你们经历了许多循环的情况下,美国人相信什么?美国希望它成为什么?我不确定美国人希望美国成为什么。你知道的,我不确定中国人希望中国成为什么。我不确定人们希望什么。我认为这很难考虑你的目标是什么,你将如何衡量你的生活和其他事物。
宗教填补了很多这些方面的东西,而且它仍然在填补。世界上一半的人信仰宗教,对吧?可能还有更多。看一下数字,当然,在某些地区,特别是在美国这样的地方,宗教信仰有所减少,但它在世界其他地方依然兴盛。而且它还在不断增长,因为宗教信仰者比非宗教信仰者多生育更多的孩子。
也许宗教填补了一个空缺,但宗教会如何随着科技的发展而转变呢?
Tom:对,你认为宗教国家会因为有更好的共同叙事方式而在未来传承下去吗?
Emad:不,因为他们真的是字面上的传承。他们会像繁殖一样传播。
Tom:即使这样的故事最终将推动他们前进?
Emad:
我想可能是这样。但是,基督教与人工智能或伊斯兰教与人工智能的本质是什么?伊斯兰教实际上是受人工智能影响最严重的一个。
Tom:为什么?
Emad:
基督教和什叶派伊斯兰教,你有教皇,你有新教,你有这个,每一个都有自己的结构。逊尼派伊斯兰教基于对文本的解释,但因为文本变得太复杂,解释在16世纪左右就停止了。当你把人工智能应用于其中会发生什么?任何人都可以解释这些文本,拥有所有上下文和细微之处。而且逊尼派伊斯兰教没有集中的权威,而逊尼派伊斯兰教是十亿人。这将是非常有趣的。这对新教徒会产生什么影响?
当你突然有了一个增强解释文本和讲述更具共鸣和更好故事的支派,宗教会变成什么样子?
哦,天啊,有很多值得思考的地方,对吧?
Tom:人工智能会变成上帝吗?
Emad:
有些人正在努力建立一个人工智能上帝,就是超级人工智能。你看一下那些试图建立超级人工智能的人的声明,他们试图建立上帝。因为它将带来乌托邦或者杀死我们所有人。这听起来又非常古典,对吧?
而且他们对此深信不疑,他们真的相信自己将拯救世界或摧毁世界。
是的,我们又回到了黑暗的地方,不是吗?
Tom:是的,这是真的。
Emad:
重拍《权力的游戏》第八季,来吧,让我们开始吧。让我们把这项技术用于酷炫的事情。
在《头号玩家》中建立“绿洲”,减去虚拟货币的交易和令人讨厌的青少年,这一点我正在努力做到。
Tom:你说的对,我实际上正在研究这部分。
Emad:
好的,现在与正在观看的年轻人交谈。他们感到恐惧。他们想要未来的保障。
他们应该怎么办?现在应该怎样保护自己的未来?
他们只需要投身于这个领域。实际上很少有人在做这件事,所以如果你全身心地投入到这个领域,并怀着真正开放的心态,你实际上可以对未来产生影响。
因为你的社区中的每个人都将使用这项技术。如果你是一个听这个播客的人,那么你认识的每个人都会使用它。当然,也许没有互联网的人除外,但你并不了解这些人。
因此,你成为一个集结点。你成为领先于其他人的这个领域的专家。因为现在进入其中的任何人都将几乎无法被后来的人超越。这是一种财富之权,对吧?
因为你将在最初看到它。这是我认为我们所看到的最大变化。再次思考一下,当你在键入和观察这个过程时,想象一百万个这样的过程在同时进行,效果会更加惊人。
这是不可避免的。所以我会说,你必须投入其中。你必须充满激情。你必须思考不好的方面,但这真的是你的责任吗?我认为是的,但将注意力集中在好的方面,关注它在不同尺度上产生的真正积极的改变。这可能影响你的经济收入,也可能影响你的社区,甚至可能影响你的生活。因为它会影响你认识的每个人。
所以我会带着积极的心态前进,把让我们这种沉闷的老家伙去思考所有灾难性的情况。
Tom:好吧,Emad,人们可以在哪里关注你?
Emad:我的 Twitter,也请关注 StabilityAI。那是我们主要的发声平台。
Tom:
太好了。好吧,各位,如果你还没有订阅,请务必订阅并在你的生活中运用一些人工智能。直到下一次,我的朋友们,成为传奇。保重。和平。