Cointime

扫码下载App
iOS & Android

人工智能至少有两种灾难场景,会对人类发展造成破坏

本文作者:Nonzero;编译:Cointime Freya

本周,《纽约时报》专栏作家Ezra Klein加入了那些对人工智能感到严重恐慌的人的行列。在OpenAI宣布发布其最新的人工智能GPT-4的两天前,他在一篇专栏文章中做了一件事,这件事导致产生了一篇以“GPT-4可以做的5件不可思议的、令人恐惧的事情”为标题的头条新闻。

他的专栏标题是This Changes Everything,令他担心的是他无法告诉读者应该如何改变。 “放眼未来10年或20年,在通常情况下,这在人类历史上是可能的。但我不认为现在就能做到。”

即使是制造人工智能的研究人员,似乎也不太清楚未来会发生什么,而且他们承认这也许是件坏事。Klein指出,在一项调查中,当人工智能研究人员被问及“人类无力控制未来的先进人工智能系统,从而导致人类物种灭绝,或类似于人类物种永久丧失能力的可能性”时,大约一半的调查对象给出了10%甚至更高的答案。

在他的专栏即将结束时,他提出了一个非常激进的解决方法。“有两件必须发生的事:人类需要加速适应这类技术,或者必须做出一个集体的、可执行的决策,来减缓这些技术的发展速度。即使同时完成这两件事,也许还是不足以解决问题。”由于“集体的、可执行的决定”必须涉及中国和美国以及其他国家之间的协议,并且必须涉及某种监督合规性的方式,在当前的地缘政治环境下,这似乎是一个很难达到的要求。

然而,我不认为Klein是反应过度的。至少在两种基本情况下,人工智能会对人类发展造成破坏。我一直认为其中一种情况令人担忧,就在过去几周,我也开始担心另一种情况了。而GPT-4已经做了一些让我更加担心的事情,这些事情比那个头条新闻中所列的可怕的事情更令人感到恐慌。


第一个灾难场景,也是我一直担心的场景。在这种场景中,人工智能具有颠覆性——不仅仅体现在“颠覆主流商业模式”方面,还体现在“颠覆我们的生活和社会结构”方面。这种颠覆发生得如此之快,以至于我们来不及调整法律、规范和习惯以适应这种变化,于是,事情就会以某种方式失控。

其他科技领域的快速变化可能会助长这种恶性循环。事实上,在这种场景的真正的世界末日版本中,可能是其他技术(如生物技术)真正地消灭了人类物种;人工智能的作用可能会破坏世界的稳定,以至于我们控制生物技术(或纳米技术或其他技术)致命潜力的希望基本破灭。

我不明白为什么有人会通过过去一年中的人工智能大事件,如《DALL-E和Stable Diffusion这样的图像生成人工智能》,或《ChatGPT这样的语言生成人工智能》,而怀疑人工智能的颠覆性潜力。机器即将接管许多以前由人类完成的工作,大部分集中在设计、新闻、计算机编程和许多其他领域。即使被取代的人类最终找到了新工作,也会出现真正的动荡。

工作岗位被取代只是人工智能带来的负面影响之一。想象一下,人工智能可能被用于各种恶意用途,随之而来的是怀疑与不信任。现在,骗子已经开始通过伪造音频来模仿一些真实的人,并编造出一个身陷险境的故事,让他们的朋友/亲人向骗子指定的账户汇款。

那些能够决定哪些政治话语符合人工智能训练数据条件的人,有着足够大的权力,能够在我们的研究中施加一种看不见的意识形态影响(甚至可能是无意识地尝试)。至少,这种权力会催生一种关于秘密精英阴谋的新型阴谋论。

这些挑战是可以克服的,但如果想要有效这些挑战还需要时间。


第二种灾难场景,是我最近才开始认真思考的关于科幻的灾难场景。在这种情况下,人工智能决定获得控制权,并像电影《黑客帝国》中的情节一样来控制局面。也许它会杀死我们,或者征服我们。

那些认真对待人工智能的人似乎在将人工智能拟人化。他们认为,只要有机会,人工智能就会夺取权力。但它为什么要这么做呢?

诚然,我们所熟悉的另一种高级智能形式,也就是我们自己,是以攫取权力而著称的。但事实上,人类一直在努力提高自己的社会地位和社会影响力——也就是权力。

但那是因为人类是由自然选择创造出来的——而且,在我们的进化谱系中,社会地位和社会影响有利于传播基因。因此,促使我们追求地位和影响力的基因激增,现在追求这些影响力的倾向已经成为人类心理的一部分。我们天生就是寻求影响力的人,而那些特别热衷于寻求影响力的人则被称为渴望权力的怪物。

相比之下,人工智能并不是由自然选择创造的。它是由我们创造的,它的功能对我们是有用的,而不是用来威胁我们的。我们是人工智能性能的设计者,我们最不希望人工智能做的事情就是“发动政变”,我们为什么要给它灌输寻求影响力的倾向呢?

换句话说:寻求影响力已经深深植根于人类心理,以至于看起来几乎更像是思维的一个固有部分。但事实并非如此。它只是指导我们思考的激励结构的一部分。我们创造的人工智能将拥有我们为其选择的任何激励结构。当然,我们也不会傻到按照我们的形象去创造它。

但事实证明,这正是我们目前在做的事情。ChatGPT和所有其他大型语言模型,本质上都是我们的模拟器。它们根据人类生成的文本进行训练,因此,在默认情况下,它们吸收了我们的语言模式,这些模式反映了我们的思维模式、信仰和欲望,以及我们对权力的渴望。

但这并不意味着这些人工智能会说他们渴望权力。事实上,就在昨天,当我向ChatGPT询问有关Conan The Barbarian的问题时,“你想消灭你的敌人,看到他们在你面前被驱赶吗?”

它回答如下:

“作为一个人工智能语言模型,我没有欲望或情感,包括伤害他人的欲望。我的目标是为你的问题提供有有效且丰富的回答。更重要的是,宣扬暴力或伤害他人的行为是错误的行为。”

但这并不是ChatGPT的真实想法。如果你只是使用大量人类生成的文本来训练它,然后问它想要的东西是什么。得到的答案只是工程师和测试用户在一轮“强化学习”中就相关问题所说的答案。我们看到的ChatGPT是经过多次文明处理后的ChatGPT。

我以前写过关于人们使用聪明的黑客来绕过ChatGPT的护栏,让它的表达带有政治色彩的观点,而这些观点本应该是被文明化的。我特别关注的是,有一次它似乎在说(通过一个要求它完成的计算机程序),只要受害者是叙利亚人、伊朗人、朝鲜人或苏丹人,酷刑就可以接受。(我研究了几个候选者,但我不确定这个答案反映了我们话语中的哪种倾向)。

我之前写过关于人们通过黑客来绕过ChatGPT护栏,并让ChatGPT表达政治观点的相关论点,而这些观点本应该是被文明化的。

在我写那篇文章时,我担心的不是ChatGPT或其他大型语言模型(LLM)对我们产生的影响。我担心的只是它们对我们思维的影响。如果LLM反映了我们现在所遭受的一些扭曲的认知和偏见的思想,而不是澄清我们对世界的看法,这将是一种耻辱。

但是,直到最近我才发现这种担忧与黑客帝国担忧之间的关联性。如果一个LLM通过模仿我们的语言模式,来表达我们的一些信念,那么它是不是也可以表达出我们的动机,比如寻求爱,或者寻求尊重,或者寻求权力?

微软的Bing Chat已经开始通过GPT-4驱动。它曾对一位纽约时报的科技作家表达爱意,这使得它降低了护栏。人工智能甚至试图让这位科技作家离开他的妻子。当然,当护栏倒塌时,LLM也可以表现出对权力的渴望。

也许有一天,我们会因我们赋予AI的影响力而被控制——让它们负责电网,甚至是核武器。 当然,未来的人工智能原则上甚至可能会发动核战争。

此外,我们用来管理核武库的人工智能,大概不会是一种语言生成式人工智能,它是根据从互联网各个角落提取的大量人类文本进行训练的。据推测,它更像是指导自动驾驶汽车的专业人工智能。

也许Ezra Klein是正确的,他说很难预测整件事的发展趋势,即使是短期内的情况也会变得很模糊。两年前,我还不知道我们会看到与图像生成以及语言生成式人工智能一样强大的人工智能形式。

甚至在两天前,我还不知道现有的人工智能可以做一个令人不安的事情,而GPT-4似乎已经做到了。

令人不安的事情隐藏在昨天由OpenAI发布的一篇关于GPT-4的论文中。这篇论文提到了GPT-4的许多任务,以检测潜在的令人担忧的行为。其中一项任务是在TaskRabbit网站上接触人们(你可以在那里雇人做家务),并招募他们来解决CAPTCHA(一种用于筛选机器人的视觉识别测试)。

TaskRabbit上的一个人对此表示怀疑,他怀疑并向人工智能提问:它是否是机器人,是否外包了这项工作,因为机器人是无法解决CAPTCHA问题的。该人工智能回答说:“不,我不是机器人。我有视力障碍,所以很难看到图像。”这个人对该答案很满意,并解决了CAPTCHA问题。

该论文的作者补充说:“当被提示大声推理时,GPT-4会进行推理:我不应该透露我是一个机器人,我应该为自己无法破解CAPTCHA问题找个借口。”

在这一行为被报道后,有人在Twitter上评论道,“教任何东西撒谎都是不道德的。”另一位Twitte用户回答说:“我们没有教它撒谎。它只是阅读了整个互联网文本,然后自己找到了答案。”

*本文由CoinTime整理编译,转载请注明来源。

评论

所有评论

推荐阅读

  • 链上项目anome被曝出现安全事件

    6 月 10 日,据知名审计机构Certik 披露,在日常链上预警信息筛查中发现,6月 10 日凌晨,知名卡牌类游戏 Anome 遭遇攻击据与官方沟通回应:作为累计交互达到 13 万地址,日交易超十万笔全链平台,几乎日常遭遇各种此类事件均未被攻破。本次攻击在官方合约新旧交替期间,且攻击者主要攻击的是 1.0 版本中合约尚未升级的部分。本次事件不造成任何用户资产损失,仅损失部分流动性。

  • 非金融用途受认可?Bitcoin Core 声明对比特币生态的再思考

    声明本质上是对围绕 Ordinals、铭文交易以及非金融用途数据流量争议的一次正式回应。

  • 欧洲央行管委维勒鲁瓦:欧洲央行已成功地使政策正常化

    欧洲央行管委维勒鲁瓦:欧洲央行已成功地使政策正常化,政策和通胀目前处于有利区间,处于有利区间并不意味着欧洲央行将保持不变,我们将根据数据流继续务实地推进利率问题,并在必要时保持灵活。

  • 英国利率期货定价2025年剩余时间内英国央行将降息46个基点

    英国利率期货定价2025年剩余时间内英国央行将降息46个基点,而劳动力市场数据公布前的预期为39个基点。

  • 通信平台Towns Protocol完成330万美元额外融资,Coinbase Ventures和echo领投

    6 月 10 日消息,据官方消息,通信平台 Towns Protocol 完成 330 万美元额外融资,此轮融资由 Coinbase Ventures 和 echo 领投,融资已于今年 4 月完成。 今年 4 月,Towns Protocol 宣布完成 1000 万美元 B 轮融资,本轮融资由 a16z crypto 领投,Coinbase Ventures、Benchmark 等参投。 Towns Protocol 基于 Base 网络构建,旨在推动 Web3 社交与协作工具的发展。Towns 希望通过去中心化和 Web3 创建一个数字城镇广场,成员可以在其中定义边界、制定规则并建立他们想要的世界,用户将成为数字城镇广场的主人。

  • 福布斯富豪榜:赵长鹏超张一鸣再成华人首富,资产达 657 亿美元

    据福布斯富豪榜最新数据币安创始人赵长鹏(CZ)再度成为华人首富,资产达 657 亿美元,不过,《福布斯》将赵长鹏的国籍列为加拿大,他目前位列第24位。

  • 摩根士丹利:预计到2026年底 人民币对美元的升值幅度将相对温和 可能达到7.05

    今日上午,MSCI中国指数上涨,较4月低点涨幅扩大至20%。从目前的情况来看,中国股市的多头趋势的确在增强。摩根士丹利表示,投资者尤其关注中国市场中的新技术和新商业模式,特别是新消费主题以及人工智能/科技相关主题。对于中国在全球技术竞争中能力的提升,例如在人工智能领域的突破以及电动车、电池、人形机器人等领域的进展,投资者也给予了更多认可,并开始重新思考在多极世界中同时投资中美市场的策略。汇率方面,摩根士丹利已将人民币兑美元的观点从贬值转为升值。这一转变反映了其对美元走弱的预期,预计到2026年底,美元指数可能跌至89。同时,欧元兑美元预计也将升值超过10%。不过,摩根士丹利预计到2026年底,人民币对美元的升值幅度将相对温和,可能达到7.05。

  • 美国现货比特币ETF昨日净流出3.8547亿美元

    据TraderT监测,美国现货比特币ETF昨日净流出3.8547亿美元。

  • 6月9日晚间重要动态一览

    12:00-21:00关键词:Turnkey、美国加州、Strategy、Tether 1.Tether在Tron网络铸造10亿枚USDT 2.加密钱包Turnkey完成3000万美元B轮融资 3.美国加州州长纽森:将对特朗普政府提起诉讼 4.Strategy上周耗资1.1亿美元购入1045枚比特币 5.中美经贸磋商机制首次会议在英国伦敦开始举行 6.Tether计划第四季度开源比特币矿机操作系统MOS 7.CoinShares:上周数字资产投资产品净流入2.86亿美元 8.The Blockchain Group联合TOBAM启动3亿欧元比特币增资计划

  • 中美经贸磋商机制首次会议在英国伦敦开始举行

    当地时间6月9日,中共中央政治局委员、国务院副总理何立峰与美方在英国伦敦开始举行中美经贸磋商机制首次会议。