Cointime

扫码下载App
iOS & Android

Meta的大语言AI模型意外泄露,掀起一系列ChatGPT替代品创新!

使用 Midjourney 创建

LLama效应:一次意外的泄漏如何引发了一系列令人印象深刻的ChatGPT的开源替代品

开源和基于API的分发之间的摩擦是生成式人工智能生态系统中最有趣的战斗之一。在文本到图像领域,Stable Diffusion的发布清楚地表明开源是基础模型可行的分发机制之一。然而,在大语言模型(LLM)领域,最重要的突破来自GPT-4、Claude和Cohere等模型,这些模型仅通过API提供。这些模型的开源替代品在遵循人类指令方面没有展现出同样水平的性能。然而,一个意外的研究突破和泄露版本正在改变这种情况。

几周前,Meta AI宣布了Llama,一个旨在推进该领域研究的LLM。Llama发布了不同的版本,包括7B、13B、33B和65B的参数,尽管比其他模型小,但在许多任务中能够与GPT-3的性能相匹配。Llama最初没有开源,但在其发布一周后,该模型在4chan上被泄露,引发了成千上万的下载。

在过去的几周里,本来可以被看作是一个不幸的事件,却成为LLM领域最有趣的创新来源之一。自从Llama被泄露后,我们看到了建立在它之上的LLM代理的爆炸性创新。仅举几个例子:斯坦福大学发布了Alpaca(https://crfm.stanford.edu/2023/03/13/alpaca.html),一个基于LLama 7B模型的指令跟随模型。

在这个列表中,还有几个项目值得一提,我相信很快会有更多的项目发布。有一件事是肯定的:Llama的意外泄露可能变成了开源LLM领域最大的创新火花之一。

ML研究

OpenAI的安全性

OpenAI发表了一篇详细的博文,概述了用于确保其模型安全的一些原则。该文章强调了隐私、事实准确性和有害内容的预防等方面,这对基础模型的广泛采用至关重要(https://openai.com/blog/our-approach-to-ai-safety)。

BloombergGPT

彭博社发表了一篇论文,介绍了BloombergGPT,一个在金融数据中微调的500亿LLM。该模型以BLOOM为基础,在3630亿个token数据集上进行了微调(https://www.bloomberg.com/company/press/bloomberggpt-50-billion-parameter-llm-tuned-finance/)。

任何细分市场

Meta AI发表了一篇论文,概述了Segment Anything Model(SAM),一个用于图像分割的大规模模型。该模型与Segment Anything 1-Billion mask dataset(SA-1B)一起开源,SA-1B是有史以来发布的最大的计算机视觉分割模型(https://ai.facebook.com/blog/segment-anything-foundation-model-image-segmentation/)。

Koala

伯克利人工智能研究中心(BAIR)发布了一篇论文,详细介绍了Koala,一个为学术研究微调的对话模型。该模型以Meta AI的Llama为基础,与ChatGPT的性能相匹配(https://bair.berkeley.edu/blog/2023/04/03/koala/)。

用于超参数优化的BayesOpt

谷歌研究院发表了一篇论文,将超参数优化建模为Bayesian优化问题。该论文提出了Hyper BayesOpt,一种超参数优化算法,在BayesOpt中不再需要量化高斯过程的模型参数(https://ai.googleblog.com/2023/04/pre-trained-gaussian-processes-for.html)。

很酷的人工智能技术发布

Vicuna

Vicuna是一个基于Meta AI Llama的开源聊天机器人,与ChatGPT的质量相匹配(https://vicuna.lmsys.org/)。

ColossalChat

Colossal-AI项目的团队开源了ColossalChat,这是ChatGPT的一个开源克隆版本,具有RLHF功能(https://medium.com/@yangyou_berkeley/colossalchat-an-open-source-solution-for-cloning-chatgpt-with-a-complete-rlhf-pipeline-5edf08fb538b)。

真实世界的ML

LinkedIn的生成性人工智能

Linkedin讨论了一些构建生成式人工智能应用的经验教训和最佳实践(https://engineering.linkedin.com/blog/2023/our-learnings-from-the-early-days-of-generative-ai)。

Lyft的建议

Lyft讨论了在他们的推荐系统中使用的ML模型和架构(https://eng.lyft.com/the-recommendation-system-at-lyft-67bc9dcc1793)。

其它AI新闻

AI传奇人物Andrew Ng和Yann LeCun录制了一个会议,表达了他们对AI暂停提案的反对意见。

Quantexa为其基于人工智能的金融欺诈预防平台融资1.29亿美元。

Adthos推出了其使用生成性人工智能创建音频广告的平台。

Meta公司讨论了他们使用生成性人工智能来创建广告的举措。

机器人公司Covariant又筹集了7500万美元。

人工智能搜索公司Glean将生成性人工智能功能纳入其搜索平台。

一些泄露的文件显示,OpenAI的竞争对手Anthropic打算在未来两年内筹集约50亿美元。

评论

所有评论

推荐阅读

  • 美FDIC拟为寻求发行支付稳定币的受监管机构建立申请程序

    美国联邦存款保险公司(FDIC)宣布批准一项拟议规则,为寻求发行支付稳定币、并且受联邦存款保险公司监管的机构建立申请程序,目前已开启为期 60 天的公众评论期,据悉这是《GENIUS 法案》 “美国稳定币创新法案 ”通过后首个正式的规则制定提案。

  • BTC突破88000美元

    行情显示,BTC突破88000美元,现报88002.21美元,24小时涨幅达到1.34%,行情波动较大,请做好风险控制。

  • Bitwise认为2026年处于加密货币牛市并发布十大预测

    Bitwise认为2026年将是加密货币牛市的一年。从机构采用到监管进步,加密货币目前积极的趋势过于强劲,难以长期被压制。以下是Bitwise对未来一年的十大预测。 预测 1:比特币将打破四年周期,创下历史新高。 预测 2:比特币的波动性将低于英伟达。 预测 3:随着机构需求加速,ETF将购入超过100%的新增比特币、以太坊和Solana供应量。 预测 4:加密货币股票的表现将优于科技股。 预测 5:Polymarket 的未平仓合约量将创下历史新高,超过 2024 年大选时的水平。 预测 6:稳定币将被指责破坏新兴市场货币的稳定。 预测 7:链上金库(又称“ETF 2.0”)的资产管理规模将翻一番。 预测 8:以太坊和 Solana 将创下历史新高(如果 CLARITY 法案获得通过)。 预测9:常春藤盟校一半的捐赠基金将投资加密货币。 预测10:美国将推出超过100只加密货币挂钩ETF。 额外预测:比特币与股票的相关性将会下降。

  • 中国置业投资计划购买并持有BNB作为战略储备资产

    中国置业投资(00736)发布公告,为推进公司资产配置多元化及把握数字经济发展机遇的战略,已决议公司计划使用自有资金,在遵守相关法律法规及风险管控的前提下,于公开市场购买并持有BNB (Binance Coin)及其他合适的数字资产,作为公司的战略储备资产。公司长期看好数字资产行业的发展前景,并对BNB所依托的运营主体及其技术研发、生态布局与行业竞争力抱有充分信心,认可其在区块链领域的长期发展潜力与价值成长空间。 该计划拟动用的资金全部来源于公司现有的自有资金,资金调配符合公司财务管理规範及整体经营规划,不会影响公司日常业务的正常开展。董事会将根据市场情况,在授权额度内分批实施购买。

  • 美国白宫国家经济委员会主任哈塞特:在供应方面出现积极冲击的情况下,降息仍存在许多空间。

    美国白宫国家经济委员会主任哈塞特:在供应方面出现积极冲击的情况下,降息仍存在许多空间。

  • 稳定币支付公司 RedotPay 完成 1.07 亿美元 B 轮融资

    专注于稳定币支付的香港金融科技公司 RedotPay 宣布完成 1.07 亿美元 B 轮融资,Goodwater Capital 领投,Pantera Capital、Blockchain Capital 和 Circle Ventures,以及现有投资者 HSG(前身为红杉资本中国)参投。

  • 币安 Alpha 将于 22:00 上线 Theoriq(THQ)

    币安 Alpha 上线 Theoriq(THQ),Alpha 交易将于 2025 年 12 月 16 日 22:00(UTC+8)开始。持有至少 220 个币安 Alpha 积分的用户可申领代币空投。在 Alpha 活动页面申领 400 个 THQ 代币空投。 本次活动采用“扣分递减”模式,活动开始的第一分钟,申领空投将消耗 30 个币安 Alpha 积分。若活动未结束,此后每过一分钟,领取所需消耗的积分将减少 1 分,最低可降至 10 个积分。

  • 美国10月政府部门就业人口大减15.7万人

    美国劳工统计局公布11月非农报告和10月部分非农数据,数据显示,美国11月非农就业人数增加6.4万人,各行业中,增幅最大的是医疗保健和社会援助行业,为6.4万人,减幅最大的是运输和仓储行业,为减少1.77万人。10月份非农就业人数大减10.5万人,其中减幅最大的是政府部门,大减15.7万人,为连续两个月录得就业岗位减少;增幅最大的是医疗保健和社会援助行业,为增加6.46万人。

  • 美国10月就业人数出现2020年底以来的最大降幅

    美国劳工统计局周二公布的数据显示,11月份非农就业人数增加了6.4万人,而10月份减少了10.5万人。上个月的失业率为4.6%,高于9月份的4.4%,为2021年以来的最高水平。美国劳工统计局不得不放弃公布10月份的失业率,因为它无法在政府关门后追溯收集该数据。而10月份就业人数的下降是自2020年底以来的最大降幅,原因是参加特朗普政府的买断辞职计划的工人正式退出就业名单,联邦政府就业人数减少了16.2万人。

  • 美国11月失业率意外上升或引发美联储关注 劳动参与率回升料缓解部分担忧

    分析师Anstey速评美国非农报告指出,11月非农就业数据小幅高于预期,录得6.4万个。11月失业率意外升至4.6%,这可能引起美联储的关注。不过劳动参与率有所上升,因此失业率的上升未必完全是坏消息,我们还需细看具体数据。美国股指期货走高,两年期美债收益率下跌——基于过去数月非农就业数据的疲软表现,市场对美联储进一步放宽货币政策的预期有所升温。需注意的是,8月和9月的数据也被合计下修了3.3万。