聊一聊Sam Altman的Who will control the future of AI?

今天随便翻了翻X,看到了 Sam Altman 7月底发的一篇推文,说的是他在 Washington Post 上的一篇文章,Who will control the future of AI? ,从他说的 U.S. need to maintain its lead in developing in AI 来看,就显然可以看出他不会是那种希望全球共同发展AI的和平主义者,而是更希望美国进行独裁的支持者。之前对于他的各种新闻我也看过了很多,更对于 OpenAI 的发展也是越来越抱有怀疑态度,尤其是从之前的内部动乱到后来 Karpathy 大神的离职,感觉 OpenAI 逐渐就是变成他的 CloseAI,而且现在无论是闭源的 Anthropic 还是开源的 Meta ,都隐隐有着超越之势,也许不久的将来,OpenAI 会被拉下神坛。

他的这篇文章主要是有这么几个观点:

  1. 美国的 AI 公司和行业需要制定强有力的安全措施,以确保我们的联盟在当前和未来的模型中保持领先地位,并使我们的私营部门能够创新;
  2. 基础设施决定 AI 的命运;
  3. 必须制定一个连贯的 AI 商业外交政策,包括明确美国打算如何实施出口管制和外国投资规则,以全球构建 AI 系统;
  4. 需要创造性地思考建立新模型来确立开发和部署 AI 规范的世界,特别关注安全性并确保全球南方和其他历史上被落下的国家的角色。

从他的角度来思考,他希望美国作为 AI 领域的领导者其实也是合理的,就像我们也会希望中国能达到行业的领先地位。但从这一点可以看出,我们国内的开发者们的确需要考虑不要过分依赖国外的模型或服务,可以将目光也放到国内的一些厂家,虽然一开始我也觉得国内这些大模型公司只是为了一些 KPI 而强行退出的大模型一定很难用,但从这一年各家的成果以及体验来看,和他们相比还不是无法越过的差距。

从 GPT3.5 发布至今, 实力最强劲的还是 OpenAI 和 Anthropic 两家,尤其最近 Anthropic 的发展趋势也有隐隐超过 OpenAI 的意思,我也不止一次在考虑要不要把 ChatGPT 的会员停掉换到 Claude , 但目前还在等到他将 OpenAI 彻底击败的时刻。而国内现在的大模型公司则是百花齐放,而且头部企业也有将自己的模型进行开源或部分开源,比如 Qwen2 还登顶了 HuggingFace 的 LLM Leaderboard ,虽然最近发布的LLaMA 3.1 可能更强,但由于它不支持中文,因此我想最强的开源中文大模型可能还是得属于 Qwen2 。

从 LLaMA 不支持中文的特性也许也能看到一丝跟 Altman 一样的想法,就是美国需要维持模型中的领先地位,这么大参数规模的模型,就算进行中文微调,感觉也不一定能达到英文的水平,那么具体对于国内开发者或企业而言,也许就不会是首选的开源模型。

不过这并不意味着国内开发者就没有好的选择。相反,国内的大模型生态正在快速发展,并且逐渐涌现出一批优质的模型。例如,除了 Qwen2,还有深度求索的 Deepseek, 智谱的 ChatGLM等,都在特定领域表现出色,并且在中文处理上有着天然的优势。对于需要进行中文大模型任务的开发者和企业,这些模型显然是更好的选择。

我个人现在算是忠实的 Deepseek 拥护者,因为没有足够的硬件支持,使用的是他的API,现在是只要有大模型API调用的需求,我首选就是 Deepseek, 而且就在8月2日,他们还上线了硬盘缓存 的能力,我在半个月前还有问他们客服多轮对话的 token 计算问题来着,因为多轮对话每次都要把前面轮次的所有内容全部传进去,导致 token 的使用还挺大的,没想到这么快他们就上线了缓存能力,本来就是比白菜价还白菜价的费用,现在更是划算了。(深度求索打钱😄)。

当然闭源的模型产品如月之暗面的 Kimi, 字节的豆包,都是有着比较好的用户体验,我平常使用的比较多的国内闭源模型产品就是 Kimi,至少从模型表现上还是不错的,尤其是进行文章的阅读以及之前我自己写的 Paper-Agent ,都是使用Kimi的模型能力。

在这样的背景下,国内开发者应该更加关注本土化的发展机遇和挑战。尽管目前国内外在AI技术上的差距仍然存在,但这种差距正在逐渐缩小。通过积极参与开源社区,推动技术共享与合作,国内的AI生态系统有望在未来几年内实现更大的突破。作为个人开发者或者中小型企业也许没有参与基座大模型的战场,但从模型的应用上,还是有着很大的市场空间。

虽然想要真正的进行模型商业使用,如果不使用模型产商的api而是进行私有的训练或部署,小体量的模型很难上战场,大体量的又承担不了成本。可未来会一直维持这样的尴尬境地么?我想不会,正如最近贾扬清说的 Is LLM model size re-walking the path of CNNs? 以及 Karpathy 说的 LLM model size competition is intensifying… backwards!,未来大模型的发展可能会逐渐变成尺寸越来越小的模型,而硬件的发展也有着黄仁勋的黄氏定律(虽然咱国内不一定能用上最强版本),因此对于大模型行业,资源成本应该是逐步降低的趋势的。

最后,尽管美国在AI领域拥有显著的先发优势,但全球AI技术的竞争格局正在发生变化。各国在技术创新、政策制定和市场应用方面的互动与博弈,将深刻影响AI的未来发展路径。对于每一位AI从业者而言,如何在这一快速变化的环境中抓住机遇,实现技术与应用的创新,是一个值得深思的问题。

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇