数据猿人工智能2024年度总结:我们经历了波澜壮阔的这一年

来源:安博体育app地址下载    发布时间:2025-01-26 13:39:03  阅读次数:131 次

数据猿人工智能2024年度总结:我们经历了波澜壮阔的这一年:

  2024年逐渐远去,新的一年悄然而至,回顾这一年,科技界和风险投资圈的目光无疑聚焦在了人工智能。层出不穷的新产品,巨额的融资,独角兽创始人不断刷新人们的观念,如同走马灯般,你方唱罢我登场,而看客每天都在期待下一个大新闻。

  诚然,2024年能够说是生成式人工智能大模型领域承前启后之年,虽然未再现GPT-3和ChatGPT横空出世的震撼,但在延续前几年技术积淀的基础上,开启了广泛应用的时代。从AI技术首次涉足诺贝尔奖评选,到Cursor作为AI辅助编程的标杆工具彻底改变开发者的工作方式,再到Perplexity、Talkie等现象级AI应用打入大众市场,以及Sora在多模态生成领域进一步接近自然和人类规律,生成式AI展示了从技术探索迈向实际应用的巨大势能。

  与此同时,算力仍然是推动技术进步的关键瓶颈,高昂的研发成本也随之攀升。此外,技术幻觉问题以及隐私与伦理方面的挑战依旧悬而未决。尽管大模型在技术上不断取得进展,吊足了胃口的人类,已不再满足于GPT o1的能力,而是期待通用AI(AGI)的世界马上到来。与这一宏大愿景形成对比的是,生成式AI的焦点正在慢慢地转向小模型的高效化以及低能耗解决方案,以便更加深入广泛的行业应用。另外,日益强化的行业监督管理和愈加激烈的市场之间的竞争,也为这一领域的发展增添了更多变数与挑战。

  接下来,让我们回到2024年,共同回顾生成式AI在这一年中波澜起伏的发展历程。

  在这一年中,生成式AI技术的前行步伐虽不如前几年那般势如破竹,但从深度到广度的突破依然令人瞩目。

  接近年底时刻,2024年12月5日 - 21日,人工智能的头号玩家OpenAI马不停蹄地做了为期12天的直播。最后1天,OpenAI重磅发布新一代推理模型系列o3,其在极其困难的数学和逻辑问题能力基准测试ARC-AGI中,最佳状态下取得了87.5%的分数,达到85%的分数即被认为是“人类水平”,而在Codeforces竞赛编程上的评分达到2727,也超越了大部分人类程序员。

  去年,OpenAI还有两个里程碑式的大模型发布。一是最早于9月发布的o1模型,代号“草莓”,尽管它的性能要低于后来发布的o3模型,但其里程碑意义不容忽视。o1模型首次实现了在回答用户提问时,形成类似人类思维方法的内部思维链CoT(Chain of Thought),这一突破明显提升了模型在处理复杂和专业性问题时的表现,尤其是在研究、策略制定、编码、数学和科学等领域的高难度任务中,回答的准确性和逻辑性得到了明显改善。“思维链”这一概念也迅速走红,成为2024年大模型领域最常被提及的技术关键词之一。

  二是早在2月份就预先发布的Sora,十个月后正式对外发布。它支持多种输入方式,如文本、语音、图片或视频,据OpenAI介绍,Sora支持用户生成最高1080p、最长20秒、多种尺寸比例的视频,同时Sora能够理解和模拟物理世界的运动规律,使得模型的生成效果更逼真。此外,Sora还配备了故事板、混剪等编辑功能,相当于给视频加分镜、剪辑、特效,更能满足创作者自我表达创意的需求。

  随着年初Sora的推出,多家科技公司争相发布新的多模态大模型,整个2024年让我们见证了多模态大语言模型(MLLMs)的快速崛起。

  2024年的多模态模型能更自然地融合文本、图像、音频、视频等多种模态的数据,生成高度准确的视觉内容。人们还把多模态延展到三维空间世界,李飞飞创办的World Labs用一张图、一句线D世界的AI系统,堪称“虚拟世界生成器”,该技术将降低3D内容制作的成本、激发更多的沉浸式体验。

  在运算效率方面,2024年的新一代多模态模型通过引入稀疏激活机制、模型压缩和分布式算力架构,大幅度的提高了处理速度和响应效率,与以往需要离线计算或长时间生成的模型相比,性能更出色。此外,这些模型突破了早期多模态技术对单一任务的限制,具备更强的上下文理解能力和任务适配性,可以胜任更复杂的任务,例如根据一张照片生成完整的故事情节,或通过语音输入实现图像增强和视频制作。这些进步让多模态模型在影视及广告行业的应用更广泛,使其大幅提升内容创作效率、显著降作成本成为可能。

  2024年,当AI各类大模型的一直在升级,巨量算力需求持续攀升。为满足日益复杂的任务需求,逐渐增强算力成为推动大模型技术进步的核心动力。

  提及算力必须要提到英伟达,去年其H100 GPU凭借卓越的并行计算能力和显著优化的AI训练与推理速度,成为生成式AI的核心处理器。去年3月,英伟达发布了新一代GPU架构——Blackwell,该架构在训练与推理方面展现出卓越性能,进一步巩固了其行业领导地位。同时,谷歌的TPU和亚马逊的Inferentia等专为AI任务设计的定制芯片也在2024年加速普及,这些AI芯片亦推动了算力效率的持续提升,为AI的深度应用提供了强大支持。

  与此同时,云平台则成为AI算力的最佳载体,它不仅降低了企业和开发者使用高性能AI算力的门槛,还为模型训练、推理和部署提供了强大的基础设施支撑。2024年,这一协同关系在技术和应用领域都实现了重要突破,如英伟达与多家云服务商合作推出了“AI超级计算云”。

  云计算服务模式也在不断演变,模型即服务(MaaS)慢慢的变成为一种新兴的基础服务,通过MaaS,用户无需自行构建或训练模型,即可直接通过API调用云平台托管的大模型。这种模式不仅让原本未采用SaaS的用户感受到云计算的弹性和按需付费的优势,降低开发者的技术门槛的同时,也推动了更多企业主动上云,加速了云计算和AI的融合与落地。

  在2024年,针对大模型长期以来的“幻觉”(Hallucination)问题的缓解方法,业界亦达成了较为明确的共识。“幻觉”是指模型在生成内容时出现的不准确或虚假的信息,成为AIGC投入实际应用的最大障碍。当前,利用Agent和检索增强生成(RAG)技术结合小模型和微调的方法,可以大幅度降低“幻觉”的不良影响,让结果达到需求方可接受的程度。

  Agent架构让大模型能够分解复杂任务,逐步进行推理。与传统的大模型“一步到位”给出答案不同,Agent的多步骤执行机制更接近人类的逻辑思维。例如,在回答涉及多个逻辑链条的复杂问题时,比如金融涉及时事和法律的问题,Agent可以分步调用小模型或外部工具验证每一环节,减少幻觉的产生。

  当用户提出一个问题时,RAG机制让大模型优先从知识库中检索相关文档,这些知识库可能来源于内部文档,也可能是实时搜索获取,然后基于这些可靠数据生成回答,从而显著提升内容的准确性和可解释性,同时大大降低大模型的训练成本。此外,在有些特定领域,如医学、教育,通过微调小模型,可大幅度的提高其在该领域的表现,不仅应对了大模型泛化能力强但特定领域表现不足的短板,亦使其更容易落地到应用场景,由此开启了大模型企业级应用时代。

  谈及应用,2024年可谓是AI大模型应用全方面爆发的一年。在这一年中,大模型不再只是科研论文中的技术突破,停留在ChatGPT 20美元订阅费的体验版,而是广泛推向全球各个应用场景,成为改变行业运作方式的推动力量。从办公效率革命到精准医疗,从智能金融到数字人的直播体验,人们开始利用大模型赋予各行业全新的生命力。

  实际上,从2024年12月的AI排行榜能够准确的看出,MAU(按月活跃用户)排名靠前的AI应用其实是集中在办公效率工具领域,除了ChatGPT、Gemini和Claude等聊天机器人外,许多应用在办公场景中亦表现突出。微软Copilot作为早期的样板,推动了办公工具在2024年的全面发展。文章写作、PPT制作、绘图、视频创作、笔记和语法校正等功能,不仅能为用户节省大量时间,还能生成新颖、有创意的成果。不过此类应用的门槛相比来说较低,同质化竞争较为激烈。同一种需求,市场上有几率存在上百个类似产品,脱颖而出并不容易。

  2024年12月全球AI产品榜(web端),来源:公众号@AI产品榜/p>

  此外,有些专业性较强的领域,像金融、法律、医疗和制造等行业,尽管存在一些具有针对性的AI应用,但即便在行业内部也鲜有应用,尚未实现广泛的“破圈”。对于投入大量开发成本的企业负责人而言,尽管他们绞尽脑汁,尝试为自身行业需求定制“套壳”的AI解决方案,但这些应用往往未能达到预期的用户量,更难以实现销售转化。

  红杉资本在《Generative AI’s Act o1》报告中肯定了AI在各专业场景中通过“Multi AI Agent”实现深度整合的未来趋势,然而,这并非简单的“新瓶装旧酒”,而是对传统数字化的颠覆性革新。与过去的任务编排模式相比,AI Agent正朝着完全自动化的方向迈进,减少甚至无需人工干预,背后应是对行业深度理解基础之上的强大推理能力。红杉的报告人表示,这样的一个过程还在持续进化之中。

  值得注意的是,去年AI搜索引擎——作为一个独特的应用领域,其头部企业在融资方面取得了显著进展。其中,Perplexity AI在12月完成了5亿美元的融资,使公司估值达到90亿美元;此外,企业搜索初创公司Glean于9月宣布完成超过2.6亿美元的融资,估值翻倍至46亿美元;甚至连OpenAI也于7月25日首次推出了搜索引擎产品SearchGPT。

  成功背后的原因,我们大家都认为大多数来源于三大方面,第一是AI搜索依靠的技术已取得了长足进步,正如前面提到的大模型、RAG以及算力,正让搜索出来的结果变得“简单可依赖”;第二,搜索蕴含着巨大的市场,实际是在侵蚀现有搜索引擎的市场空间,AI搜索的前段逻辑是先给出结果,再给出对应的参考网站,这为大量用户节省了二次查找的时间,部分替代了原有搜索引擎的功能;第三,在Agent架构下提供专业领域的知识库,能够灵活地帮助用户查找特定网站或特定专业领域的内容,而传统搜索引擎配置信息源的成本比较高。

  带来更为惊人变化的,还有广告领域。美国数字营销公司AppLovin转型成为AI公司后,股价已从年初的每股38.78美元一度飙升到最高每股417.64美元(2024年12月6日最高价),涨幅超过977%。生成式AI+动态预算优化是AppLovin AI的核心逻辑,从而可提升投资回报率和货币化机会。

  具体来说,AppLovin首先采用生成式AI自动生成个性化广告内容,接触到大量的用户,然后通过AI模型实时监测用户获取成本(CAC)和用户生命周期价值(LTV)来动态调整广告预算,形成一个持续优化的闭环,机器学习则帮助平台逐步提升投放效率并减少相关成本。同时,AppLovin采用多AI Agent协同架构,将复杂的广告运营流程分解为创意生成、行为预测、竞价优化和效果分析等独立的Agent协作运行,如此逐步提升平台的灵活性和效率。

  比Applovin更加迅速崛起的2024年现象级应用,Cursor无疑是最需要我们来关注的一匹黑马。这家基于提示词自动生成应用程序的AI应用公司在去年8月份之前还默默无闻,8月a16z和Thrive Capital给Cursor的投资到位,估值4亿美元,到年底的B轮融资,估值高达26亿美元,12个工程师让公司估值上涨了6.5倍,如今慢慢的变成了百万程序员的必备神器,靠每月20美元的订阅费,让经常性年收入达到1亿美元。

  不只是改变程序员,Cursor重大意义更在于工作方式的变革。在Cursor的世界里流传着一段传奇故事是一位8岁的小女孩利用Cursor在45分钟内就构建了一个聊天机器人,技术对普通人的神奇改变犹如当年的“别针换别墅”;同样不会编程的产品经理陈云飞花了1小时写了一个名为“小猫补光灯”的APP,然后发布在了苹果APP Store,一度在收费榜中排名第一。著名人工智能专家、Coursera创办人吴恩达认为懂AI的产品经理将在未来的市场中占据更重要的位置,AI让开发门槛降低,而对能够明确“构建什么”的人才需求将大幅上升。

  另外值得一提的是2024年获得巨大发展的中国AI出海应用。根据SensorTower发布的2024年上半年美国AI应用市场的下载量多个方面数据显示,排名前十的AI应用中有三款来自中国企业。其中,MiniMax的陪伴式应用Talkie在美国下载量排名第四,超越了美国同种类型的产品领头羊Character.ai。MiniMax的另一款AI视频应用海螺(Hailuo)亦曾在9月登顶全球及国内增速榜首,而在教育领域,Question.AI和Gauth更是双双领跑美国市场,成为行业标杆。

  最近几年,中国科技公司在全球化的运营经验越来越成熟,善于根据目标市场的文化特点和用户习惯调整产品,而且中国出海的AI应用一般会用更超高的性价比的服务策略,例如,通过低门槛的订阅费或免费增值模式吸引大量用户,随后再利用丰富的功能层层加深用户粘性。

  我们再来说说AI硬件,2024年也被视为AI硬件的创新大年。各类硬件设备——从手机、PC、汽车、耳机、眼镜甚至玩具——纷纷融入AI技术,尽管这些AI硬件还未全面渗透到消费的人的日常生活,但通过AI技术的加持,已经增强了原有产品的用户体验。

  苹果和Google推出的AI手机成为这一年行业的标志性事件。前者推出了集成Apple Intelligence的大模型生态系统,将AI深度融入iPhone 16系列手机;后者则在其Pixel系列中强化了多模态交互功能,中国自主研发的手机厂商也纷纷布局这一领域。此前根据赛迪顾问预测,2024年新型AI手机的出货量预计将会达到1.5亿部,占全球智能手机总出货量的13%。

  AI手机各厂商的目标远不止类Siri的升级版或是简单接入大模型,2024年流行的一个名词“端侧AI(On-device AI或Edge AI)”是指在本地设备(如手机、平板、智能手表、智能音箱等终端设备)上运行人工智能模型,而不需要将数据传输到云端进行计算。这样做的好处,除了实时响应与增强体验以外,还能借助App Intents和App Entities,实现相互连通,调起更多的APP。

  尽管不需要特定的手机硬件支持,智谱AutoGLM借助上述理念展现了更为强大的AI助手引起了用户的广泛共鸣,比如用户都能够用语音向安装了AutoGLM的手机提问,“帮我上小红书看看火锅要说明食材”,于是AI智能体上小红书笔记里帮用户去寻找火锅食材,并在“到家App”上自动将上述食材多步骤操作加入购物车并下单。而未来具有端侧AI功能、搭载AI加速芯片的手机将会适配支持更复杂任务交由本地化处理。

  作为AI与机器人产业交汇处的具身智能(Embodied AI),在2024年悄然取得进步。频繁亮相的特斯拉Optimus机器人去年在运动控制和任务执行方面展现出强大的迭代速度,在运动控制、任务执行、学习能力等方面不断的提高水平,业已被特斯拉引入自家的汽车生产线测试。同样,搭载了视觉语言模型(VLM)、可以有效的进行常识性推理,并能与人类进行相对有效沟通的Figure AI人形机器人Figure 02,也于去年11月郑重进入汽车巨头宝马的生产线打工。

  各大车企加速布局人形机器人以外,工业巡检、仓储物流、医疗辅助、建筑与施工、家政服务等领域都在成为具身智能的落地场景。例如Google DeepMind推出的RT-2模型,通过视觉-语言-动作(VLA)模型,将多模态大模型塞进机械臂,使推理与知识赋能给机器人,既能用在家政行业,执行烘焙、清理和准备食材等任务,也能运用在自动化生产线,让我们正真看到通用机器人的可能性。

  而2024年非常关注的世界模型(WFMs)概念,为具身智能的训练与测试开辟了全新范式。机器人能够在虚拟的小世界中进行“试错”和“练习”,从而具备“脑补”的能力,即提前模拟和预测自身动作的结果。这种能力支持具身智能体实现自主决策与持续学习,让机器人从传统的“被动执行”迈向“主动进化”,此被视为迈向通用AI(AGI)的重要一步。

  2024年,大模型已不再是OpenAI的一枝独秀。如果说2023年以Claude和Llama为代表的挑战者只是星星之火,而在2024年挑战OpenAI的大模型已经燎原。例如,DeepSeek v3模型以仅557万美元的训练成本实现了与Claude 3.5 Sonnet等顶级模型相媲美的性能,明显降低了高性能AI的进入门槛。同时,Meta推出的Llama 3.1和Llama 3.2开源模型在多模态能力上取得重大突破,在图像、音频和文本处理方面更加高效。

  我们先来说说Claude,这个大模型的母公司Anthropic是由OpenAI的前核心小组成员于2021年创立,到2024年也不过3年时间。之所以独立出来创业,创始团队认为,随着大模型越来越强大,AI的不可预测性和安全风险也在增加,因此他们提出了“宪法AI(Constitutional AI)”的理念,强调通过内置规则和透明的设计来减少模型的有害输出。

  安全性貌似与普通人无关,不过我们从大模型幻觉角度考虑就容易理解一些,更严格的标准不会让大模型胡说八道,而且,对于金融、医疗和法律等对数据安全与准确性要求高的行业,可靠性与稳定性显得很重要,让其成为企业市场的热门选择。前面提到的当红辣子鸡Cursor,去年毅然将其AI编程助手的默认模型也从GPT换成了Claude。

  受到企业级用户青睐,加上Claude 3.5本身的技术实力,其流量在2024年实现了爆发式增长,从1月的2019万攀升至11月的8932万,增幅高达342%。这一成绩亦与Anthropic的市场策略紧密关联,Claude凭借高性能和灵活架构,成为企业整合AI技术的首选方案之一,同时通过相对低价和良好的企业适配性占据市场优势。据彭博社报道,2024年美国AI初创企业融资达970亿美元,占全年初创融资总额的近一半,创历史上最新的记录,Anthropic抓住这一良机,大幅扩充销售团队规模,从2023年的200余名增长至去年9月的1000余名,同比增长500%,加速向市场渗透。因此,许多中小企业在2024年从开源或其他大模型转移到Claude作为其生成式AI能力的底层支持。

  我们再来看Gemini。Gemini的发展要放在Google的大格局里看。尽管此前有Bert大模型,但2022年底Google并没有跟上Transformer的浪潮,换句话说,Google落后了,不仅落后于微软,也落后于Meta。而2024年,是Google在AI领域奋起直追的一年。

  首先Google想到用AI能力最强的DeepMind的团队,我们都知道DeepMind最成功的作品是阿尔法狗(AlphaGo),尽管过去很多年,实力还在,今年诺贝尔化学奖的两位得主就出自DeepMind,其中一个还是DeepMind的联合发起人兼CEO。

  Google打破部门间的藩篱,将Gemini的主导权交给DeepMind,谷歌首席执行官Sundar Pichai称,此次重组旨在不断加快谷歌人工智能开发的步伐。此次重组效果是明显的,Gemini因此能够融合深度学习、神经网络和生成对抗网络(GAN)等多种先进的AI技术,使其具备更强的自我学习能力和生成能力。

  我们看到去年全面升级后的Gemini 2.0,以多模态为发力点,使其可处理文本、图像、音频和视频等多种输入来源,具备全面的感知与理解能力,进一步接近人类对物理世界的认知。而Gemini 2.0强调的定位——“Our new AI model for the agentic era”,通过多模态的强大能力突破了单一任务的限制,更可能达到智能代理所需的“全面感知 + 自主决策”。

  Gemini的信心还源于Google尤其是云服务的强力支持。在电商冲击广告业务、搜索面临Perplexity围追堵截之时,Google比以往任何一个时间里都更加重视AI的推动作用。2024年,Google Cloud以Gemini 2.0为核心,整合旗下AI模型与组件,对Vertex AI平台做升级,并与其生态系统(如Workspace)实现无缝衔接,旨在吸引更加多的企业客户,从需求侧深度绑定谷歌云服务,助力其在云计算和AI应用领域占据更大的市场份额。

  AI的价值之所以能在云层面得以承载,是因为云平台提供了一个强大的、可扩展的环境,让企业能够以较低的门槛快速开发、部署并运行AI应用。除Google 外,2024年亚马逊AWS和微软Azure也在云平台上深度布局AI,以争夺市场份额。

  亚马逊AWS在2024年的re:Invent大会上推出了一系列新技术,包括Amazon Nova基础模型和Amazon Bedrock的重大升级。Bedrock则新增超过100款AI模型,并引入多代理合作和安全防护机制,以优化推理场景的准确性和成本。AWS还强化了其生成式AI助理Amazon Q,使其更深入地应用于软件开发和商业场景。

  微软不只与OpenAI保持整合,在Microsoft Ignite 2024全球开发者大会上,微软宣布,已经建立了全球顶级规模的企业级AI解决方案ECO,用户都能够通过Azure AI目录访问超过1800个AI模型,企业可依据自己需要构建AI智能体。微软表示,自推出以来,已有超过10万家组织用Copilot Studio创建了自身的AI智能体。

  国内的通义千问(阿里巴巴)和豆包(火山引擎,字节跳动)同样体现了大模型与云计算深度绑定的发展策略。

  阿里巴巴依托其强大的阿里云生态,充分整合了旗下大模型通义千问的能力。通过阿里云,通义千问能够为公司可以提供定制化的行业解决方案,如电商推荐、客户服务、内容创作等,从而吸引更加多的企业客户上云。火山引擎则利用豆包大模型,提供诸如广告优化、内容生成、视频编辑等高度垂直的服务,与字节跳动的内容生态如抖音、今日头条等平台和工具链如创作工具剪映高度协同。

  由此我们大家可以看出,尽管中美的科技巨头在产业体系上采取了相似的路径,但中国企业更看重内部生态的整合。对于国内头部企业而言,走过了“百模”大战的2024年是围绕大模型生态进行布局和竞争的一年,不论是C端还是B端市场,都涵盖在内。对于中国消费者而言,他们并非局限于某一特定生态,而是通过对比各家产品功能,力求获得最佳性价比。

  我们以字节跳动的AI布局为例。首先,2023年11月,字节成立Flow部门,专注于AI模型的技术开发与应用,共分为三层,Stone团队承担产品研制支持职能;Seed团队主攻大模型研发;Flow团队则聚焦AI产品应用开发。其中,作为底座的豆包大模型以“豆包通用模型PRo”、“视觉理解模型”、“语音合成模型”为主打分别对应文本、视频和音频,其研发水平的提升通过评测的方法不断对比国际同类大模型,而其中又根据不同细分场景,再切出来几十种特定模型,如声音复刻模型、角色扮演模型,适配各类场景应用;而更底层的火山引擎则提供底层算力和云计算基础。

  然后,字节沿用国内APP矩阵的做法,开发一系列的AI产品,并非只单做国内市场,而是采取海内外同步推进的战略,多场景全方位对标国际产品。比如豆包对应ChatGPT,虚拟陪伴猫箱对标Character AI、智能体开发平台Coze对应Dify、AI编程工具Marscode对标Cursor;这里也包括一些硬件产品,比如AI耳机“Ola Friend”、AI玩具“显眼包”。

  与此同时,字节还将AI整合进现有产品线,提升现有产品的流量、回访率和复购率等,例如为抖音和Tiktok提供“即创”工具平台,提供包括数字人、直播脚本在内的创作工具;为剪映提供“即梦”文生图、文生视频工具;为大力教育提供豆包爱学等等。

  另外,不容忽视的是字节以“更低价格”与“更易落地”的策略抢占市场先机。2024年5月,豆包大模型刚发布的时候,主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%,如此比其他竞品赢得了更多的客户。

  算力采购价格是影响大模型最终价格的核心因素,尽管国产芯片逐渐加码,国内厂商对英伟达仍有巨大的采购需求。根据科技顾问机构Omdia数据,字节跳动和腾讯2024年分别订购了约23万片英伟达的芯片,这中间还包括Hopper架构下的低版本芯片H20,在Hopper架构的总购买数量仅次于微软。

  在算力领域,英伟达凭借其领先的技术和ECO,始终占据行业主导地位。根据Trendforce和Digitimes,单看搭载GPU的AI服务器,英伟达市占率逼近9成,其主要竞争对手AMD市占率则仅约8%。去年10月,AMD发布了MI325系列数据中心加速器,与英伟达依然有显著差距,其管理层表示,与目前正在扩大规模的英伟达Blackwell的竞争可能不那么顺利。从收入的表现来看也是如此,AMD的收入增长并不像英伟达那么明显。

  靠追赶是很难撼动行业主导者地位的,但下一代技术未必。2024年12月10日,谷歌推出Willow芯片,携带105个物理量子比特,能够在短短不到五分钟的时间,完成了当今最快的超级计算机Frontier需要10²⁵年才能完成的一个基准测试任务。这将为AI的发展提供全新范式的想象空间。

  这一年,人工智能带给我们不同层面的想象空间还有很多,当OpenAI GPT3打开了潘多拉的盒子,2024则是人工智能迈向新的高度的一年。从生成式大模型的技术持续突破,到多模态模型应用的全方面爆发,再到AI驱动行业变革的深度渗透,AI的影响力已经无处不在。然而,这一年也让我们意识到,算力、幻觉、成本、伦理和监管等问题依然是未来发展的重要挑战。

  尽管通用AI(AGI)的宏大愿景仍需时间来实现,2024年让我们正真看到了人工智能从“前沿探索”逐步走向“实际落地”的巨大潜力。小模型的高效化、多模态模型的自然化、Agent架构的智能化,以及各行业的广泛应用,特别是与云生态的全面衔接,都表明人工智能已不再是远离生活的科技,而是深刻改变社会经济格局的重要力量。

  展望未来,人工智能的道路依然波澜壮阔。随着更先进的技术、更高效的模型、更强大的算力和更健全的行业生态的逐步形成,人工智能的奇迹将继续书写。而我们每个人,也将在这场浩大的技术浪潮中,成为亲历者、见证者,甚至是推动者。波澜壮阔的2024年,将为AI的未来埋下无数可能的种子。返回搜狐,查看更加多