发布时间:2024-07-09 作者: 人大重阳
7月6日下午,2024世界人工智能大会在上海闭幕。本届大会线下参观人数突破30万人次,全网流量突破10亿,比上届增长了90%,500余家知名企业和超过1500项人工智能展品参展,50余款新品首发首秀,均创历史新高。
编者按:7月6日下午,2024世界人工智能大会在上海闭幕。7月8日,“重阳投资”微信公众号《重阳来信》栏目围绕AI的未来发展发表文章《AI:非线性的未来》。现转发如下:
致尊敬的您:
7月6日下午,2024世界人工智能大会在上海闭幕。本届大会线下参观人数突破30万人次,全网流量突破10亿,比上届增长了90%,500余家知名企业和超过1500项人工智能展品参展,50余款新品首发首秀,均创历史新高。大洋彼岸,6月11日凌晨,苹果在2024年WWDC大会上正式发布个人智能系统Apple Intelligence,之后两日苹果股价大涨超过10%,巨像起舞。而AI领域的“当红炸子鸡”—英伟达,自2023年初至今涨幅超过7倍。这一切的驱动背后,正是大语言模型所带来的新一轮AI浪潮。
正如比尔·盖茨所言:“人们总是高估了未来一到两年的变化,低估了未来十年的变革”。经过一年多的学习和研究,市场对于AI行业已经有了比较充分的理解和认知。那么站在当下,我们又该如何看待其未来发展的趋势?
01
要想回答这个问题,我们可能先要回顾一下AI的历史。从1950年,英国数学家艾伦·图灵提出图灵测试,到1956年达特茅斯会议上约翰·麦卡锡、马文·明斯基、克劳德·香农和纳撒尼尔·罗切斯特等学者正式提出“人工智能”这个术语,人工智能迄今也只是一个发展尚不足百年的年轻学科。1986年,杰弗里·辛顿等学者发表关于反向传播算法的研究,为后来深度学习的发展奠定了基础。2012年,AlexNet在ImageNet图像识别竞赛中取得突破性成绩,进一步证明了深度学习的潜力。深度学习的应用,使得图像识别和语音识别准确率得到大幅提升,人脸识别开始走进千家万户。2017年,Ashish Vaswani、Noam Shazeer等谷歌的科学家提出基于Transformer架构的模型,推动了自然语言处理的显著进步,也开启了这轮大语言模型的浪潮。从语音-图像到语义,到最近的多模态融合,边界的延展背后,是模型缩放定律和算力摩尔定律的持续有效,仍然看不到触达天花板的迹象。
在互联网时代,有一个“平台双边网络效应”,它是指平台一端的供给方越多,越能吸引到更多的需求方,进而刺激更多的供给方,双方一起正向反馈实现平台交易量的持续提升,直到触达增长的天花板。而算力、模型、应用之间也有类似互相促进的联系,更强的算力有望带来能力更强的模型,进而支撑体验更好的应用;而更广泛的应用可以反哺模型的训练,摊薄算力的成本。目前,产业依旧在持续迭代之中。
或许会有朋友感到疑惑,从ChatGPT上线至今已有一年半的时间,这个过程虽然很热闹,有“百模大战”、Microsoft Copilot、Sora等出圈的事件和产品,但并没有看到超越ChatGPT的超级应用出现,模型表现差强人意。如果不能实现更广泛应用,那么长期价值该如何看待?对于这个问题,或许上一轮深度学习的浪潮可以给我们一个参考。
2006年,杰弗里·辛顿提出了“深度神经网络”的概念。2012年,第一个应用深度神经网络的AlexNet在ImageNet图像识别竞赛中夺冠。2016年,AlphaGo在围棋比赛中战胜了世界顶级围棋选手李世石。在这些火爆出圈的事件之外,我们看到人脸识别成为手机功能的标配,提供了一种更便捷的解锁方式;刷脸出入闸机成为更多写字楼、车站门禁的选择,带来了更好的用户体验;驾驶过程中通过语音唤醒智能助手实现音乐播放、电话接听等操作,既安全又便捷;疲劳驾驶监测系统通过摄像头捕捉司机的面部特征,及时对疲劳驾驶行为进行提醒和预警,带来更安全更规范的驾驶行为等等。凡此种种,不一而足,都已经成为我们日常生活的一部分,改变了我们的生活方式。
犹记得2016年AlphaGo的出圈,带来了社会上的广泛关注,也是很多人开始关注AI的开始。还有亚马逊的Echo音箱,让一部分人意识到,原来触屏并不是人类与终端交互的最佳方式,自出生就会的语言交流才是。尽管受限于技术的瓶颈,智能音箱在很多家庭被束之高阁,但仍然成为很多小朋友喜爱的玩具,每年仍有近亿台的出货量。翻译机开始成为很多消费者出国游玩的标配,语言不再是交流的障碍。
02
历史总是在犹疑中前进。大语言模型也类似,在超级助理实现之前,它可能是设计师创意的灵感来源,在创作工作之前提供更多视角的创作方案;可能是文档工作者的有利工具,快速处理和填充标准化的制式文档;可能是人工客服的有效补充,可以二十四小时解答消费者的基础性问题;甚至可能是个人私教,通过与它的对话,提升某一类语言的能力,OpenAI最新发布的GPT-4o模型,联合可汗学院已经展示了类似的案例。而更多的应用场景,全球的开发者还在持续探索,已经超出了笔者有限想象力可展望的范围。
而苹果的入场,给未来带来更多的可能。作为完全掌控自身软硬件生态的厂商,大模型的加持下,此前个人用户很少打开的Siri,是否随着用户体验的提升,成为终端个人助理的雏形,后续的进展无疑值得期待。
或许未来有一天,每个人都拥有一个个性化的AI教师,通过与它的互动和对话,进行新的行业知识和语言的学习,在当下辅助问题解答的基础上更进一步:消费者不再需要打开一个个APP去满足不同领域的需求,只需要将需求提交给AI智能助手,就会得到一个综合最优的解决方案;服务机器人走进人类的生活,能够负责大部分的家务劳动,甚至老人的陪伴和婴儿的照看;自动驾驶汽车成了标配,每个人不再需要购买自己所有的交通工具,共享出行能够满足几乎所有场景下的需求。
想象一下,未来的普通人一天的生活,可能是如下场景:你一早醒来,餐桌上已经摆好了智能助手根据你的口味和营养需求精心准备的早餐。出门前,它提醒你今天的天气,为你挑选合适的服装。上班的路上,自动驾驶的汽车已经静静等待,车内的AI系统为你播放最喜欢的音乐,同时处理你的工作邮件。工作时,AI助手帮你分析数据,预测市场趋势,甚至提出创新的解决方案。晚上回家,智能家庭系统已经调节好室内的温度和灯光,为你营造一个舒适的环境。这不是科幻小说的情节,而是可展望的,人工智能有望逐步实现的未来。
更智能或许是人类永恒的追求,背后是人类对更美好生活的向往,对自然规律的持续探索,以及对改变世界的勇气激发。永远不变的是变化本身,这正是科技发展的魅力所在。技术的进步,带来生产力的提高,最终将令更广泛的大众受益。正如互联网的出现,大幅降低了普通用户获取信息的成本,打破了信息获取在时间、空间和数量方面的限制,也减少了传统信息传播工具限制下的信息不对称,带来一定意义上信息的平权。而AI的出现,有望带来更高效的工具供给,让用户从更多基础工作当中解放出来,提高效率,从而有更多的时间和精力去做更有意义的事情。
当然,我们也不能盲目乐观,科技的发展从来不是线性可预测的,其过程既充满了惊喜,也充满了意外,这也是科技探索最大的魅力所在。毋庸置疑,大语言模型带来了语义理解准确度的大幅提升,进而带来更多领域商业化应用的潜力。但模型本身的幻觉依旧存在,从而构成对更广泛更有价值应用的制约。数据版权、个人隐私保护、模型对齐、生成内容的真实性等等,都将是长期面临的挑战。而工具永远是中立的,对于借助新工具的犯罪行为的有效打击和监管,更是全社会面临的长期课题。另外,具体到投资而言,我们也要对梦想与现实,故事与估值的分野有清醒的认知。
(备注:本文写作运用了AI工具的帮助)
重阳投资
2024年7月8日
(欢迎关注人大重阳新浪微博:@人大重阳 ;微信公众号:rdcy2013)