top of page
  • 作家相片Gao Zhe

最强技术天团发布十大“黑科技”

用“危机和希望”做关键词,在百度AI作画平台文心一格上,人工智能自动画出了这样一幅画:绿色的萌芽已经破冰而出,生机勃勃,然而寒冷还未完全褪去。

“所有伟大的企业、伟大的创造者也是一样,没有一帆风顺,只有不断地历经困难再凯旋。困难会刺激创新,而创新是增长的真正动力。” 对这幅AI作品,百度创始人、董事长兼首席执行官李彦宏作出这样的解读。

用AI绘画,是人工智能作为数字内容生产新工具落地应用的冰山一角。1月10日,百度Create AI开发者大会(下称“Create大会”)上,作为“人机共创大会”,AIGC(Al-Generated Content,利用AI技术自动生成内容的生产方式)技术被深度应用,创造、搭建、连接了多个科技感数字化演讲场景。

百度创始人、董事长兼首席执行官 李彦宏


Create大会每年都会吸引全球开发者关注,同时也是新兴技术产业发展的“风向标”。在大会上,李彦宏等百度高管分享百度的创新理念、AI技术布局,公布一系列最新的“AI黑科技”,并指出了属于AI开发者和创造者们的机会。



AIGC世界启“元”


从火遍全网的AI绘画,到令人震惊的高质量问答ChatGPT,“今天行业讲AI,绕不过去的话题就是AIGC的大爆发。”一位人工智能从业人士这样说。

2022年也被称为“AIGC元年”,包括绘画、音乐、文字创作等众多内容领域的生产方式正被AI重新定义。不久前Science杂志发布了2022年度科学十大突破中,AIGC赫然在列。Gartner则预计,到2025年,AIGC将占所有生成数据的10%。从商业化角度看,Generative AI:ACreative New World分析,AIGC有潜力产生数万亿美元的经济价值。

此前,百度、腾讯优图、阿里巴巴、快手、字节跳动、商汤等国内科技企业,以及海外科技公司谷歌、Meta、微软、OpenAI等都纷纷在AIGC领域展开布局,并发布相关技术产品。


面对AIGC风口,不久前李彦宏在内部讲话中提出,重要的是这么酷的技术如何变成人人需要的产品。


在落地应用中,AIGC不仅能够提升内容生产效率,还能创造出有独特价值的独立视角的内容。此前的百度世界大会上,百度AI在十分钟内复原了《富春山居图》的残卷 。


在Create大会上,百度CTO王海峰表示,从技术角度,深度学习+知识,是人工智能技术进一步发展的重要方向。百度AI艺术与创意辅助平台“文心一格”能够自动生成表意准确、纹理精致的画作,其背后是知识增强跨模态大模型。从生态角度,深度学习+上下游生态伙伴,芯片、框架、模型及应用构成深度学习良性发展生态。而从产业角度来看,不只是内容行业,深度学习技术在交通、制造、金融、医疗等千行百业,都将进一步解放和发展社会生产力。


百度CTO 王海峰


百度技术委员会主席吴华则介绍了一系列AI创作者——“天才编剧”文心ERNIE 3.0 Zeus、“美术师、插画师”文心ERNIE-ViLG 2.0,以及“剪辑师和动画师”视频内容生成与编辑技术。她总结:“如果你掌握了这项内容创作能力,那你几乎可以完成一部影片的许多重要工作,成为天才创作者。再配上自己设计的虚拟人演员,那你就可以成为一个真正的‘独立’制作人、真正的‘独立导演’。”

大会现场,《阿凡达》总导演卡梅隆首次对话百度数字人希加加,探讨智能科技对电影行业的影响。卡梅隆强调在电影行业,技术能创造奇迹。一位69岁的女演员通过CG技术在镜头前饰演15岁的小女孩,“我超爱她在这部影片里的表演,所有人都被深深打动了。技术的力量展示得淋漓尽致。”


AI硬核科技力


除了AIGC技术亮相外,在Creat大会上,百度技术专家还发布了一系列新科技成果。

百度搜索杰出架构师辜斯缪介绍了百度搜索的两项“杀手锏”技术——跨模态大模型“知一”和新一代索引“千流”。前者具有跨模态、大规模、高效率三大特点,能够打破资源形态界限,将最满足需求的结果呈现给用户。后者推动了搜索效能的大幅飞跃,让优质信息内容得到最有效的呈现与分发,帮助每个用户更好更快地解决问题。可以说,“千流”是对搜索引擎后端架构的彻底改造。

如智慧出行领域的“千里眼”与“顺风耳”,百度研发了全球第一个普适的支持在手机端实现自然流畅的全双工语音交互方案,以及车路一体的BEV自动驾驶感知方案。

百度语音首席架构师贾磊表示,百度研发了行业首个在手机上实现纯软件方案回声消除的技术和基于SMLTA2的世界上准确率最高的多场景统一语音识别预训练模型,让人机交互更智能顺畅,更加逼近人与人直接交互的体验。

百度智能驾驶事业群组技术委员会主席王亮介绍,“UniBEV主要有三个特点:端到端、多任务多模态融合感知、车路一体,是业内首个车路一体的端到端感知解决方案。”


百度智能驾驶事业群组技术委员会主席 王亮


百度智能驾驶事业群组技术委员会主席黄际洲公布智路OS五大能力:“智路OS是以高等级自动驾驶技术为牵引,沉淀出来的车路协同自动驾驶平台,未来将逐步扩展为以机器人为核心的智能空间机器人操作系统。”

在元宇宙领域的全球首个独立元宇宙解决方案——希壤元宇宙底座MetaStack,将动辄半年到一年的开发周期压缩到最快40天,一站式搭建自主可进化的元宇宙,有效解决行业开发效率低、运营运维成本高两大痛点。

百度AI技术在上述领域持续落地,底层支撑实际源于百度在“两基一底”领域的创新布局。

如量子计算方面,百度专门制定了名为QIAN的“乾”战略,瞄准量子硬件与实际应用之间存在着巨大的鸿沟,致力于真正推进中国的量子产业化。

在人工智能科学计算领域,深度学习平台飞桨通过灵活、高效深度学习框架和开源工具组件,广泛支持AI在计算流体力学、生物计算、量子计算等前沿方向的科研探索和产业应用。


除此之外,飞桨同样可以构建在生活中帮助人们“预知未来”的能力引擎,业界首个同时支持复杂算法+超大图+超大离散模型的大规模图学习训练技术PGLBox就可以大幅提升出行时间预测和信息推荐等服务的准确性。

在智能计算领域,百度全栈自研的AI基础设施“百度AI大底座”升级发布IaaS层两大产品——新一代计算架构百度太行DPU2.0和AI异构计算平台百度百舸2.0。并通过AI底层技术的通用化、模块化,实现AI服务的规模化,帮助企业降本增效。

百度AI技术不断突破的背后,是马拉松式、压强式的研发投入。据统计,过去十年,百度每年研发投入占比都超过15%,2021年达23%,它也是全球为数不多的进行全栈布局的人工智能公司,在AI芯片层、框架层、模型层、应用层都有关键自研技术。


挑战与机遇并存

大会上,一位13岁的小开发者宣言,称未来将用实力携手李彦宏,一起“用科技让复杂的世界更简单”。

“随着技术应用门槛不断降低,创造者们将迎来属于人工智能的黄金10年。”连续两年的百度Create大会上,李彦宏面向开发者们表达了这一观点。

他透露,三年前,百度宣布五年内为社会培养500万AI人才,目前已培养了超过 300万。未来还将继续投入更多资源,并已经与全国 100 多所高校进行深度人才培养战略合作,共同培养创新实践型AI人才。

AI发展的方向是明确的,但实现的过程却并不容易,甚至充满了困难和挑战。李彦宏说,这就是技术发展的特点:技术战略,意味着长周期,而长周期不可能一帆风顺。

他回忆起自己2000年1月回国创业的情形。现在回头看,很多人会觉得赶上了好时机。但当时的实际情况是,就在他创业两个月后,互联网泡沫破裂,全世界蒸发了8万亿市值。那时候,很多人被困难动摇了信心,选择放弃、选择离开。最后,是那些坚持挺过寒冬的人,成就了互联网发展的黄金十年。

2000年6月8日,百度第一次新闻发布会


“人工智能从今天走向未来的过程中,这样的起起落落还会发生。”李彦宏称。

积极的方面是,过去一年,无论是技术层面还是商业应用层面,人工智能都有了方向性的改变。技术层面,AI从理解内容,走向了自动生成内容,这包括AIGC用于作画、图文、视频等多类型的内容创作。

商业应用层面的改变,最具代表性的是自动驾驶。过去业界认为,从L2-L5是一步步来的。但事实上L2之后,率先进入商用的很可能是L4,而不是L3。李彦宏透露,百度L4级自动驾驶落地很快,截至今年9月累计订单超过了140万单,在北京、上海等10多个城市运营,在重庆和武汉还开放了全无人商业化运营。


然而,开发者们必须意识到,挑战同样很大。例如,实体经济很多领域的数字化改造尚未完成,而数字化本身并未能够带来效率的明显提升;智能化的广泛渗透还需要时间,智能化对实体经济的巨大拉升作用还没有成为广泛共识等等。李彦宏预计,人工智能的商业化还需在黑暗中摸索一段时间。


4 次查看0 則留言

Comments


bottom of page