中国开源软件网

当前位置: 首页 > 科学 >

AI基础设施应当被重新定义,国产自主可控的深度学习框架

时间:2020-03-25 23:21来源:互联网 作者:小狐

在唐文斌看来,AI基础设施应当被重新定义。芯片之外,能够被称为AI基础设施的应当还有算法层面AI平台级产品,来协同优化数据、算法、算力。芯片和算法平台对于人工智能来说,就像一个人的“心”和“灵魂”一样,需要深度耦合才能有魅力。

普通企业AI研发的难

只需界定一些算法框架,计算机便能通过大量数据进行反复训练,达到“自主思考”的能力,深度学习对于人工智能的发展是性的。人工智能激发的巨大想象空间,吸引众多企业卷入这场科技浪潮中。

但回顾过去三四年AI行业的发展现状,马太效应聚集已经非常明显。互联网时代,一家传统企业想要变成互联网企业很容易,只要具备IT基础设施,一根网线+一套App就能线下转线上。但是“AI+”和“互联网+”不一样,传统企业和没有算法研发基础的场景,想要和人工智能融合需要跨过诸多难关,初期工具东拼西凑、操作复杂上手难,还会担忧数据外传与隐私泄露问题,且模型效果持续难,以及定制难、周期长。“AI+”提升的难度量级是跨越式的,因此大多数产业仍处在AI化转型难的问题上。相比之下少数互联网巨头和AI明星企业占据资源优势或专业性,AI化更加迅猛。

旷视在成立之初也曾经历这样的阵痛时刻,这也促使旷视要做出改变。唐文斌认为,AI行业是分层的,旷视从早期的算法层向上生长结合行业需求形成了软硬结合的全栈解决方案进入到了应用层,并构建了如机器人操作河图、城市操作等数字化中台或硬件中台。但是旷视发现有限的算法在场景中具有局限性,场景中层出不穷的新的问题需要新的算法来解决。“所以从根本上来说,发展人工智能应该先解决基础设施建设,才能让AI应用拥有持续的动力。”

发布会上,唐文斌重新定义了AI的基础设施。他认为只有AI芯片平台和AI生产力平台能够被称为AI基础设施。其中业内对AI芯片的定义和界限已经很清楚了:作为AI的硬件计算平台毫无疑问芯片能够被称为基础设施。但他认为行业里还没有人能够解释或推出AI底层的平台级产品。

“算法研发和普通编程不同,是一个工程,所以就需要一个能够协同优化数据、算法、算力的平台级产品。”唐文斌进一步阐述,“我们认为AI底层的平台产品应该是三位一体的,我们称它为‘AI生产力平台’而且旷视已经拥有了这样的平台—Brain++。”据称,旷视Brain++包括数据层面的平台MegData,用于算法训练的一套框架MegEngine,以及弹性算力的平台MegCompute,可覆盖数据、算法和算力全流程、一站式的AI研发。

旷视于2013年左右开始专注于深度学习,在2014年完成了自研框架的搭建,几乎跟谷歌同一时间点来做这件事情。跟TensorFlow、PyTorch等平台不同的是,旷视是一家主业全部为AI的公司,天元深度学习框架天然地带有实践性,不同场景下的解决方案天然就具备内外统一性。

旷视的这种AI应用实践独特性,让其深度学习框架的开源更具有实际可操作意义,进而大幅度降低其他者的学习成本。开源框架和生产力平台的作用就是为者一个良好的环境,如果把算法研发比做炒菜的过程,有无框架和平台的区别就是,现在就不需要厨师自己去造锅、生火和洗菜,直接炒菜就可以了。让研发人员获得从数据到算法产业化的一揽子技术能力,不用重复造轮子也可以推进AI快速落地。

这种人工智能对于生产力的升级与新基建的内在逻辑不谋而合,“新基建”7大板块中,抛开电力、交通和新能源垂类的基建领域,最核心的是以5G、人工智能、工业互联网和大数据中心为代表的数字基建。其本质上是信息数字化的基础设施,战略意义是通过更为先进的数字化技术释放生产力。

无论是对于国内经济发展,还是赋能产业升级、数字化转型,人工智能技术的应用都处在核心位置上。更深层次方面,数据、算力、算法构建了人工智能发展的基本要素。其中算力与数据代表的硬件基础,更考验的是各类AI算法,而深度学习框架构建了AI算法的核心,“芯”“魂”并重,这样才是建设好人工智能的基础层。

有了类似旷视Brain++这样的AI生产力平台,犹如拥有了AI水电站级别的设施,未来人工智能才有可能像“自来水”一样无处不在,且即开即用。作为AI领域的独角兽企业,旷视为行业树立了一个很好的榜样,用开源AI底层的深度学习框架,与行业共享创新成果提升AI行业整体效能。 文/刘木春

本文相关词条概念解析:

算法

算法是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制;它是求解问题类的、机械的、统一的方法,常用于计算、数据处理(英语:Dataprocessing)和自动推理。可以理解为有基本运算及规定的运算顺序所构成的完整的解题步骤。或者看成按照要求设计好的有限的确切的计算序列,并且这样的步骤和序列可以解决一类问题。算法中的指令描述的是一个计算,当其运行时能从一个初始状态和(可能为空的)初始输入开始,经过一系列有限而清晰定义的状态,最终产生输出并停止于一个终态。一个状态到另一个状态的转移不一定是确定的。随机化算法在内的一些算法,包含了一些随机输入。

延伸 · 推荐

旷视相继开源深度学习框架,动静合一,训推一体,落地实际工业场景

大数据文摘出品疫情中的深度学习领域又有大动作。3月25日下午,旷视科技举办线上发布会,宣布其自主研发、全员使用的AI生产力套件Brain++的核心深度学习框架—天元(MegEngine)开源。回溯20...

类比芯片是,国产深度学习开源框架熙熙攘攘

至今,开源深度学习框架的 “山头” 主要由国外科技巨头和高校所“盘踞”但现在,这个局面正在发生细微变化。就在本月,继上周一支清华团队宣布开源其深度学习框架 “ Jittor” 之后,今天,“计算机视觉...

网友评论

相关文章