编辑 | 徐文璞
2021年4月27日,中国科技产业智库「甲子光年」在深圳举办2021「甲子引力X」大湾区科技创新高峰论坛。在当日下午举行的产业篇“圆桌讨论”环节,Speakln创始人兼CEO 陈昊亮、极视角科技联合创始人刘若水、码隆科技董事长兼CEO黄鼎隆、光鉴科技创始人兼CEO朱力、追一科技联合创始人&产品负责人汶林丁等嘉宾,围绕着“人工智能,在突破中前行”进行了圆桌讨论。
圆桌现场实录如下:
宫悦:非常欢迎各位嘉宾来到甲子光年大湾区场,这场我们的主题是“人工智能,在突破中前行”。我们有幸请到的几位嘉宾非常重磅,都是人工智能领域非常优秀的创业者,接下来请各位嘉宾用一分钟的时间进行自我介绍和公司介绍。
陈昊亮:大家好,我是Speakln的创始人陈昊亮。我原来在麻省理工念数学博士,方向是大型矩阵计算,后来到了谷歌,在谷歌眼镜任职算法和人机交互工程师。2015年我们开始创业,当时我们创业时的理念,是觉得当前阶段的人机交互方式是因为机器不够智能,例如我们的鼠标、键盘和多种交互形式,都是因为机器不够智能,因而人要去妥协而发明出来的。但会有一个发展过程,随着机器的智能提升,未来人机交互的方式会变得更符合人的需求或习惯。在这个过程中,我们积累了一批智能传感、智能语音声纹、人机交互以及AIoT身份协同等技术。所以我们在城市治理、智能制造和AIoT等领域都有一些应用。
刘若水:大家好,非常高兴有这个机会来到甲子的活动,我是来自极视角科技的联合创始人刘若水。
先介绍一下公司,我们是2015年在深圳成立的,主要是做的商业模式会比较独特,我们做的是计算机视觉的算法商城。可能有一些现场朋友简单了解过我们的公司,目前我们大概积累了1000多种视觉算法,主要应用的行业比较分散,大概分布在30多个行业。我们核心倡导的概念是,在计算机视觉领域,我们坚信一家AI公司是没办法解决所有场景的,我们搭建开发者平台,与开发者共同解决市面上长尾化的AI需求,共同服务我们终端的客户。目前公司融到C轮阶段,今天也比较有幸,上午的闵万里老师是我们C轮的领投方,比较巧。
我个人是读金融和管理的,希望通过一些管理和经济学方面的知识,帮助科技创新。
黄鼎隆:大家好,我是码隆科技的黄鼎隆。跟陈昊亮一样,我学生时代在清华的博士阶段就是研究人机交互,研究人和机器之间如何配合,基于目前机器能做到的事情,人和机器进行清晰分工。随着人工智能技术的进步,机器可以做更多的事情,这时候人和机器之间有一次重新分工的机会,我和我的团队看到了这个机会,创办了码隆科技。
码隆让机器具备计算机视觉这个能力,这是一个挺大的领域,我们主要聚焦在物体识别,让计算机可以像人一样识别出各种物体,以及这个物体背后相关的场景、动作等等。我们的应用有纺织、零售等领域,现在更多聚焦在AI新基建领域,因为在社会运作的很多方面都需要识别出各种物体,做相应的决策,我们正在进行这方面商业落地的探索。
汶林丁:大家好,我是来自追一科技的汶林丁,在腾讯有十年的AI工程产品研发与管理经验,这几年在追一科技主要负责产品工程和交付服务方面的管理工作。追一科技是一家专注于认知智能的公司,我们以NLP和深度学习技术为基础,打造最佳用户体验的企业对话式AI平台,基于业务信息化和数字化的基础数据重塑业务场景,从而达到降本增效、创造价值的目的。目前我们的方向主要专注在对话交互、人机协同和智能分析,主要聚焦的场景是从服务切入,到企业的智能运营,现在慢慢过渡到整个营销的场景。目前我们服务300多家头部客户,像深圳的招行、平安、工行、中国移动,头部的金融银行基本都是我们的客户。
朱力:大家下午好,光鉴科技做的是3D视觉产品和方案,我们团队从创新的纳米硅光技术作为切入点,结合3D图像和AI算法提供软硬件结合的全栈式3D视觉能力,目前我们聚焦的行业主要是服务于老百姓消费电子行业。比如我们今年发布了全世界第一款屏下3D模组,它能够穿过OLED屏幕,不再需要开孔的应用于智能手机的3D相机模组产品。在刷脸支付领域,帮助金融更安全地服务于大众。在机器人领域,我们也会帮助机器人通过3D视觉做导航和避障。此外,我们也在不断拓展其他的工业和专业领域。
AI现阶段:人才成本下降,盈利在望
宫悦:经历过去几年人工智能迅速发展的阶段,当下人工智能发展到什么阶段,以及疫情对于人工智能的发展是否有影响?请黄总给我们介绍人工智能现阶段的情况。
黄鼎隆:当下人工智能的情况,我觉得用上午一甲提到的微笑曲线可以来描述。人工智能企业过去几年主要是在研发方面大量投入,进行技术的积累和突破,但多数没有找到太好的赚钱模式。有些公司已经有收入了,但有利润的AI公司并不多。如何找到合适的商业模式、落地场景来赚取利润,这是眼前这个行业最重要的问题。
目前来说,这个问题的答案开始慢慢浮现,越来越多AI公司的盈利水平在提升,越来越多的场景浮现出比较清晰的盈利模式,现在处于一甲说的微笑曲线到了谷底,正是往上爬的阶段。这个过程中,在商业和市场层面场景的选择尤其重要。以前很多领域的客户带着各种有趣的问题找我们,我们都想试着解决,但现在我们首先要看这里面的商业潜力怎么样,尤其是要看客户的预算怎么样。另外,在技术层面要把很多成本降下去。比如码隆非常关注开发多模态人工智能,通过多种传感器使整体识别率达到比较好的水平,通过弱监督学习把数据训练成本大幅度降下来,实现商业上的效率变现。
宫悦:接下来问一下陈总,因为您也是做机器视觉的。今天我们的题目是在突破中前行,您看到人工智能有没有一些突破?可以帮我们补充一下。
陈昊亮:我先补充上一个问题,我们跟黄鼎隆先生现在看到的问题比较相似,对这个话题我也谈谈我们的想法。
其实许多AI公司已经有盈利能力,但会依旧追求更多边界的扩展。我觉得人工智能公司或者行业的现状可以分成两个角度来看:一个是行业角度。AI类公司普遍成立的时间是在2013年到2015年,在这期间,有大量公司冒起来。那时候对于市场来说,AI为什么会比较热?其中一个重要原因是AI人才比较短缺。但经过这几年的发展,AI公司也好,行业也好,大量供给或转化培养了能够为不同产业做智能化提升的高端知识劳动力(AI人才)。
另一方面,AI企业最早参与行业、终端产品、消费产品时,大家普遍认为它只是一个效率工具,比如在某个环节可以降本提效。但事实上这两年我们跟很多产业和消费品做结合时,被赋能、被智能化的公司也充分理解到,其实对于他的产品来说,一样可以通过智能化的提升、AI的赋能,来提高最终产品的平均附加值或产业附加值,这也是对另一个产业的提升。
现阶段,对AI企业来说, AI人才没有2015年、2016年那么贵了,我们也通过企业自我培养、产业资金的投入等社会力量多方面来培养和发展AI人才,目前AI人才的成本是普适性下降的,这个对于行业发展是有利的。另一方面,无论是疫情影响,或者说随着智能数字化时代的到来,企业和社会大众对于软件的付费意愿意识在不断增强。
AI的落地及与其他技术结合
宫悦:所以从我们这个层面来看,未来在整个AI的投入和研发上,我们也会持续加大力度,而且随着国内对于软件付费的意愿越来越强,产品的标准化程度应该也会提高。关于AI如何跟细分场景相结合进行智能化,刚刚黄总也提到选择落地场景的问题,接下来请追一科技的汶总给我们介绍追一是如何选择细分场景的?
汶林丁:追一最开始做的是认知智能,简单来说就是,我说一句话它能理解意图是什么,这是NLP的核心目的。大家要分阶段去看,像之前的语音、CV视觉,都是感知智能的模块,从感知智能到认知智能,其实是并行甚至是一起在发展。到目前多模态融合,这是现在越来越强的一个方向。这块也跟我们公司整个路径是强结合的,刚开始是文本,我们做对话交互;慢慢的,你要做更有温度的服务,结合语音上了一个level,所以语音慢慢融合进来了;到现在是“数字人”,我们从2018年开始在做多模态数字人,在银行、运营商落地。
比如在银行的App上做一些核心转账的场景,老人直接对着机器人说“转账”,整个流程都可以送到他的面前,他只需要说话就可以完成转账过程。包括跟运营商的结合,他们想打造更有温度,或体验最佳的服务。像之前的IVR,拨打号码会直接跳出“数字人”跟他进行交互,这是整个技术带动产品发展的路径。
在商业模式的选择上,估计每家都有自己的路径,从市场规模、客户痛点、自身优势、切入难易度,产品的匹配程度等方面都要找到。切入路径找到后,我们的路径刚才也说过,从服务到智能运营到现在的营销,其实是有路径的。
像陈总刚刚说的,AI解决什么问题?说大一点,其实是解决中国未来社会人力资源短缺的问题,做的是部分人力替代的工作。然后在一些人的场景上,做的是人机协同,让人的效率更高,甚至在这些数据沉淀之后,我们可以做智能分析的事情。运营效率可以促成企业大的闭环,在信息化和数字化的基础上,运营效率会越来越高,大致的路径和方法论基本都是这样,具体每家企业可能不太一样。
我们选择金融、运营商,甚至选择政务,因为政务的周期更长。之前为什么选择金融?因为金融这边的市场规模都是经过验证的,AI基于已有的信息化基础会更顺当一些。
宫悦:刚刚汶总提到,目前AI正从最初的感知智能到认知智能阶段发展,有没有其他新的技术?比如刚刚黄总提到多模态技术,刚刚朱总也提到,纳米硅光3D技术,可以给我们介绍一下目前发展到了什么阶段,有什么新挑战吗?
朱力:我们在的行业是用3D相机感知世界的行业,3D技术历史很久,1922年就有第一部3D电影,到现在差不多一百年了。在过去一百年当中,3D都是很昂贵的技术,直到三五年前可以通过消费电子、手机这个行业,把它做到亿级别的规模。2017年全世界出货的纳米激光器就超过了此前的总和,这样一下子打破了硬件的壁垒。把3D相机从万美元降到百美元,现在到了十美元的量级,基本所有领域原来需要机器视觉的场景都可以用到3D。
在我们看来,成本和核心技术的壁垒已经可以打破了,下一步就是怎样用新的技术进入到各个领域,从而实现这些领域二维到三维的升级,帮助这个产业得到发展。我想输出我关于第一性原理分析,为什么说3D行业未来是大的趋势,这也是我跟很多投资圈朋友沟通时,大家会问我的问题。
首先,最根本性的需求是人不断需要被各种新的技术服务,这是第一。
第二,随着越来越多的IoT设备、智能设备进入到我们的生活,最终的瓶颈其实是电脑。有一个预测,到2025年IoT设备要到400亿,计算和通讯会占人类20%的电量,现在人类每年发电量的增长是2%,所以电量是不够的,需要我们在端上通过更好的感知和分析能力,用很低的算力实现智能化的功能,这是我们3D体现的价值。
因为我们有更高维度的信息,有更小的数据量和模型在一个两三美金的芯片上用零点几FLOPS的算力就可以实现这个功能,从而实现整体的智能化,这是我们的思考和观点。
宫悦:除了AI之外,3D技术会给我们的生活带来哪些转变?
朱力:我们基于机器视觉角度进行讨论。如果通过平面图像,你想把一个东西描绘清楚,需要不同的角度、距离和光影,希望通过更低维度的数据存储形式来描述更高维度空间的信息,这样必然导致维度的降低,需要有大量数据的牺牲,我们把深度的信息加进去,可以很大程度降低模型的复杂度和对数据的要求。把光学和材质的交互特质,包括光谱和材料的特性,把这些原来视觉领域看不到的东西加进去,其实就是多传感融合,只不过我们要把多传感维度集成在很小的模块里。通过这些集合,我们就能够通过较低的算力建立更加可靠的模型。比如我们训练非常可靠的基于3D人脸活体的识别模型,比原来少三到四个数量级的产品级算法,这是我们看到的方向。其实大数据、小问题,本来就是历史遗留的半伪命题、半真命题的状态,相信通过很多新技术的迭代,这个方向会有本质的变化。
宫悦:刚刚我们不约而同地提到智能化,以及怎样减少人力成本,提升人的效率。极视角应该也在做这样的事情,包括构建的整个算法平台,其实也是为了解决同样的问题,可以请刘总给我们介绍一下,极视角怎样看待整个算法平台,是想打造一家什么样的平台呢?
刘若水:这是一个非常有针对性的问题。刚刚听了几位的讨论,包括技术和产业的落地,其实从我们的角度来讲,AI公司更多还是技术提供方,我不可能深入到某一个行业,比这个行业里的玩家更了解他的需求,所以我们其实做的是一个横切面的事情,能够保证的是让算法更快速、更便捷甚至更低成本地开发出来。但这些需求的来源、场景的定义,更多还是来自前端真实行业用户以及服务这些行业的方案商,他们会更清楚地定义这个行业究竟需要什么。
不管是金融、新基建、医疗还是安防,甚至是我们现在看到的一些新兴行业领域,之前大部分的AI算法都用在智能生产这方面,可能是为了安全。现在我们也看到很多的趋势,包括我们平台上收集到的更多算法需求,可能在从生产到生活端转变。比如我们看到的社区需求、养老行业,甚至是文化、娱乐这种产业,都慢慢随着AI技术的普及需要更多的算法。
我们作为一个技术提供方,需要更理解用户的行业,帮助他把他的行业诉求转变为一个算法的语言,再让我们后端15万的开发者,通过他们的能力,通过我们底层的平台,提升整个算法的开发效率。这个过程是现在AI产业化当中更重要的环节,不仅仅是提升前沿科技,还需要考虑怎么在真实场景中满足低成本、高效率的交付,这是现在对于产业落地来讲比较重要的。
宫悦:刚刚黄总提到,码隆从之前服装、零售行业,逐渐在新基建等领域已经落地了,可以给我们简单介绍一下您目前对于细分场景选择以及落地方向的规划吗?
黄鼎隆:因为我们一直是做物体识别的,其实也就是在寻找物体识别能够用在什么场景里。像之前的零售,因为零售里面就有大量的商品和物品以及大量人的工作,这个工作如果用AI取代人力,会产生价值,所以我们在这方面做了不少事情,比如服务沃尔玛这些大的零售客户。
刚刚宫总有问到一个问题,疫情对AI公司有什么影响。其实对我们来讲,既有正面也有负面的影响,负面的影响,我们之前服务海外的客户比较多,尤其是服务欧美的客户比较多,疫情之后首先不能出差,有很多需要现场实施和落地的工作很难进行,现在这种国际政治形势大家也知道,包括国家间的脱钩、欧美国家对中国AI公司的过滤等等,是会形成阻力的,是负面影响。
正面影响,我们也看到疫情后会催生很多新的场景。比如在深圳,今年就有一些场景,居民不用带身份证,在药房就可以刷脸买药。包括不知不觉中遥感测温在疫情中一下就普及了,提供了更多的场景。人工智能作为新基建七大领域之一,蕴含的商业场景非常多,有很多大家平时没有关注到,比如水务——通过识别一些物体,可以大幅提升水务管理的效率。比如深圳下了暴雨,通过AI的物品识别技术,也能解决很多过去解决不了的问题。
我们看到的情形是,各种新的场景正在呈现出来。前几年大家一想起视觉AI,只能想起人脸识别、安防,现在基于新基建,社会运作的各个场景,诞生出许多带有明确预算的需求,这个对于AI公司来说是一个好事情,这也是我认为AI公司即将走出微笑曲线的原因。
宫悦:刚刚陈总也提到,我们已经在一个损益平衡的临界点了,您可以给我们介绍一下,我们目前是在哪些场景里吗?或者我们看到了哪些新的需求,以及我们为什么可以达到损益平衡点的?您刚刚说到有两家公司,在中国和美国,这两家公司是如何平衡运作的?
陈昊亮:首先,我觉得要提高毛利率有两方面。一方面,为什么AI公司普遍要埋头做事,绕不过去的是要积累行业的美誉度。无论我们在哪个行业,新基建也好,银行也好,AIoT也好,都要积累行业的美誉度,这是一个有周期的事,我认为这也是目前比较关键的事。我们刚刚讲了人才平均成本的下降,或者有更多的供给和转化,现在AI公司普遍也在做转化,我们可以把一些统计学或计算机中低级的AI人才转化成更高阶的AI人才,这也是我们在做的事情,所以是两方面结合。
一方面提高产品平均的毛利度,这个可以靠行业美誉度来实现;第二,就是控制成本。所以我相信,AI企业始终都会达到盈利的状态。只是大家现在看到,无论是AI四小龙或者是科创板对这件事情的挑战也好,这更多是因为窗口期导致的。大家觉得窗口期有限,规模要做大,赶紧上市,募资更多的钱,做更深的发展,核心目的都是为了我刚刚讲的这两个事。
第二点,我觉得中美的竞争是长期性的,对我们来说,美国有很好的学术土壤,这是我们能持续获得先进理念和方法的地方。但是从商业化的角度来说,我们获得的很多数据源是在特定时期、特定窗口下才会发生的,包括出了民法典以后,相信公民对于自己隐私的数据,以及对于企业利用自己数据的关注都在增加,所以像之前开放的数据,以后不一定会开放了,这也会成为AI公司接下来重要的商业壁垒。
AI公司数据的合规性:边界清晰是好事
宫悦:您的意思是以往的AI公司有先发优势的数据和模型壁垒是吗?接下来是数据获取的问题,Speakln在数据合规方面会有一些其他的操作吗?
陈昊亮:现在我们基本会跟客户签署数据共享以及安全保护的协议。本质来说数据作为资产,在这个场景里是双方共有的,对于AI公司来说,可以给它的用途明确边界,这是法规之内的事情,对长期来说肯定是有好处的,大家对于数据安全和数据边界有更清晰的认知和意识。长期来看在一个可执行的范围内利用数据,对数据驱动的AI公司和业务来说是利好的。
宫悦:请问追一的汶总,政务客户对我们的要求会不会比较高,尤其在数字成为生产要素,合规性变高的情况下,对业务会有影响吗?
汶林丁:大家都知道,数据要合规,不管是银行、保险、券商,我们很注重这种隐私。在金融行业、运营商行业,基本现在都是专有云的部署模式,但也有一些股份制和比较领先的企业,在数据脱敏,用户隐私信息过滤之后,尝试混合云的模式。比如我们的“数字人”,涉及到GPU集群渲染、运算的部分,可以在公有云;数据部分包括ChatBot、知识库基本是在专有云里。混合云的方式比以前专有云进了一大步。一旦有创新企业带头做这个事情,这个最佳实践会有助于大家建立安全信心。当然,保密协议也是一方面,但你要从真正的落地上保证它是绝对安全的,讲清楚这个逻辑,这个事情才能长期发展。
宫悦:刘总一直在点头。
刘若水:其实数据这个问题,一直以来是AI公司绕不开的话题,尤其是像我们做算法商城,经常被人问到,你这么多数据哪来的?怎么做出来这个商城的?坦诚地说,确实这些数据都是客户给的。我也并不认为现在对于数据的保密,或者大家对于数据安全的重视会影响到数据的开放;相反,大家对数据的重视反而会促进大家认为要把一定的数据开放出来,才能促进这个技术的发展和应用,关键在于你要怎么用、怎么开放。
我们从2018年开始做数据相关的不同尝试,包括最早跟微众银行一起做联邦学习在计算机视觉的应用,虽然还没有完全投入生产,但我觉得也是一个比较好的尝试,在看怎样利用好数据的同时,又能保护客户的数据隐私。包括小样本学习的推动,不需要那么多的数据,也能实现一定的算法开发。到现在来讲,从去年开始我们服务更多的政府型的客户,我们甚至采取了一些方式,把整个AI开发平台和生产力的工具,直接部署到客户现场,让他的数据不需要流到外面,就可以实现整个算法的开发。
其实方案有很多,只是怎么使用,最大、最好、最安全发挥数据的价值。
宫悦:今天上午一甲有提到对科技趋势的20个预判,其中第6个就是隐私计算,这也是我觉得可以解决很大部分数据问题的重要路径。目前我们看到的数据大多数是人工智能收集过来的数据,其实除了人为收集出来的数据,天然的在机器上跑出来的一些生产运营数据也是非常重要的,想请朱总给我们介绍一下,我们在做消费电子,或者做机器人相关的业务时,会牵扯到这方面的建模和数据应用吗?
朱力:会,我们把AI当成产品的基础能力。我们做的很重要的工作,就是从数学上保证这个信息对所有人都是不可见的,我是我们行业里第一个把数字加密签名做进摄像头的,从摄像头发出去的数据都是加密过的,所有人除非拿到密钥,要不然没办法攻破。
我们做这个的原因也是因为公司2018年刚成立的时候,我们看到海外机器视觉很难做,因为涉及隐私问题,在中国还没有关注到,所以我们能够很快落地。我不认为这个时代中国人比海外的人不值得拥有更多的隐私,很快这个概念会赶上来,安全和加密肯定是很关键的环节。
所以现在我们也看到,今年3月国家也很关注AI人脸相关应用,上礼拜关于人脸识别方面的国家标准意见征求稿已经出来了,这非常欣喜地印证了我们几个预判。首先要求源头做数据加密,这个我们的产品已经量产了。其次,希望源头就有防伪和防攻破识别,必然要用到3D技术,这也通过了国家标准。
让一个新技术体现出它的价值,其实是挺利好的事情。当然,对于传统意义上,基于传统数据的AI公司和产品来说,会带来一些挑战。
宫悦:因为之前也有一个技术路线是强认知,也是用小数据解决一些大问题,刚刚提到数据方面,刘总也介绍到一直在做数据的加密合规。数据做了加密之后,成本会不会上升?刚刚提到,极视角是在座各位当中为数不多掌握商业模式且盈利的公司,在这种情况下怎么保持持续的盈利能力?
刘若水:我觉得盈利跟数据没有直接的关系,数据这方面做加密,做再多的安全措施都不为过。本身AI就是一个投入成本挺大的事业,在这个过程当中做额外的成本投入,这个事情本身就是有价值的,你的用户也会为此买单,所以并不存在做了额外的投入,会影响盈利或利润空间等问题。
另外,本身我们的模式就相对特殊,用开发者生态解决算法问题,除了在底层平台上,一边利用人多的优势,另一边也保障数据安全。其实我们也在看有没有更多的产学研合作模式,推动我们保障数据,同时加速研发的进程,也有很多合作的商业模式可以基于这个平台探讨。
未来AI的可能
宫悦:时间关系,最后请各位用简短的一两句话分享对未来几年人工智能发展最期待的事情。
朱力:我期待的其实是从应用层面往上推,期待未来连入网络的节点数比现在的密度提升10-100倍,这就意味着我们可以无时无刻地感知真实的环境,让AI在此基础上提供更大的价值。
汶林丁:我希望多模态人工智能能达到能听、能看、会说的程度,达到真人的程度,打造高级用户体验的目标越来越近。
黄鼎隆:我相信再过几年会看到人工智能融入到社会运作的方方面面,会大幅度提升产业和整个社会运作的效率。
刘若水:最近比较关心教育领域,这周也看到清华跟北大联合推出的通用人工智能班,其实我觉得对未来最期待的突破,是人工智能产业和技术人才,尤其是我国的技术人才,能够有一个比较大的涨幅,彻底解决不管是AI企业还是传统行业对AI技术供应端的需求。
陈昊亮:我从偏学术的角度来讲。现在的人工智能企业,无论是自动驾驶、视觉、听觉,还是交互,一定程度是大爆发下的小革新。大爆发是深度神经网络,小革新是各个领域尝试着用,所以我很期待有下一次的大爆发,我们从学术上预测,下一次的大爆发按中国来讲就是“大力出奇迹”,一定是超大规模的数据和算力所能产生的效应,GPT-3就是典型的代表,所以我的期待的是下一个大爆发。
宫悦:刚刚陈总也给了我们人工智能领域一个巨大的期许,我们期待下一次的大爆发,相信接下来几年,人工智能领域不是在突破中前行,而是在不断突破和爆发中取得巨大成功,感谢各位。
本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:3164780!