奔驰即将在中国开展自动驾驶L4级测试、文远知行获准在美国进行自动驾驶汽车载客测试、英伟达和联发科合作开发的AI PC芯片……生成式AI在多个领域正在加速融合与快速迭代。
中国AI大模型
作为生成式AI核心技术之一的大模型,在我国多个领域的融合应用正呈现出前所未有的活跃态势,尤其是在工业等产业应用场景应用中,中国AI大模型不止会聊天,也正在突破传统行业的技术瓶颈,带来颠覆性的变革。
而“中国AI大模型的应用落地方向究竟在哪里?”这个话题成为当下最核心的关注点。
日前,中国信息通信研究院人工智能所专家在8月初召开的“AI大模型应用场景”产学研融通创新活动——产业问题专家研讨会上谈到AI大模型应用方向时表示:“大模型的实际应用价值正在受到多方关注,市场希望大模型能够解决工业化问题,推动生态力和新型工业化发展,而不是仅仅停留在聊天、生成视频和图片的层面。”
火山引擎生态合作专家也提到:“大模型C端应用产品用量最大,而企业级客户对模型精准度要求最高,B端企业级应用还没跑出来,如何将模型适配到产业发展上是个难题。”
那么问题来了,中国的AI大模型想要将AI大模型适配到产业发展上,有效转化为实际的产业价值,在其实际应用落地过程中会遇到多少挑战?
技术方面
首先是模型幻觉问题,大模型幻觉问题是一直存在的,生成的一些看上去比较合理,但其实是不正确的答案。对于生产制造企业来说,这个风险隐患是不能有的。
其次是基础通用大模型能力不足,模型迭代较慢,关键技术依赖国外,多诉求下的专业模型建模存在技术困难。例如三峡提出的问题,安全角度出发,要求水位尽量降低,水位过高当洪水发生时会有安全隐患,发电需求角度出发,要求水位越高越好,水位高、水头高发电量就大,这时两方的需求是矛盾的。在这种多诉求目标下进行基础建模,大模型厂商的能力可能还是不足的。
最后是数据质量的问题,例如,国产模型生成视频经常出现外国人脸的现象,分析其背后的原因发现,一是国内的视频资源不够丰富,所以必须用国外的影视资料来进行训练,二是即使能够获取国内视频数据,企业也会担心肖像安全隐私问题,不敢使用。
智源研究院专家表示:“国家一直在倡导数据先行。数据虽然看似特别多,但是真正用起来的高质量的数据非常非常少。行业数据、专业数据等高质量数据难以获取,这些数据大量都掌握在企业端和专业的机构端,渠道的打通是问题。”
此外还有多模态的、异构的数据的整理和处理是目前工作的难点之一,它需要花大量的时间和精力。清华大学计算机系原系主任、教授周立柱表示:“创建人工智能大模型,建模和算法占20%,数据准备占80%。建立不同的模型,需要选择不同的数据。数据选择以后进行数据清洗,数据清洗完以后数据增强之后数据混合,最后再数据集成。但这一系列的步骤需要大量的人力,需要这个生态系统里面的很多工具进行支持。”
算力方面
国内算力缺口不断扩大,尤其智能算力。清华大学计算机系原系主任、教授周立柱还表示:“高端算力尚未实现自主可供,关键就是只能自主发展了。比如算力中心的安全运营需要相关设备场上的创新支持,算力中心安全涉及的问题很多。”
科智咨询研究总监弓瑞峰表示:“算力方面主要是高端算力不足,工信部数据显示,总算力美国35%,中国31%,差距较小;智能算力美国45%中国28%,中美差距较大,高端算力的不足导致的直接后果就是中国千亿以上参数大模型训练算力不足,大模型能力受到影响。”
此外,如果要建千亿以上的大模型,训练数据需要包括上万块卡,智算中心运营压力非常大。在智算中心,一台GPU一台服务器可能要上千瓦的耗电量,功耗非常大,有时候普通机柜跟一个GPU服务器机柜耗电量可能相差十倍,电费也可能相差十倍。
不仅如此,大模型在应用落地过程还缺乏场景需求,一方面企业行业有需求,另一面行业热度也在降温,到底算力支持跟不跟得上,业务本身到底能不能做大模型,技术到底可不可达以及安全性,数据归属等问题都有不确定性,所以企业场景落地还在摸索。
业内专家还表示,在新能源行业很关心这个大模型是怎么发挥它的价值,在落地过程中发现,很多生产单位其实对于问答用大模型来做问答不是特别感兴趣,更关心成本问题。
其次是技术人才,在大模型场景落地中,会遇到技术方懂技术不懂业务,客户懂业务不懂技术,双方沟通成本较高,懂技术又懂业务交叉型的人才少,例如医疗领域,有医疗背景又懂技术的人是能帮助技术大模型落地重要环节。
现诚邀AI大模型应用场景解决方案及数字化转型企业踊跃申报参与由中国科协企业创新服务中心主办的"产学研融通创新活动"——《AI大模型应用场景》案例集评选。
“AI大模型应用场景”产学研融通创新活动
2024年6月,率先启动“产学研融通创新活动”,本活动由中国科协企业创新服务中心主办,中关村产业技术联盟联合会、中国通信工业协会数据中心委员会(CIDC)承办,数字开物、中国IDC圈协办,聚焦AI大模型场景应用上中下游企业,面向产业数字化转型的央国企及行业龙头企业、中国优秀大模型企业及大模型解决方案企业、支撑AI大模型的算力基础设施领域企业全面征集优秀企业案例,全方位彰显国内外数字领域领先企业在中国产业数字化进程中的突出成就。