7月以来,数字开物已收集超过百份"AI大模型应用场景"案例报名申请及产业问题,聚焦这些大模型应用落地的真实产业问题,8月6日顺利召开了"AI大模型应用场景"产学研融通创新活动——产业问题专家研讨会。
与会期间,中国科协企业创新服务中心、中关村产业技术联盟联合会与中国通信工业协会数据中心委员会相关领导,中国信息通信研究院人工智能所、北京智源人工智能研究院、清华大学、北京服装学院继续教育学院等科研机构及院校专家,以及中国三峡集团武汉科创园、电信安全、西云算力、火山引擎、科大讯飞、灵汐科技等各领域领军企业代表展开了深入探讨,20多位各专家及企业代表从算力、数据、算法、产业生态和人才等多个维度,深入剖析当前AI大模型应用发展面临的机遇与挑战。
总的来看,我国大模型发展面临着多方面的挑战:
算力层面
国内算力缺口问题依然存在,尤其智能算力。随着技术的不断迭代,算力需求持续增加,导致算力缺口不断扩大。与此同时,通信、能源等相关领域的瓶颈也进一步加剧了这一问题。
国内算力缺口问题
从技术方面来看,高端算力的自主可控是一个关键问题。尽管中国在总体算力规模上已位居世界前列,但在高端芯片等核心硬件方面仍存在较大差距,这直接影响了大模型的训练效率和规模。此外,国内大模型在某些关键技术上依赖国外,缺乏原创性算法模型,导致产品技术水平出现同质化竞争。
从成本方面来看,盈利压力对大模型发展构成了挑战。企业出于盈利考虑,难以将所有算力投入大模型研发。如果短期内无法从大模型业务中获得盈利,企业可能会放弃这条产业线,转而发展其他业务。即使企业意识到算力缺口的存在,但为了保证盈利,他们也不可能无限投入到大模型研发中。
数据层面
当前我国在行业数据积累方面还存在明显不足,现有的数据质量普遍不高,结构化的高质量数据相对匮乏,特别是专业领域高质量数据不足。
高质量数据相对匮乏
例如,国产模型生成视频经常出现外国人脸的现象,分析其背后的原因发现,一是国内的视频资源不够丰富,所以必须用国外的影视资料来进行训练,二是即使能够获取国内视频数据,企业也会担心肖像安全隐私问题,不敢使用。
多模态异构数据的整理和处理是面临挑战,尤其是海量历史数据的人工标注工作非常耗时。
数据安全与隐私保护问题,数据脱敏与安全管理能力不足,个人隐私数据买卖等问题依然存在。
数据确权和流通问题,缺乏统一的数据安全分类标准,不同行业数据交易存在认可度和安全性问题,数据分散在不同机构手中,由于缺乏有效的流动和共享机制,企业数据共享意愿低。
应用层面
模型在复杂业务场景中的应用存在挑战。当前大模型在处理多步骤、多变量的复杂业务流程时,仍存在理解和执行上的局限性。
行业垂直应用落地难题不断。不同行业有其特殊的知识体系和业务逻辑,如何将通用大模型有效地适配到特定行业,实现从技术到价值的转化,仍然面临诸多挑战。
例如,在特定领域如医药、新能源等行业,构建专业知识图谱和智能问答系统面临技术挑战,需要深度融合行业专业知识与AI技术。
再比如,大语言模型问答形式在一些传统制造业落地应用中难以得到生产单位认可。一些生产单位决策者会关心成本的问题、人力的问题,仅仅是问答应用意愿度不高,例如,有传统制造业上产单位认为一线的巡检人员,能把业务要求流程背得滚瓜烂熟,为什么还要用这个问答系统。
大模型应用
产业生态层面
模型厂商方面,缺应用缺场景。算力、模型做差不多了,应用场景目前看不到爆发点,展开来说,厂商在探索场景时面临一系列问题,如算力能否支持、业务本身是否能做大模型、技术是否可达以及、数据归属问题、安全性等因素都具有不确定性。
尤其是B端大模型应用推广效果不如预期,企业级客户对模型精准度要求最高,如何将模型适配到产业发展上?
企业客户方面,一些B端客户在引入大模型时候,对AI大模型能做什么,不能做什么,能做到什么阶段没有清楚的认知,企业在实际部署模型时不能清晰提出需求,是否需要进行教育培训?
此外,整个产业还面临人才供需不平衡的问题。一是人才短缺,高端人才严重不足。例如,技术方懂技术不懂业务,客户懂业务不懂技术,懂技术又懂业务交叉型的人才少,再比如在算力方面万卡集群调优高端人才短缺。二是行业人才有动态需求,企业很难能在一个时段找到合适的人。
关于人才短缺的问题是需要教育口来培养人才还是产业端自己培养人才来完成供给也面临着矛盾。
针对研讨会所探讨的一系列算力瓶颈、数据困境、模型开发落地挑战、产业生态创新不足等问题和挑战,诚挚邀请各企业参与“AI大模型应用场景解决方案”征集活动,欢迎能提供创新解决方案的企业踊跃报名。
“AI大模型应用场景解决方案”征集活动
-扫码申报-
“AI大模型应用场景”产学研融通创新活动流程
解决方案征集:2024年8月8日-8月28日
解决方案专家论证会:2024年8月30日
供需对接洽谈会:2024年9月3日
发布/参会时间:2024年9月26日