运营商大模型，数字中国的一枚“落子”

转载

336 天前

5184

脑极体

文章转载来源：脑极体

2023年以来，三大运营商相继推出自己的大模型，布局动作和规模不小，也让不少问题萦绕在读者心头：

中国并不缺大模型，为什么运营商还要做大模型？

目前，“百模大战”的竞争烈度已经翻倍，2023年11月发布的《北京市人工智能行业大模型创新应用白皮书（2023年）》显示，仅北京地区的AI大模型数量就达到115个，约占全国的一半。

在全国多达两百多个“竞品”中，运营商大模型真的不可或缺吗？

运营商靠通信起家，在大模型人才、算法、工程能力、供应链上，无法与互联网公司、AI企业等玩家拉开大的优势。运营商做大模型，主打一个“题海战术”。

我们简单梳理了一下2023年三大运营商做大模型的进展，从下图可以看到，每家都面向多个行业，推出了多个大模型，中国电信前不久一口气发布了12个垂类行业大模型，这在AI圈都是非常炸裂的。

做大模型可以，但有必要这么卷自己吗？

本文就从运营商“落子”大模型，看看背后数字中国基础设施的棋局，以及接下来，运营商大模型的“棋路”走向。

“数字中国”的棋局，运营商持续落子

中国运营商做大模型的热情高涨，和海外运营商形成了鲜明的对比。

欧美运营商并不是不关注AI、不做大模型，但往往选择与谷歌、Meta、OpenAI、微软等科技企业合作，并且，更重视在业务中引入AI能力，大部分都没有推出自研大模型。

比如，AT&T就通过部署OpenAI工具，打造Ask AT&T智能问答系统，沃达丰则基于谷歌云构建AI Booster平台，用生成式AI来转录电话，使能客服应用。为数不多的自研大模型，比如德国电信与韩国SKT计划研发的大语言模型，也是针对电信企业需求定制的。

总体来看，国内三大运营商对大模型，无论是反应速度、研发深度，还是覆盖广度，都格外突出。

为什么会出现这种情况呢？就必须提到运营商在数字中国基础设施中的特殊位置。

相信很多人都不会否认，大模型及各种智能应用的需求飙升，需要与之匹配的数字基础设施。而中国正面临着“一卡难求”的算力供给可持续问题，面临着海外高性能算卡断供的供应链风险，面临着国计民生行业数据计算处理的安全考量。同时，大模型要支撑全社会数字化、智能化转型，还会面临经济效益与公共普惠之间怎么平衡的问题。

此前，中国创造性提出并实施了东数西算工程，通过算力的集约型发展和集中化使用，有望解决大模型算力荒、算力贵、能耗成本高等问题。

2022年2月“东数西算”工程正式全面启动，国家算力枢纽节点启动建设。目前看来，确实发挥了应有的作用。最典型的体现是，从以前单一的“东数西存”“东数西备”，发展出了“东数西训”“东数西渲”这样的应用模式，有效提升了算力资源使用率。将AI模型训练、影视动画渲染等放到西部地区数据中心完成，已经成为东数西算的新业态。

大模型到来之后，大数据、大算力也指向了高耗电、高带宽。“东数西算”工程任重道远，进一步推动全国一体化大数据中心建设重大工程，夯实大模型背后的数字基础设施，运营商在三个方面，起到了不可替代的角色：

1.数据流得动。“东数西训”表面上只提到了“数”和“训”，其实背后很重要的一点是“运”，大模型超大规模的数据参数，需要一个发达的数据网络进行传输，实现数据灵活的跨区域的流动。过去几年里，运营商参与到全国范围内的新型数据中心建设。一位IT从业者告诉我，“跨区域的数据流动，这个需求第一个提出来的就是中国移动，它们要实现数据在东西地区的流动，我们才设计了这个功能”。运营商的通信网络，是大模型数据和算力流动的“承重墙”。

2.行业信得过。千行百业使用大模型，安全永远是第一位的。尤其是国计民生行业，出于数据安全方面的考虑，无法使用公有云服务去训练大模型。假如数据丢失了，对很多央企和政府部门来说，就是政治责任。所以，这些行业应用大模型，对服务商的全栈自主、可信可靠，提出了更高的要求。有国家背书的运营商，无疑可以打消这些领域对大模型的存、算、运等方面的安全顾虑。

3.社会用得起。“东数西算”工程的八大枢纽、十大数据中心集群，通过大模型，真正被千行百业“用起来”，运营商可以利用自身在云基础设施、算力成本、资源调配等优势，提供普惠的公共算力服务，加速 AI大规模普及，让大模型深度渗透到行业场景与应用中。从这个角度看，运营商布局大模型，也将进一步强化“东数西算”数字中国基础设施的社会效益。

总的来说，大模型提供了一个契机，让运营商不仅仅作为算力基础提供商，还可以整合自身在全国一体化算力网络、政企市场、云服务等领域的多种优势，更积极地参与到智能化升级与数字化转型中，重构自身在数字化业务中的竞争优势。

运营商落子大模型，不想错过“数字中国”这盘大棋局。

四子围城，运营商的安全地带

如开篇所说，在风起云涌的全球大模型竞赛中，运营商无论是人才、技术、激励体系等，都难以跟谷歌、微软、OpenAI、BAT这样的科技大厂竞争。所以欧美运营商才普遍选择与科技企业合作，而非自研大模型。

国内运营商就“艺高人胆大”吗？这也太瞧不起深耕AI十多年的中国AI企业与科研院所了吧。非也。

下围棋的人知道，围棋的基本常识是围出一个己方的安全区域，对方不能下子，有时候四子围城就足以锁定胜局。而从开篇的图表中，我们可以看到运营商做大模型的普遍特征：

1.都不做通用大模型，而是打造自己的基座模型；

2.都加紧贴合场景，尤其是国计民生重点行业，垂类行业大模型一个比一个多；

3.都不比拼模型参数，而是比拼数据积累、算力服务、MaSS、生态开源等。

显然，运营商也很清楚，自己的优势并不是跟OpenAI、百度、科大讯飞、清华、中科院等AI“大拿”拼算法、拼技术创新性，而是需要强调四种能力：

能力一：安全。目前很多省市政府，已经把AI大模型纳入本地区的中长期发展规划，推进产业转型升级。国计民生行业用大模型，“国云”“红云”是最优选，基于运营商大模型及Mass服务，获得安全可信的大模型训练和部署环境，结合行业私有数据进行训练精调，服务于业务。

能力二：网络。运营商的高速网络，实现跨域的东数西算、东数西存、东数西训和云边协同，支持当地数字经济的发展，能有效带动了运营商大模型相关算力、服务。比如中国电信天翼云，就在贵州优先布局大模型训练算力，并将贵州逐步建成大模型训练中心，天翼云的政务大模型“慧泽”也在贵州的县市落地。

能力三：AI。中国运营商之所以能在大模型浪潮中，比欧美运营商更快响应，正是在过去几年的数字化转型中，运营商也参与了产业AI化的进程，积累了很多算法能力。中国电信的中电信人工智能科技有限公司，累计申请专利200余项，并在18项国际AI竞赛中荣获冠亚军；中国移动于2013年成立“九天”团队，目前已经在机器视觉、语音、自然语言处理、网络智能化等领域，形成了超370项AI能力。中国联通也不例外，自研了60多项核心算法，鸿湖大模型在2022年就启动研发。

能力四：定制。解决垂直行业细分领域的业务问题，需要深度定制，运营商此前服务了大量的垂直行业的客户，积累了庞大的业务数据，当其他大模型厂商头痛于行业专有数据稀缺、客户关系难建立的时候，运营商反而可以弯道超车，凭借良好的客情关系、用户行为数据积累、行业场景洞察，率先“抢跑”垂类行业大模型。

比如中国电信TeleChat对外与智慧政务结合，为政务客户提供政务短信智能化多轮问答服务；中国移动重点推进2B领域企业应用，输出客服领域的智能交互服务，以及企业通话等网络智能化能力。中国联通联合行业推出的医疗算网大模型，也发挥了其在数据、网络上的优势。

通过大量的垂类行业大模型，满足客户的定制化需求。这种拼数量的“题海战术”，估计会在2024更加激烈地上演。

运营商做大模型，采取“四子围城”的策略，用自己的独特优势，围出了一个比较有竞争力的“发育空间”。

劫争之地：运营商大模型的产业纵横

看到运营商大模型的独特优势，也要正视其难关与挑战。正如高手对弈，有时候一个棋子被对方围住，又有能力在下一步将对方围住，这个拉扯争夺主动权的过程，被称为劫争，让整个棋局变得复杂。

现实中的大模型，也并不是一个“技术－商业”的简单游戏，中间存在着大量的影响因素和不确定性，再加上两百多个国产大模型的激烈竞争，都让运营商大模型的前景，存在着很多未知。

其中有几个地方，是很可能影响成败的“劫争之地”：

首先是服务能力。

行业使用大模型，并不是给一个大模型就完了，还需要一系列数据治理、算力服务、模型工具、场景洞察等体系化支持。甚至有的企业，大量话术、专家经验都没有文本化、数字化，需要大模型服务商从数据采集开始做。大模型等数字化业务，与传统通信类业务相比，需要更强的服务精神，更高的服务效率，更主动的服务意识，这对偏向于保守的通信运营商来说，是一个挑战。

然后是产品化能力。

服务能力的体现之一，就是降低客户应用大模型的门槛。以百度、科大讯飞为代表的AI企业，都非常强调产品的工程化能力，提供完善、全面的工具链支持，从开发平台、工具化组件一应俱全。目前，三大运营商也都推出了大模型MaaS 能力和工具，为客户提供一站式服务，这些产品能否真正帮助企业解决大模型训推痛点，还有待更充分的数据和案例。

另外，数字化有场景杂、伙伴多的特点，运营商能否以开放心态发展生态伙伴，还要打一个问号。

大模型使能数字化转型升级，并不是一家厂商就能完成的，产业内有大量繁杂、细分的场景，需要依靠伙伴去触达、去满足，没有伙伴，就没人去为用户解决那些隐藏在深处的痛点。

在产业链中更具话语权的运营商，能否以开放、共赢、合作的心态，汇聚大模型上下游企业伙伴，为伙伴赋能商业价值，形成繁荣的大模型创新生态，目前还难下定论。