刘少轩、陈钰什:驱动双轨转型,大模型在企业脱碳中的应用与挑战

教授观点

刘少轩、陈钰什:驱动双轨转型,大模型在企业脱碳中的应用与挑战

刘少轩 教授 教授主页>

研究方向:供应链管理、运营管理、运营战略、精益运营、数字化转型与创新、交通政策等

双轨转型(Twin Transition)——即将可持续发展与数字化转型有机融合,追求多元价值的实现——是实现高质量发展的核心议题之一。它不仅仅是在两者之间建立简单的协同效应,而是通过系统性的思考,利用数字技术重塑经济、社会和环境系统的运作模式。随着全球气候变化的加剧,企业和组织正面临着前所未有的压力来减少其碳足迹并实现净零排放。2024年人工智能,特别是大模型(LLMs),不仅展示了其变革工作流程的潜力,而且开始被广泛应用于解决环境问题。在企业脱碳的进程中,大型语言模型(LLM)扮演着愈发关键的角色。近期发布的DeepSeek-V3,作为一款参数量达671亿的大规模预训练模型,在性能上不仅超越了现有的开源模型,还在多项评测中与世界顶尖的闭源模型并驾齐驱。DeepSeek-V3的最大亮点在于其卓越的泛化能力和涌现特性。该模型能够快速适应新环境,在没有显式训练的情况下完成新任务,或者只需少量示例即可迅速调整。此外,DeepSeek-V3通过扩展到足够大的规模,展示了小型模型不具备的新功能,如更强的推理能力和逻辑思维技巧,甚至可以在没有明确指导的情况下推导出合理结论。然而,如何利用先进的LLMs在企业脱碳领域仍然面临诸多挑战。本文旨在探讨LLM如何赋能企业的脱碳努力,并提供如何应对在实际操作中遇到的障碍的解题思路。

 

 

为什么关注大模型?

 

在探讨大模型如何助力企业在脱碳过程中面临的挑战与机遇之前,回顾一下AI的发展历程将有助于我们理解为何以LLM为代表的AI技术标志着一个全新的历史阶段。

 

自20世纪50年代以来,AI经历了多个关键阶段,每一个阶段都为后来的技术突破奠定了基础。1950年,英国数学家艾伦·图灵提出了“图灵测试”,旨在评估机器是否能够表现出智能行为。这一概念不仅设定了AI研究的重要基准,还引发了关于智能本质及其衡量标准的广泛讨论。同年,计算机的速度和存储能力极为有限,远不足以支持复杂的自然语言处理任务,但图灵测试提供了一个理想的测量标准,激发了未来几十年的研究热情。

 

1956年夏天,在美国新罕布什尔州举行的达特茅斯会议正式确立了“人工智能”这一术语,并将其作为一门独立学科加以研究。这次会议汇聚了来自不同领域的顶尖学者,共同探讨让机器模拟人类思维的可能性。尽管当时的计算能力和数据资源有限,参会者们对未来充满乐观,认为通过不懈努力终将创造出具有真正智慧的机器。然而,理想与现实之间存在着巨大差距,早期研究者很快意识到要实现真正的AI还有很长的路要走。

 

随着计算机硬件性能的提升及算法理论的发展,80年代末期开始,机器学习逐渐成为AI研究的核心方向之一。这种方法相较于早期基于规则的手工编程方式更加灵活高效,极大地推动了AI的应用和技术水平。然而,早期的机器学习方法也存在明显的局限性,例如依赖大量标记数据进行监督学习,对于未见过的新情况表现不佳,且模型解释性和透明度较低,难以满足实际应用中对可靠性和安全性的要求。

 

进入90年代初期,神经网络作为一种模仿大脑结构和功能的计算模型重新获得关注。特别是多层感知器(MLP)、卷积神经网络(CNN)等架构的发展,为解决复杂非线性问题提供了新的工具。尽管深度学习取得了显著成就,研究人员依然面临诸多挑战,如训练时间和计算成本极高、过拟合现象严重导致泛化能力不足,以及对于某些特定领域的知识如常识推理和因果关系的理解,传统深度学习模型显得力不从心。

 

可以说,AI技术经历了一段漫长的寒冬,直到21世纪第二个十年间,以Transformer为代表的算法框架出现,才标志着自然语言处理能力的重大飞跃。尤其是LLMs,这类基于深度学习框架构建的大规模预训练模型通过对海量文本数据的学习掌握了丰富的语言知识,并能在多种NLP任务中取得优异成绩。相较于之前的AI技术,LLMs展现出以下五个特点:

 

·泛化能力:LLM可以在没有显式训练的情况下完成新任务,或者只需少量示例即可快速调整。通过零样本或少样本学习,LLM能够在新环境中迅速适应并执行任务。

 

·涌现能力:现代LLMs包含数十亿甚至数万亿个参数,这使得它们能够更好地捕捉语言的细微差别和复杂结构。当扩展到足够大的规模时,LLMs会展示出一些小型模型不具备的新功能,如更强的推理能力和逻辑思维技巧,能够在没有明确指导的情况下推导合理结论;此外,它们还可以执行数学运算、编程代码编写等复杂操作,这些都是传统AI难以企及的领域。这种现象被称为“涌现”,表明随着模型尺寸增加,其潜在的能力也会随之增强。

 

·情境学习:LLMs不仅能识别单词的意思,还能理解句子之间的联系及整个对话或文档的情境信息。通过提供相关信息或例子来改善特定任务的表现,帮助建立复杂的数据关系。

 

·多模态处理:除了文本之外,许多先进的LLMs现在还具备处理其他形式的数据的能力,如图像、音频甚至是视频。这意味着它们可以用于创建更加丰富和互动性强的应用程序,如虚拟助手、智能客服平台等。例如,VisualGLM-6B就是一个结合视觉和语言理解的典型例子,让用户可以通过上传图片来询问有关物体的信息或描述场景以获取相关建议。

 

·生成式输出:不同于以往只能判断输入是否符合某种模式的判别式模型,LLMs能够根据上下文生成连贯且有意义的新文本内容。

 

 

大模型在低碳转型的角色:企业参与系统性变革

 

LLMs不仅是技术工具,它们更是推动系统性变革的强大引擎。通过结合其泛化能力、涌现能力、情境学习、多模态处理和生成式输出这五大核心能力,LLMs在宏观层面为企业提供了参与并推动系统性变革的新途径;而在微观层面,则为企业内部的实践创新提供了直接的应用场景和支持。

 

·泛化能力与优化协同:传统政策制定往往滞后于快速变化的市场和社会环境。LLMs通过学习海量数据,能够快速适应新环境,为政策制定者提供更精准的预测和建议。企业可以积极参与到基于LLMs的政策分析和模拟中,例如,与政府机构合作,利用LLMs分析不同政策情景下的经济和环境影响,为科学决策提供数据支撑。对于那些难以获得详尽数据的企业来说,LLM可以通过建模现有数据或行业标准来估算缺失的信息。此外,LLM还能够基于历史排放记录预测未来的排放趋势,帮助企业提前规划减排策略。例如,Climate TRACE利用AI构建全球温室气体排放源数据库,企业可以利用此数据进行自身排放对标,并参与到基于数据的政策讨论中,推动更有效的减排路径。

 

与此同时,LLMs也可以分析企业内部的海量数据,包括生产数据、能源消耗数据、供应链数据等,发现潜在的优化空间,提高资源利用效率,降低运营成本和碳排放。传统的生命周期评估(LCA)往往耗时费力且成本高昂。借助LLM的强大数据处理能力,企业现在可以在几分钟内完成对成千上万种产品的碳排放评估,极大地提高了效率和准确性。例如,CO2 AI平台为企业提供了量化和管理碳排放的工具。CO2 AI的产品足迹工具利用了一个包含超过110,000个排放因子的数据库,使得碳排放计算既迅速又精确。企业可以借鉴其方法,构建自身的碳管理体系。

 

·涌现能力驱动技术与产品革新:清洁能源领域涌现出大量新技术,如何高效整合这些分散的资源是行业面临的共同挑战。企业可以利用LLMs的涌现能力,打破技术壁垒,促进跨界合作和创新。能源企业可以与科技公司合作,利用LLMs优化电网调度,提高可再生能源的利用效率。例如,国家电网有限公司携手百度集团和阿里巴巴集团,推出了我国电力行业首个千亿级人工智能大模型——光明电力大模型,该模型已在电网规划、运维、运行及客户服务等多个关键领域广泛应用。在电网规划中,它犹如经验丰富的医生,通过分析气温变化和用电需求,精准定位重过载设备并提供改进建议;在电网运维方面,它担任“智慧体检师”,自动生成精确的设备“体检报告”,特别是针对换流变压器等核心设备,自动读取实时和历史数据,综合分析并给出评估报告及建议;在电网运行上,凭借强大的智能交互和推理决策能力,快速生成满足高实时性和强可解释性需求的负荷转供策略,确保调度运行更精准、电力供应更可靠。

 

在产品方面,LLMs可以辅助企业进行产品设计、材料选择、工艺优化等,开发更环保、更节能的产品和服务。在搜索功能上,LLMs不仅能够改进气候法律和政策的搜索效率,还能从科学文献中挖掘用于功能性材料设计的信息,并通过对比行业估计来搜索产品的碳足迹描述。

 

·情境学习促进价值链协同:低碳转型涉及复杂的价值链和多方利益相关者。企业可以利用LLMs的情境学习能力,搭建沟通平台,促进价值链上下游的协同合作。例如,企业可以与供应商、客户、投资者等建立基于LLMs的沟通平台,共享环境数据和最佳实践,共同制定减排目标和行动计划。在供应链价值链的碳管理场景中,LLMs可以准确高效地处理复杂的查询和优化任务。许多优化任务通常以数学程序的形式编写,这些程序考虑了供应链的结构、所有业务需求以及碳排放目标,并生成有效的供应链建议。具体而言,LLMs能够将人工查询转换为精确的数学代码,对原始数学模型进行微调,从而更好地适应特定的业务需求或碳减排策略。例如,在制定供应链计划时,如果需要强制零售商使用某个特定工厂的产品以减少运输距离和相关碳排放,可以通过添加数学要求或“约束”来实现这一目标。该约束条件禁止其他工厂向指定零售商发送产品,确保碳足迹最小化。随后,这个小小的调整被输入到供应链优化工具中,生成一个修改后的计划。新计划主要用于与现有方案进行对比分析,评估其在碳排放和其他关键绩效指标上的改进效果。最终,经过调整的新数学模型输出的结果会通过LLM转化为易于理解的人类语言答案,帮助企业决策者快速了解优化措施的影响。这种方式不仅提高了决策过程的透明度,还使得非技术背景的利益相关方也能够参与到低碳转型的讨论中来

 

·多模态构建风险预警体系与智能制造:极端天气事件对企业运营和供应链安全构成严重威胁。企业可以利用LLMs的多模态处理能力,整合气象、地理、环境等多源数据,构建更精准的风险预警体系,提高应对气候变化的能力。企业可以与气象机构合作,利用LLMs分析历史气象数据和预测模型,评估自身资产和运营面临的气候风险,并制定相应的应对措施。例如,DeepMind的GraphCast是一种基于机器学习的天气预报方法,旨在改进天气预报并减少计算成本。GraphCast方法能够在不到一分钟的时间内生成十天的天气预测,其准确性达到了前所未有的水平,这在过去是计算上过于昂贵而无法普及的。这种预测能力和预报对于支持极端天气事件和自然灾害(包括热带风暴和极端高温)具有重要意义。此外,ClimaX项目(由UCLA和Microsoft合作开发)通过灵活的深度学习模型来填补传统气候建模中的空白,该模型可以在多种异构数据集上使用,同时简化计算成本并保持泛化能力。NASA的地球系统数字孪生项目则致力于集成各种地球和人类活动模型,提供统一、全面的表示和预测,用于监测和决策支持。这些技术的发展为企业提供了更强大的工具,帮助它们更好地理解和应对气候变化带来的挑战。

 

在智能制造方面,特斯拉在电动汽车生产和设计中应用AI的经验表明,LLMs可以有效推动产品创新和生产效率的提升。特斯拉致力于通过一系列创新举措减少其制造足迹,目标是将生产时间缩短40%,同时降低碳排放足迹,并减少制造成本50%。这一目标不仅体现在汽车制造工艺上,还扩展到了工厂建设本身。例如,在Giga Texas超级工厂的建设过程中,特斯拉实现了从原材料进入厂房一端到成品车从另一端出来的高效闭环生产流程。这种“拆箱”制造系统不仅提高了生产速度,还降低了成本,使得每年最多可以生产100万辆车。特斯拉使用计算机视觉AI分析其制造过程中的大量视觉数据。例如,AI驱动的质量控制系统可以实时识别缺陷,从而立即纠正、减少浪费并提高整体效率。此外,特斯拉在预测性维护中使用AI来监控设备状况并预测故障,从而最大限度地减少停机时间并确保持续生产。此外,特斯拉引入了先进的机器人技术,特别是Optimus Bot,它显著提升了运营效率和安全性,同时为制造提供了前所未有的灵活性。Optimus机器人,作为具身智能的代表,已经在特斯拉的工厂中承担起了一些关键任务,如精确地对4680型电池单体进行分类并插入托盘,展示了其在执行复杂任务时的高度自主性和学习纠错能力。这些机器人的手部设计具有11个自由度,能够执行复杂的操作,并且可以通过端到端神经网络直接产生控制关节的动作序列,所有这一切都在机器人的全自动驾驶(FSD)控制器上运行。

 

·生成式输出赋能企业沟通与倡议:企业在推动低碳转型过程中,企业需要积极与公众沟通,传递环保理念,赢得社会支持。LLMs可以通过生成高质量的内容,如科普文章、社交媒体帖子、互动体验等,帮助企业更有效地与公众沟通。LLMs在应对气候变化的多个方面展现出强大的应用潜力。首先,在情感分析领域,LLMs能够确定新闻媒体对气候变化的立场,评估气候专家声明的信心水平,并估算公众对全球变暖的看法。LLMs在问答系统中的应用也非常广泛,能够回答企业收益电话会议中的气候信息问题。在对话管理方面,LLMs可以通过聊天形式提供来自企业可持续发展报告的气候信息,以及组织和国家的净零排放信息。在摘要生成方面,LLMs能够提供联合国权威文件中气候信息的摘要,或根据用户的具体地理区域定制内容。主题建模是另一个重要的应用领域,LLMs可以检测公共文档中的气候变化话题,识别新闻媒体中的环境、社会和治理(ESG)话题,以及保险、碳披露和国家自主贡献文件中的气候变化话题。此外,LLMs还能在气候文献中找到与气候引发的基础设施危害相关的话题。最后,在论点挖掘方面,LLMs能够识别气候怀疑文本中的叙事技巧,并使用基于证据的推理进行气候变化声明的事实核查。这些应用展示了LLMs在气候变化研究和实践中的多方面价值,为决策者、研究人员和公众提供了有力的支持工具。

 

下表体现了LLMs在企业脱碳中的角色体现在价值链的不同环节发挥作用,从设计与研发、生产与运营,到供应链管理以及产品使用与废弃,都有其独特的应用潜力。表格的核心观点是,LLMs不仅能自动化数据处理和预测趋势,更能通过情境学习和生成式输出,赋能价值链协同和公众沟通,从而推动更有效的气候行动。

 

 

大模型助力脱碳面临的挑战与潜在解决方案

 

尽管大模型为各种企业脱碳带来了显著的创新潜力,但其在实际应用中,尤其是在环境管理和碳排放核算等高价值场景中,仍然面临着一系列的局限性和挑战。New Energy Nexus中国作为气候科技加速器的代表,一直致力于支持初创企业和中小企业实施其气候创新解决方案,在访谈入营企业的过程中,我们也了解一些一线LLM在企业脱碳过程中所面临的局限性及其带来的挑战,并提出可能的解决方案。

 

辅助功能的局限性

 

尽管LLM可以作为辅助工具来增强某些流程,但在碳足迹计算这样的特定任务中,其优势并不总是显而易见。考虑到公司制造流程和生产线的变化相对有限,年度变化很小,因此使用传统的Excel表格可能更为简便。这意味着对于那些需要高度定制化或灵活性较低的任务,LLM的优势并不明显。当企业的生产模式较为固定时,通过调整几个关键参数即可完成的Excel表单更新,往往比引入复杂的AI系统更加高效且易于操作。此外,对于一些小型或中型企业来说,投资于先进的AI解决方案可能不符合成本效益原则,尤其是在预期收益不明确的情况下。

 

 

推理能力和可靠性不足

 

尽管已经进行了探索和尝试,但LLM的实际应用特别是在逻辑推理方面,其可靠性和准确性仍存在不足。基于不同报表、模板和计算流程的设计会导致不同的结果,这表明了当前LLM在处理复杂且多样化数据时的一致性和精确度的问题。具体来说,由于缺乏统一的标准和规范,不同来源的数据可能会导致LLM输出的结果出现偏差。这种不确定性不仅影响了决策的质量,也可能阻碍企业在实施低碳战略方面的进展。为了克服这一障碍,有必要更有针对性的引入推理模型较强的模型,以及增强专家系统在其中的作用。

 

信任与验证问题

 

LLM另一个核心问题是用户对AI结果的信任度。考虑到LLM可能会产生幻觉——即生成看似合理但实际上不准确的信息,并且不会明确指出不确定的地方,如何确保和验证AI输出的真实性和准确性成为了一个难题。在商业环境中,错误的信息可能导致严重的后果,包括但不限于财务损失、法律风险以及品牌形象受损等。因此,建立一套完善的审核机制至关重要,它可以帮助识别潜在的风险点,并为用户提供可靠的指导。同时,透明度也是提升信任的关键因素之一;企业应当公开其使用的AI系统的运作原理,以便利益相关者了解背后的逻辑并作出明智的选择。

 

 

数据可用性和质量

 

高质量的数据是实现有效碳足迹估算的关键,但现实中,可用数据的质量和数量往往是有限的。即使理论上LLM可以通过扩大数据库来改进估算,但如果基础数据本身不可靠,那么由此产生的估计值也不可信。事实上,许多企业在收集和整理环境绩效指标方面面临着诸多挑战,如数据缺失、格式不一致等问题。这些问题不仅限制了现有分析工具的有效性,也阻碍了未来技术创新的步伐。为此,加强数据治理成为了一项紧迫的任务,它要求企业采取一系列措施,包括但不限于制定严格的数据采集标准、定期审查现有资源以及投资于自动化工具的研发等。

 

 

认证和确定性需求

 

在涉及碳核算和会计等敏感领域时,必须保证所有的计算都是确定性的并且可追溯。然而,由于LLM依赖于概率过程,它们无法提供绝对的确定性,这对于一些要求极高的应用场景来说是一个重大障碍。例如,在编制财务报告的过程中,任何细微的误差都可能导致严重的后果。因此,寻求一种既能发挥LLM优势又能满足严格监管要求的方法显得尤为重要。一方面,可以通过引入第三方认证机构来进行独立评估;另一方面,则应积极探索新的技术和方法,以提高LLM输出结果的可靠性和稳定性。

 

为了克服上述挑战,未来的发展方向应该集中在以下六个方面:

 

一、提升智能体的可信度与逻辑推导能力

 

智能体(Agent)是指能够在特定环境中感知状态,并基于该信息采取行动以实现预定目标的实体。对于企业脱碳项目而言,智能体不仅限于传统的LLM,还包括那些能够执行复杂推理任务的专业化组件。首先,要确保LLM能够在没有幻觉的情况下作出可靠的判断,并具备完整的数学抽象和表达能力。其次,智能体应能进行精确的逻辑推理,特别是在需要确定性结果的情境下。例如,在碳排放预测或环境影响评估等任务中,智能体必须准确地处理数据并得出合理的结论。

 

二、引入更强推理能力的模型

 

针对目前LLM在逻辑推理方面的不足,推荐选择或开发具备更强逻辑推理能力的基础模型。这类模型通常包含更多特定领域的知识,在训练过程中被赋予更复杂的任务,从而能够更好地理解和执行类似的任务。例如,市场上已有的某些变体专为支持数学问题求解、逻辑演绎等设计,非常适合应用于碳足迹核算等领域。同时,考虑采用混合专家(MoE)架构可以进一步提升系统的灵活性与效率。DeepSeek-V3就是采用了MoE架构,通过引入多个“专家”子网络来处理不同类型的输入数据,使得每个子网络可以专注于特定的任务或数据模式。这种分工合作的方式显著提高了计算资源的使用效率,减少了冗余计算。对于需要大量数据处理的企业来说,这意味着可以在不增加硬件成本的情况下,更快地完成复杂的碳排放评估、能源管理优化等任务,从而加速低碳转型的步伐。

 

三、结合检索增强生成(RAG)技术

 

RAG系统通过整合外部知识库,允许模型基于最新的信息源进行回答,减少了因内部存储知识过时而导致的错误风险。这对于快速变化的政策法规尤为关键,因为它能确保模型始终依据最权威的信息作出决策。更重要的是,RAG还能够在一定程度上缓解LLM容易产生的幻觉现象,即生成看似合理但不正确的输出。当模型从可靠的外部资源获取信息时,它可以验证自己的假设并纠正偏差,这对于环境影响评估报告编制等要求高度准确性的任务尤为重要。

 

四、强化数据治理框架

 

建立健全的数据收集、整理和验证体系是提高LLM性能的基础。良好的数据治理不仅能改善现有分析工具的表现,也为未来的创新奠定了坚实的基础。企业应当认识到,只有掌握了高质量的数据资源,才能真正释放出AI技术的巨大潜能。这意味着加大对基础设施建设的投资力度,确保各个环节都能顺畅运行,同时也包括采取措施保护敏感信息的安全性。

 

五、增强专家系统的作用

 

除了直接提供解决方案外,专家系统还可以作为监督者参与到LLM的学习过程中。一方面,可以通过定义一系列针对不同类型企业的碳减排措施及其预期效果的规则,帮助LLM在面对具体问题时给出具体的建议;另一方面,利用专家系统的持续学习能力,自动提炼更为有效的实践模式,并将其应用于未来的类似情境。此外,专家系统还可以充当反馈机制的一部分,定期检查LLM的表现,并根据发现的问题提出改进建议,以此加快LLM的学习速度并确保最终结果的质量。

 

六、确保法规遵从与社会接受度

 

任何新技术的应用都需要考虑是否符合现行法律法规的要求,并赢得公众的信任。因此,在引入LLM时,企业必须遵循透明的原则,并积极参与相关标准的制定过程。这样做不仅可以保证技术应用的合法性,还能促进社会各界对企业行为的理解和支持。

 

综上所述,尽管LLM在企业脱碳领域面临诸多挑战,但通过上述针对性强且逻辑清晰的改进措施,我们可以显著提升LLM处理复杂任务的能力,确保其输出结果的准确性与可靠性。为了充分发挥LLM的作用,我们需要不断推进技术创新,加强跨领域合作,并积极应对监管和社会层面的挑战。只有这样,才能确保这些先进工具真正成为推动绿色转型的有效武器,帮助更多企业走向可持续发展的未来。在这个充满变革的时代里,积极拥抱新技术将是每个追求卓越组织不可或缺的选择。

 

参考资料略。■

 

 

刘少轩

上海交通大学安泰经济与管理学院副院长、中银科技金融学院执行院长

 

陈钰什

New Energy Nexus中国首席研究员

上海交通大学中银科技金融学院博士后

 

转载自:新经济学家智库

发布者:产教融合发展中心 发布时间:2025-02-14