投资界滚动资讯正文

工程智能发展之路（二）：利用大模型打造新一代工业智能的数字底座

2024-05-24 14:03 · 互联网

笔者按：2024，行业“GPT时刻”来临。笔者看到，在汇聚人类*智慧与精湛工艺的半导体行业，以智现未来为代表的工业软件供应商，正发挥着其深耕行业数十年的数据积淀、技术储备和深厚的一线服务经验，以大模型为武器，盘活工厂数据资产，解决晶圆厂数据孤岛困局、“经验沉没”和“人才密度不足”等诸多难题，开启全新的工业智能时代。

ChatGPT引爆了新一轮的人工智能浪潮，各行各业都在翘首期盼拥有专属于自己的“AI引擎”。正如每一次技术革新都将人类生产力推向新的高度一样，在特定行业内，对垂直领域大模型的需求日益增长。与应用广泛的通用大型语言模型不同，这些垂直领域的大模型专注于深入理解和处理特定领域的信息，提供更专业化的服务，并从根本上提升相关行业的生产力。同时，利用大模型洞察垂直领域更为复杂的隐藏逻辑，让大模型涌现出像人一样去使用工具甚至制造工具的能力，提供切实的生产力的改进，将是我们一同面临的机遇和挑战。

作为国内首家推出专在泛半导体领域应用的大语言模型的企业，深圳智现未来工业软件有限公司无疑在行业变革中扮演着领军角色。其发布的“灵犀”大语言模型及其在泛半导体行业应用案例不仅展示了该技术在提升芯片制造效率、降低成本以及增强产品质量方面的巨大潜力，可以预见，其将为晶圆厂的智能制造提供强大助力。

半导体晶圆厂：数据资产的困局与大模型破局之道

半导体制造代表了当前工业的最高水准，其工艺极其复杂，往往涉及数千个步骤，在生产中会产生海量的数据；而单个工程师一般只具备某个小领域的专业知识，服务于不同的工程师的各种应用应需求而生，造成了数据割裂的现象；数据分析起来耗时费力，且高度依赖工程师的个人经验。

以下是现阶段以晶圆厂为代表的高端制造业面临的典型问题：

管中窥豹，问题处理效率低下：囿于个人经验和精力的限制，工程师们虽精于一隅，却难以穷尽全域。面对突发问题，工程师可依据过往经验对知识能力范围内的特定问题作出迅速响应，当超出自身经验范畴时，只能从头摸索，耗费大量时间和精力。只有当一线工程师处理不了的问题才会升级到⼆线，这无疑减缓了生产的步伐，影响整体效率。

数据孤岛，知识壁垒阻碍协作：单个工程师可能只负责产线的一小段，不同工艺段的数据互不贯通，难以理解其工艺段的数据结构和具体含义，处理问题就需要跨领域协调(Inter-Module Meeting)，甚⾄反复多次，沟通成本较高，延误问题解决。

经验沉淀和知识传承成难题：海量生产数据是晶圆厂宝贵的“资产”。然而，问题往往是在发生后才被追溯，大量的经验和知识散落在各个角落，难以积累沉淀。而且即使有意去调用这些数据，⽂档、报告难以检索，更难以借鉴，利⽤率低，造成“经验沉没”。

重复操作易出错，自动化机制亟需建立：晶圆厂生产过程中存在大量需要人工决策的重复性工作，不仅浪费了宝贵的人力资源，也容易导致人为失误，降低生产质量。

为了应对这些挑战，一方面，不少晶圆厂开始着手打造大数据底座，实现数据集成，虽然减少了数据对齐时间，却仍未能摆脱对工程师个体经验的依赖。

另一方面，虽然产业也在不断地培养新人才。但是，新入行的初级工程师需要较长的训练和学习时间，难以快速积累经验。案例研究Case study和培训手段匮乏、导师人手不足等问题，也制约了人才的培养速度和质量。此外，过往案例检索困难，导致知识难以有效传承，也成为人才培养的一大难题。更令人担忧的是，好不容易培养出来的人才如果流失，宝贵的经验也随之付诸东流。

大语言模型的出现，为晶圆厂的困境带来了破局的曙光。大语言模型一个已经验证的能力是把非结构化的数据结构化，一方面能够有效的把历史上积累的数据资产盘活，另一方面通过整合结构化和非结构化数据形成对工厂全貌的认识。此外，大语言模型还具备强大的推理能力，特别是能够从历史分析、操作和报告中学习并进行逻辑推理。通过对大量数据的深度学习，大模型能够打通信息孤岛，实现全局的智能分析。同时，大模型还有希望从大量的数据和积累中，洞察出更为复杂的高阶关联，实现智能涌现的价值。

“种子”选手智现未来：用大模型打造半导体工厂的智能数字底座

面对全面的挑战，⼤模型极有可能是实现下⼀代的智能制造的最佳路径。通过大模型的思考链（chain of thought）和验证链（chain of verification），进而结合多个专家系统，将不同的大模型串联起来，形成价值链（chain of value），使大模型能够从“被动调用”转变为“主动发现问题”，通过“举一反三”，创造涌现性价值，为制造业带来革命性的变革。

然而，并不是简单的迁移就可以让大模型发挥理想的价值，想要参与到晶圆厂纷繁复杂的工艺制造中，大语言模型需要行业大量高质量的语料结合经验的积淀来完成训练，同时需要对行业充分的理解并赢得客户的信任。行业大模型对数据、算法、算力皆有要求，需要深厚工程化思维的不断积累，业内鲜少有企业能够具备转化的所有条件。在拥有并理解大量专业数据这方面，只有占据半导体数据高地、深耕工程智能领域几十年的寥寥数家公司，可以生成并系统化、规范化地积累了大量的高质量语料。

智现未来在这场已经到来的技术革新浪潮中，就像是“天生”的种子选手一样，具备发展泛半导体行业垂直大模型的所有先天条件。智现未来脱胎于工程智能全球“三大家”之一的BISTel，其在工程智能领域深耕20多年，具备深厚的经验、清晰的行业认知、技术储备及大量标杆客户的成功案例，积累了丰富的生产数据和工艺数据。这些宝贵的数据财富、全面的行业理解、构建高质量模型的人才积累，为智现未来打造国内*半导体垂直类大语言模型——“灵犀”，奠定了坚实的基础。

以下是智现未来“灵犀”大语言模型的价值实现路径：

①在当前市场中，众多基础大型语言模型（LLM）如GPT 4、Llama 3等纷纷涌现，它们具备基础的读写能力，类似于知识面广泛的“高中生”。尽管对半导体这类专业领域有所涉猎，但理解尚浅。如何对这些基础大模型进行测评？一方面需要AI专家，另一方面，需要将其接入成熟的半导体行业应用软件做基准测试（benchmark）。

②为进一步提升，模型需深入学习专业知识，仿佛“高中生”进入大学专攻半导体专业，通过吸收半导体领域公有域的知识和资料，逐步成长为知识丰富的“半导体专业大学生”。语料选择和如何教授成为这一阶段的关键点。

③接下来，由具备数十年实战经验和行业积累的资深专家“智现未来”担任导师，结合智现未来20余年积累的私有数据（包括设备和工艺数据、文档、模型、算法、代码等等）深化训练。

④经过上述的培育，模型蜕变为工程智能领域的“研究生”，这就是智现未来的“灵犀”大语言模型。

⑤进一步，“灵犀”大模型被放入客户的晶圆厂实地环境中，采用智现未来提供的专业工具链和流程，由工厂和智现未来的专家共同指导，经过二次训练和客户私有数据的定制化学习，锤炼成为该领域的技术专家。

⑥作为工厂的技术专家，大模型能够提供智能缺陷检测、智能报告生成、智能故障分析以及客户专属的行业服务。

这样的一个大模型集合了所有⼯程师的视⻆和经验，既懂设备，又懂工艺、制造、良率分析，涌现出超越个体之和的分析和解决问题的能⼒，成为生产制造过程的“超级大脑”。

此外，区别于人类，AI可以实现24小时不间断运行且错误率极低。AI更大的优势在于，它不仅能处理常规数据，还能洞察更高维的关联，提取到⼈看不到的信息，实现从“类人（like human）”到“超越人类（beyond human）”的智能飞跃。例如：为了适应人的感知，以往的wafer map通过晶圆网格配合颜色可以展现芯片的三个维度(x, y, Good/NG)，但对于每个芯片（die）来说，除了基本的良品（good）与不良品（NG）分类外，其下还隐藏着更多维度的测试结果，如电性特性等关键参数，而AI能够直接处理这些高维的数据。

“灵犀”大语言模型：半导体“智造”利器已光芒初现

尽管大语言模型在行业应用才处于探索阶段，但是“灵犀”已经在有限的探索范围内闪现了其可能照亮未来的光芒。基于前期长期的积累，仅仅不到半年的验证及探索，“灵犀”大模型已经在缺陷图像识别、Wafer Map失效自动分类、FDC设备异常监控、良率分析预测、设备预防维护、智能专家推理、群体智能知识中台等多个领域都已展现出巨大潜力，迸发“灵犀”之光。

案例一：多模态缺陷识别

半导体生产中存在大量缺陷分析需求，传统方法依赖人工标注和分析，需要大量（可能是上万个）缺陷样本的积累才能建立出一个缺陷识别机制，且依赖样本照⽚与标记的质量，这不仅耗时且易出错。如何有效整合多维度数据以提升分析的深度和积累经验，从而提高缺陷分析的效率和准确性，成为行业面临的一个重大挑战。

基于“灵犀”大语言模型的多模智能缺陷改良系统，通过实时监控生产线，能够结合图⽚特征、产线数据、⽂本经验等多模态的数据，构建复合矩阵的多元分析，实现自动识别缺陷，快速准确分类，并自主生成缺陷报告和根因分析。该方案仅需要以前2%的数据即可做到更准确的识别，将训练的样本数量减少2个数量级。这不仅大幅提升了效率，还减少了样本标错的机率。原来数百工程师一年的工作量，“灵犀”大模型只需要2~3个月就可以完成，分类准确率更是提升超过10%。

“灵犀”之光的闪现点：

“灵犀"的多模态能力突破了单个工程师对单一知识领域的局限，打破了"管中窥豹"的狭窄视角，实现了对复杂工程问题的全面理解和深入洞察，真正做到知识集合、共享的群体智能。

借助AI技术，“灵犀”大语言模型帮助工程师实现了对数据的即时分析，极大减少了人工干预，显著提高了报告的准确性与及时性。

至关重要的是，所有分析过程和结果都被有效整合并沉淀至大语言模型之中，为模型的持续学习与训练提供了宝贵资源，确保了智能缺陷改良能力的不断演进与升级。

案例二：良率分析应用（Yield Analysis)

良率(Yield)是半导体产业的*挑战，芯片的良率也直接关乎着芯片制造的成本，因此良率分析对于半导体制造商来说极为关键。通过系统分析不良品和确定造成不良的原因，可以采取措施提高良率，进而降低成本。

目前市场上广泛使用的如YMS良率管理系统、DMS缺陷管理系统等良率分析平台，均属于管理系统。这些系统在设计时面临一定挑战，由于良率分析方法因人而异，对自由度有极高要求，使得软件设计和操作起来都很复杂，也很难满足高级分析需求，且常常无法有效关联原始追踪数据（Raw Trace Data）。

基于“灵犀”大语言模型的良率分析系统能够根据历史和实时数据自动建模，提供“千人千面”的分析工作台，增强数据探索自由度。“灵犀”极大地简化了交互流程，加快了问题解决速度。

不同于其他YMS良率管理系统，搭载“灵犀”的良率分析系统(YAS)融合了半导体领域资深AI工程师的智慧与能力，随时在线的Copilot“老师傅当助理”，可快速调用数据、自动执行建模与分析，找到影响良率的根因，并提供优化建议，形成报告，帮助工厂快速做出更加精准的生产决策，大幅提升了生产管理的智能化水平。

除此之外，“灵犀”还在多个领域能够创造令人惊叹的价值。例如，“灵犀”大模型通过自动化建模和分析，使设备预测性维护从被动转为主动，优化维护计划，让设备维护更加精准，既避免出现安全生产事故，又避免“过度”维护，从而提高半导体晶圆厂的生产效率并减少经济损失。

可以预见，“灵犀”大模型的应用，将为半导体行业带来一场深刻的变革，推动半导体制造业智能化升级，提高生产效率、降低生产成本、提升产品质量，释放巨大的生产潜力，为行业发展注入新的活力。

展望：大模型碰撞工程智能，涌现高质量新质生产力的无限可能

目前，业界普遍认为大模型的能力在于其对复杂符号关系的把握以及对世界高阶相关性的认知，这些能力正在超越人类的认知极限。特别是在智能制造这一领域，大模型通过分析和处理大量数据，能够识别现阶段人类工程师难以察觉的模式和关联，从而优化生产流程，提升制造效率和质量。这种超越人类的认知能力，不仅加速了智能制造的发展，也必将会对其他相关领域产生深远的影响。

工程智能作为高阶智能制造技术，面对的是极复杂、高标准、拥有大量样本数据和经验积累的场景，而这些都作为大量的优质数据样本，沉淀在代码和文档中。大模型与工程智能的相遇，更像是各自准备，相向而行的不期而遇。

可以预见的是，以智现未来为代表的工程智能解决方案供应商，将会用数十年来构建的成熟可靠的产品体系，在大模型的深度融合和加持下，实现革命性的全面焕新。大模型作为中间能力，必将深度渗透并强化了工程智能系统中数据搜集、智能监测、智能分析、智能预测、智能决策等各个关键环节。大模型与工程智能的碰撞，是如虎添翼的优势相乘，天然的优质土壤遇到基因优良的种子，一定可以结出丰硕的成果。

“GPT时刻”已经到来。根据预测未来3年，AI在整个制造业的投入规模和产出价值都将会成倍增长。像”灵犀“这样的工业大模型的崛起，正悄然开启半导体工厂的全新篇章。在这个新的章节中，所有的数据、操作都必须接入大模型，所有的决策都将以大模型为基础；每个⼯程师都需要⼀组⼯程师助理，以便集中精力解决更重要的问题，提升产线效率；每个⼯⼚都需要⼀个专属于自己的专家系统，将分散的知识经验形成资产沉淀，打造可泛化的群体智能，静待智能涌现，为“智造”创造无限可能。

（免责声明：本文转载自其它媒体，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。请读者仅做参考，并请自行承担全部责任。）