跳转到内容

工业大数据

本页使用了标题或全文手工转换
维基百科,自由的百科全书

工业大数据Industrial big data)是构成工业人工智慧的重要元素,指由工业设备高速产生的大量数据,对应不同时间下的设备状态[1],是物联网中的讯息[2]。此一词语在2012年随著工业4.0的概念而出现,也和信息技术行销流行的大数据有关,工业大数据也意味著工业设备产生的大量数据有其潜在的商业价值[3]。工业大数据会配合工业互联网的技术,利用原始资料来支援管理上的决策,例如降低维护成本以及提升对客户的服务[2]

定义

大数据是指大量、多变且快速产生的数据,需要新的科技来处理,以便于决策、知识探索以及制程的最佳化[4],这也称为大数据的3V(volume、variety、velocity)。有时也会加上第四个V,也就是资料真实性(veracity)此一特征,强调资料的品质及整合性[5]。不过工业大数据还需要加上二个V。一个V是可见(visibility),意思是发现资产或是制程中一些未预期的事实,并且将不可见的知识转换为可见的价值,另一个V也就是价值(value),因为工业环境会面对的风险及冲击,工业大数据在分析上的准确性要求会远高于比社会媒体分析或是客户行为分析上的要求[6][7][8][9]

工业大数据的数据是由自动化设备及程序自动产生,而其环境及操作也是受到控制的,目的是让人为的介入降到最小,因此工业大数据的资料的结构化程度较高,彼此相关性也较高,会依发生时间顺序排列,也比较适合进行分析[6]。不过即使设备机器都已经互相连线及网路化,工业大数据有以下的特点(Background、Broken、Bad-Quality,也称为3B)也会造成在分析时的挑战[6]

  • 背景

一般的大数据分析重点在挖掘到资料之间的相关性,以及捕捉到现象。不过工业大数据更著重于由现象中找出其背后的物理性根本原因。因此有效的工业大数据分析会比一般的大数据分析更需要特定领域的专业知识。

  • 破裂

相较于一般的大数据分析,工业大数据著重资料的完整性更甚于巨量的资料。因为若要建构一个准确的资料驱动分析系统,必需从不同的工作条件上采集资料。因为通讯特性,以及资料来源的不同,系统中的资料是离散未同步的。因此在正式进行分析之前,预处理格外的重要,可以确保资料是完整、连续及同步的。

  • 品质不良资料的破坏性

大数据分析的重点是资料挖掘及发现,因此巨量的资料可以弥补资料的品质不良。但在工业大数据中,各变数都有明确的物理意义,在建立分析系统时,资料完整性非常重要。品质不良的资料或是不正确的记录都会影响不同变数之间的关系,对于估测的准确性上有灾难式的冲击。

因此,单纯一般泛用大数据分析的技巧不一定可以应用在工业数据中。工业大数据需要更多的领域知识、分析系统机能的清楚定义,也需要在正确的时机将提取到的见解给正确的人,以产生较佳的决策[6][10]

资料的取得、储存及管理

因为自动化工业设备可以以极快的速度大量产生资料,所以要处理这些资料的公司,首先面临的就是储存及管理资料的基础架构。传统的商业智能主要专注于企业内部有结构的资料,依其固定出现的周期处理相关资讯[11],而工业大数据分析系统需要接近实时处理的分析,以及分析结果的视觉化。

第一个步骤是收集正确的资料[10],现代设备的自动化程度越来越高,可以由越来越多的感测器自动产生资料。识别其中设备状态有关的参数就格外的重要了,可以减少需要和集的资料,也让资料分析更加有效率及效果。

下一个步骤是建立资料管理系统,既可以处理大量资料,并且可以用接近实时的效率进行分析。为了可以快速的进行决策,资料储存、管理及处理需要进一步的整合[10]。例如奇异公司为了其许多的燃气涡轮发动机,建立了资料储存基础架构的原型[12]。所发展的系统以内存资料网格(in-memory data grids,IMDG)为基础,已证实可以处理高速及大量的资料流,并且可以以近乎实时的方式来分析资料。他们认为这项技术展示了实现工业大数据管理基础架构的可行作法。随著这些设备越来越便宜,这类系统也会成为未来产业的中心及基础。

网宇实体系统

网宇实体系统(Cyber-physical system)是工业大数据中的核心技术[6][7],是在运算模型以及实际元件之间进行无缝整合的系统[13]。网宇实体系统和传统的运作技术不同,网宇实体系统的决策要以设备状态的核心内容为其决策基础。包括连结、转换、网宇、认知及组态的5C架构[14]意味著网宇实体系统著重在将原始资料转换成可以进行行动的资讯、有助于了解流程的内容、最终透过有良好资讯的决策来提升流程。提升后的流程会进一步的提升生产力以及降低成本。网宇实体系统和工业大数据的使命(在大量的原始资料中找到相关见解,将资讯转换为价值)是一致的。网宇实体系统结合了资讯科技以及运营技术,创建资讯透明的环境,作为不同阶层用户的决策基础。

这类的技术已经有应用实例:美国国家科学基金会工业/大学智能维护系统协作研究中心(IMS)已在Cosen带锯机上实现此技术,而且2014年在芝加哥举行的IMTS中展示[7]。IMS开发了适应性退化监控(Adaptive degradation monitoring)技术,来处理在切削过程产生的大量且高速的资料,以及负载变化的情形。当带锯退化条件出现时,会在最佳的时间建议使用者更换带锯,以确保安全,也减少在材料切削过程中造成的损失。所进行的分析计算是在云端进行,可以透过乙太网以及行动设备存取[7]

范例存取库

工业系统的元件无时无刻都可以产生大量的资料。一个生产线上,每台机器每天都可以产生上亿笔的资料[1],例如波音787每次飞行就会产生500 Gigabyte的资料[15]。明显的,工业系统中的一组单元产生的资料量远超过传统方式的能力范围,因此在处理、管理及运算上都是挑战。

有许多研究者、公司主动参与了收集、组织及分析巨量工业资料的工作,其中有些资料若因为研究需要,已可以公开给大众。

NASA的资料存取库[16]是工业大数据中最出名的资料存取库。其中的许多资料会用在预测式分析、故障侦测预诊断英语prognostics机能等。

ID 存取库名称 资料说明
1 藻类沟槽资料集 三个的藻类生物质小型沟槽实验
2 CFRP复合资料库 CFRP(碳纤维增强塑料)面板的运行至失效实验
3 铣削数据集 铣床在不同速度、进给量及切削深度下的实验。记录VB铣削刀片的磨损,数据集是由加州大学柏克莱分校的 BEST 实验室提供[17]
4 轴承资料集 有关轴承的实验。资料是由辛辛那提大学的智慧维修系统中心(Center for Intelligent Maintenance Systems)提供[18]
5 电池资料集 锂离子电池的实验。不同温度下的充电及放电。记录其阻抗以作为判断是否损坏的准则。此资料是由NASA Ames的Prognostics CoE提供。
6 涡轮扇引擎退化模拟数据集 利用C-MAPSS进行的引擎退化模拟。以不同运作条件,失效模式组合后的四个组合进行模拟。纪录数个感测器频道以找到失效的演进特征。此资料是由NASA Ames的Prognostics CoE提供。
7 IGBT加速老化资料集 利用老化及特征系统取得的热过应力加速实验初步资料。资料集包括六个设备的老化资料,一个是用直流闸偏压进行老化,其他的是用方波信号的闸偏压进行老化。有些测试有量测许多的数据,包括闸极电压的高速量测,集极-射极电压以及集极电流等。此资料是由NASA Ames的Prognostics CoE提供。
8 投石机资料集 由配重可变的同一个投石机,投掷不同种类球体所得的轨迹。有拍摄飞行轨迹并且计算物体的位置。有提供原始影片资料及计算出来的物体轨迹。也有提供投石机几何尺寸以及其物理性质的资料
9 FEMTO轴承资料集 轴承的加速寿命测试试验,由法国贝桑松FEMTO-ST研究所提供[19]
10 随机电池用量资料集 电池依照随机产生的电流波形进行连续的充电放电。在固定时间的随机使用后会进行标准的充电/放电程序,以找到有关电池健康状况的参考基准
11 电容器电应力资料集 电容器在电压10V、12V及14V下的电应力。资料集包括电化学阻抗谱(EIS)以及充电/放电信号的资料

参考资料

  1. ^ 1.0 1.1 The Rise of Industrial Big Data (PDF). GE Intelligent Platforms. 2012 [2017-12-21]. (原始内容 (PDF)存档于2015-12-08). 
  2. ^ 2.0 2.1 Millman, Nick. Big data to unlock value from the industrial internet of things. Computer Weekly. 2015-02 [2017-05-19]. (原始内容存档于2021-01-16). 
  3. ^ Kelly, Jeff. The Industrial Internet and Big Data Analytics: Opportunities and Challenges. Wikibon. [2017-12-21]. (原始内容存档于2021-01-20). 
  4. ^ Laney, Douglas. The Importance of 'Big Data': A Definition. Gartner. 
  5. ^ Villanova University. What is Big Data?. [2018-01-05]. (原始内容存档于2021-01-20). 
  6. ^ 6.0 6.1 6.2 6.3 6.4 Lee, Jay. Industrial Big Data. China: Mechanical Industry Press. 2015. ISBN 978-7-111-50624-9. 
  7. ^ 7.0 7.1 7.2 7.3 Lee, Jay. Keynote Presentation: Recent Advances and Transformation Direction of PHM. Roadmapping Workshop on Measurement Science for Prognostics and Health Management of Smart Manufacturing Systems Agenda (NIST). November 19, 2014. 
  8. ^ Lee, Jay; Kao, Hung-An; Yang, Shanhu. Service innovation and smart analytics for industry 4.0 and big data environment. Procedia CIRP: 3–8. ISSN 2212-8271. 
  9. ^ Lee, Jay; Bagheri, Behrad; Kao, Hung-An. Recent Advances and Trends of Cyber-Physical Systems and Big Data Analytics in Industrial Informatics. Int. Conference on Industrial Informatics (INDIN) 2014. 2014. 
  10. ^ 10.0 10.1 10.2 Courtney, Brian. Industrial big data analytics: The present and future. InTech Magazine. [2018-02-05]. (原始内容存档于2019-05-19). 
  11. ^ ABB. Big Data and decision-making in industrial plants. [2018-02-12]. (原始内容存档于2018-04-15). 
  12. ^ Williams, Jenny Weisenberg; Aggour, Kareem; Interrante, John; McHugh, Justin; Pool, Eric. Bridging high velocity and high volume industrial big data through distributed in-memory storage & analytics. Big Data (Big Data), 2014 IEEE International Conference on. 2014: 932–941. 
  13. ^ National Science Foundation. Program Solicitation: Cyber-Physical Systems (CPS). [2018-02-12]. (原始内容存档于2018-04-15). 
  14. ^ Lee, Jay; Bagheri, Behrad; Kao, Hung-An. A cyber-physical systems architecture for industry 4.0-based manufacturing systems. Manufacturing Letters. 2015, 3: 18–23. 
  15. ^ Finnegan, Matthew. Boeing 787s to create half a terabyte of data per flight, says Virgin Atlantic. ComputerworldUK. March 6, 2013 [2018-03-04]. (原始内容存档于2016-08-24). 
  16. ^ NASA Prognostics Center of Excellence (PCoE). PCoE Datasets. National Aeronautics and Space Administration. (原始内容存档于2014年2月27日). 
  17. ^ Best Lab at UC Berkeley. [2021-09-24]. (原始内容存档于2007-06-26). 
  18. ^ NSF I/UCRC for Intelligent Maintenance Systems (IMS). [2021-09-24]. (原始内容存档于2021-01-17). 
  19. ^ FEMTO-ST Institute. [2018-03-09]. (原始内容存档于2020-12-05).