2.3 大数据
2.3.1 大数据的概念
大数据是指存储在各种介质中的大规模的各种形态的数据,对各种存储介质中的海量信息进行获取、存储、管理、分析、控制而得到的数据便是大数据。IBM提出了大数据的5V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。[5]大数据的大不止体现在容量方面,更体现在其价值方面,相较于数据量的大小,数据的多元性和实时性对大数据的价值有着更加直接的影响。大数据技术的意义并不在于数据本身,而在于将数据转变为信息,再从信息中获取知识,从而可以更好地进行决策。
基于大数据的概念,工业和信息化部2019年发布的《工业大数据白皮书(2019版)》中提出了工业大数据的定义:工业大数据是指在工业领域中,围绕典型智能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所产生的各类数据及相关技术和应用的总称[6]。通过工业大数据可以对智能制造各阶段的情况进行真实描述,从而更好地了解、分析和优化制造过程。因此,工业大数据是智能制造的智慧来源。
2.3.2 大数据的主要实现方式
大数据的架构在逻辑上主要分为四层,即数据采集层、数据存储和管理层、数据分析层及数据应用层,如图2-6所示。
1.数据采集层
数据采集层是大数据架构中非常重要也是最基础的层次。对于大数据系统,数据来源主要可分为以下几类:①由各种工业传感器采集的数据,例如机器设备的运行状态、环境指标、操作人的操作行为等,这部分数据的特点是每条数据内容很少,但是频率极高;②文档数据,包括制造图纸、设计图纸、仿真数据等;
③由其他设备传输得到的数据,例如现场拍摄的视频、图片信息,声音及语音信息,遥感遥测信息等;④操作人员手工录入的信息。以上信息构成了数据采集的来源。
2.数据存储和管理层
图2-6 大数据的架构图
数据采集结束后,需要进行数据存储和管理。通常对采集到的数据先进行一定程度的处理,例如,视频流信息需要解码,语音信息需要识别,各类工业协议需要解析。识别处理后对数据进行规范、清洗,之后便可以对数据进行存储和管理。存储过程中首先需要对数据进行分类,典型的存储技术包括时序数据存储技术、非结构化数据存储技术、结构化数据存储技术等。
3.数据分析层
数据分析层包含基础大数据计算技术和大数据分析服务功能。并行计算技术、流计算技术和数据科学计算技术属于基础大数据计算技术。在基础大数据计算技术的基础上,构建大数据分析服务功能,其中包括分析模型管理、分析作业管理、分析服务发布等。通过对数据的建模、计算和分析将数据转变为信息,从信息中获取知识。
4.数据应用层
数据应用层包括数据可视化技术和数据应用开发技术。通过数据可视化将分析处理后的多来源、多层次、多维度的数据以直观简洁的方式展示给用户,使用户更容易理解,从而可以更好地做出决策。数据可视化包括很多方式,如报表、二维地图、三维地图等。数据应用开发技术主要指利用移动应用开发工具,进行大数据应用开发,便于实现预测与决策。
2.3.3 大数据在智能制造领域的应用
高圣公司是一家主要生产带锯机床的公司,延长带锯寿命是带锯机床使用过程中的核心问题,也是降低生产成本的关键。本节以高圣公司为例[7],给出大数据在智能制造领域的应用实例。
该公司首先利用传感器收集切削加工过程中的数据,开发了带锯寿命衰退分析和预测算法模型。在加工过程中,对加工产生的数据进行实时分析,对当前的工件和工况信息进行识别,通过健康特征提取和归一化处理将当前的健康特征反映到特征地图上,实现带锯磨损状态的量化。分析处理后的数据信息被存储到数据库中建立带锯的生命信息档案,大量带锯的生命信息档案形成一个庞大的数据库,通过大数据分析方法对其进行分析,建立不同健康状态下的最佳工艺参数模型,延长带锯的使用寿命。同时通过可视化技术,将带锯健康信息展示给用户,而当需要更换带锯时对用户进行提醒,并自动补充带锯订单,保证了生产质量与效率。