历史数据挖掘
发布时间:2015/2/24 19:56:15 访问次数:692
传感器网络是一个以数据为中心的网络,传感器M27C1024-12F1从监测环境收集到的大量数据可能存在某种内在联系。数据挖掘技术可用于从大量的数据中挖掘出人们感兴趣的数据关联规则或传感器节点间的关系。
文献[29]提出了一种用于挖掘传感器节点行为模式的算法,其主要目的是确定传感器节点行为模式的关联规则。这些规则可以用于资源管理或用于弥补网络通信的不利因素,以便改进网络服务质量。文中给出了传感器节点行为模式关联规则的形式化定义;提出了一种针对数据挖掘处理而收集数据的压缩表示结构——位置词典树( Positional Lexico-graphic Tree),该结构有助于快速而有效地挖掘节点的行为模式;谩计了一个挖掘行为模式的分布式数据挖掘算法。
传感器网络的数据大多表现为一种数据流的形式,频度序列挖掘( Frequentsequential mining)可用于挖掘数据流的频度序列模式(frequent sequential patterns)。文献[30]中提出了一种在线挖掘算法-SSM(Sequential Stream Mining)来挖掘以将这样的时间序列进行压缩[33]。
Eamonn Keogh等提出了分段常量近似(Piecewise Constant Approximation,PCA)的压缩时间序列技术[34]。PCA技术的主要思想是将时间序列表示为多个分段,每个分段由两个元组组成:数值常量和结束时间。其值分别为该分段对应的子序列中所有数据的均值和最后一个数据的采样时间。
给定一个时间序列So,”’=S[1:Ⅳ]={研1],S[2],…,SM},PCA产生的分段压缩序列可以表示为
PCA(S)={<vi,ri>,…,<V/,r/>,…,<vM,rM》 V1 =0
式中,Vi表示第f个分段中所有数值的均值,可以表示为
vf_AVG(s [rf-1+l],J[r/- 1+2],…,s[n])
式中,ri为第f个分段结束的时间。此处,不需要记录每个分段的长度,只需要记录每个分段的结束时间,即可得到该分段的长度为,i—n 1。
基于PCA技术,Losif Lazaridis等[35]提出了Poor Man mean压缩方法(PMCmean)。PMC—mean是一种压缩时间序列的在线方法,该方法的思想是将时间序列中每个分段肉所有数据均值作为该分段的常量。每采集到一个周期数据,计算当前压缩的时间序列内所有数据的均值,若该均值与当前时间序列的最大值或最小值的差值超过阈值s时,即停止采样,将满足条件的时间序列压缩为一个分段。
传感器网络是一个以数据为中心的网络,传感器M27C1024-12F1从监测环境收集到的大量数据可能存在某种内在联系。数据挖掘技术可用于从大量的数据中挖掘出人们感兴趣的数据关联规则或传感器节点间的关系。
文献[29]提出了一种用于挖掘传感器节点行为模式的算法,其主要目的是确定传感器节点行为模式的关联规则。这些规则可以用于资源管理或用于弥补网络通信的不利因素,以便改进网络服务质量。文中给出了传感器节点行为模式关联规则的形式化定义;提出了一种针对数据挖掘处理而收集数据的压缩表示结构——位置词典树( Positional Lexico-graphic Tree),该结构有助于快速而有效地挖掘节点的行为模式;谩计了一个挖掘行为模式的分布式数据挖掘算法。
传感器网络的数据大多表现为一种数据流的形式,频度序列挖掘( Frequentsequential mining)可用于挖掘数据流的频度序列模式(frequent sequential patterns)。文献[30]中提出了一种在线挖掘算法-SSM(Sequential Stream Mining)来挖掘以将这样的时间序列进行压缩[33]。
Eamonn Keogh等提出了分段常量近似(Piecewise Constant Approximation,PCA)的压缩时间序列技术[34]。PCA技术的主要思想是将时间序列表示为多个分段,每个分段由两个元组组成:数值常量和结束时间。其值分别为该分段对应的子序列中所有数据的均值和最后一个数据的采样时间。
给定一个时间序列So,”’=S[1:Ⅳ]={研1],S[2],…,SM},PCA产生的分段压缩序列可以表示为
PCA(S)={<vi,ri>,…,<V/,r/>,…,<vM,rM》 V1 =0
式中,Vi表示第f个分段中所有数值的均值,可以表示为
vf_AVG(s [rf-1+l],J[r/- 1+2],…,s[n])
式中,ri为第f个分段结束的时间。此处,不需要记录每个分段的长度,只需要记录每个分段的结束时间,即可得到该分段的长度为,i—n 1。
基于PCA技术,Losif Lazaridis等[35]提出了Poor Man mean压缩方法(PMCmean)。PMC—mean是一种压缩时间序列的在线方法,该方法的思想是将时间序列中每个分段肉所有数据均值作为该分段的常量。每采集到一个周期数据,计算当前压缩的时间序列内所有数据的均值,若该均值与当前时间序列的最大值或最小值的差值超过阈值s时,即停止采样,将满足条件的时间序列压缩为一个分段。
上一篇:基于数据相关性压缩方法