Title高效的稀有序列模式挖掘方法
Authors雷雨
李曼
胡卫松
宋国杰
谢昆青
Affiliation北京大学 机器感知与智能教育部重点实验室
北京100871
NEC中国研究院
北京100084
Keywords稀有序列模式
模式挖掘
逐层查找
二分查找
Issue Date 1
Publisher计算机科学与探索
Citation计算机科学与探索.0.
Abstract序列模式挖掘是数据挖掘领域的一个经典研究问题,目前的研究主要关注于频繁序列模式的挖掘。但是不频繁的序列模式,即“稀有序列模式(Rare Sequential Pattern, RSP)”也可能蕴含着一些不寻常的规律,具有更高的挖掘价值。因此,给出了稀有序列模式挖掘的定义,并且提出了两种逐层挖掘稀有序列模式完全集的方法;为克服挖掘稀有序列模式全集时产生的组合爆炸问题,提出了一种高效的基于二分查找的算法来挖掘“最小稀有序列模式(Minimal Rare Sequential Pattern, MRSP)”全集,它包含了稀有序列模式全集的完整信息。通过实验验证了提出的算法可以有效地挖掘稀有序列模式。
URIhttp://hdl.handle.net/20.500.11897/174123
ISSN1673-9418
Appears in Collections:未确定

Files in This Work
Adobe PDF


License: See PKU IR operational policies.