当前位置: 首页 | 研究生教育 | 正文

经济与金融学院商道论坛第63讲——Association rule mining in large transaction data sets

作者：经济与金融学院 发布时间：2016-12-30 浏览次数:

商道论坛63讲

经济与金融学院商道论坛第63讲于12月27日晚上19：10在经管807举行，此次主讲嘉宾是来自澳大利亚墨尔本大学数学与统计学院的钱国骐博士，报告会的主题是“Association rule mining in large transaction data sets”，即“大交易数据集下的关联规则挖掘”，参加报告会的主要是经济与金融学院2016级博士生、研究生以及学院教师。

报告会开始之前，主持本次报告会的陈鹏军老师给大家简单介绍了钱博士的基本情况，大家对于钱博士的到来表示热烈的欢迎。随后，报告会正式开始。

首先，钱博士通过一个关于超级市场食品交易的例子引出“关联规则挖掘”这一主题，使得我们对于这一主题的研究有初步的了解。然后，钱博士介绍了“关联规则挖掘”方面的相关数学知识，主要的一些数学符号的定义，包括item space(项空间)、item set（项子集），support（支持度），confident（可信度）等。接下来，钱博士也指出当交易数据集非常大的时候，计算机也难以实行计算时，必须采用由限制条件的Apriori算法。Apriori算法是一种挖掘关联规则的频繁项集算法，其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。Apriori算法具体做法是：首先找出所有的频集，这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则，这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则，产生只包含集合的项的所有规则，其中每一条规则的右部只有一项，这里采用的是中规则的定义。一旦这些规则被生成，那么只有那些大于用户给定的最小可信度的规则才被留下来。同时，钱博士也指出要注意的两个问题，一是如果限制条件过紧可能导致empty solution（没有结果）；二是各种交易数据形式要通过二进制变量表示才能进行算法计算。最后，为了使我们对于“关联规则”的研究有更深的了解，钱博士通过自己应用“关联规则挖掘”研究乳腺癌的例子向我们很好的展示了基于Apriori算法的“关联规则挖掘”的重要性与贡献性。

报告会结束后，老师与同学们就一些问题和钱博士进行讨论与互动，钱博士都一一做出了回答。钱博士的报告非常精彩，老师和同学们从这次报告会中获益良多。

钱博士在做演讲

钱博士在和师生交流互动

| 打印 | 关闭 |

相关链接
华大首页华大60周年校庆网华大图书馆中国互联网中心深度电商网 CEIC全球经济数据库 RESSET宏观数据库电商学习论坛华大教务处学生管理系统 RESSET高频数据库海丝文化电商虚拟仿真系统		华侨大学经济与金融学院版权所有 CopyRight © 2012 All Rights 地址：福建泉州华侨大学经管楼5楼邮编：362021 电话：0595-22692581