数据挖掘实验报告(二)关联规则挖掘
姓名:李圣杰
班级:计算机1304
学号:02
一、实验目的
1. 1.掌握关联规则挖掘的Apriori算法;
2.将Apriori算法用具体的编程语言实现。
二、实验设备
PC一台,dev-c++
三、实验内容
根据下列的Apriori算法进行编程:
四、实验步骤
1.编制程序。
2.调试程序。
可采用下面的数据库D作为原始数据调试程序,得到的候选1项集、2项集、3项集分别为C1、C2、C3,得到的频繁1项集、2项集、3项集分别为L1、L2、L3。
代码
#include <>
#include<>
#define D 4 //事务的个数
#define MinSupCount 2 //最小事务支持度数
void main()
{
char a[4][5]={
{'A','C','D'},
{'B','C','E'},
{'A','B','C','E'},
{'B','E'}
};
char
b[20],d[100],t,b2[100][10],b21[100][10];
int
i,j,k,x=0,flag=1,c[20]={0},x1=0,i1=0,j1,counter =0,c1[100]={0},flag1=1,j2,u=0,c2[100]={0},n[2 0],v=1;
int count[100],temp;
for(i=0;i<D;i++)
{
for(j=0;a[i][j]!='\0';j++)
{
//用来判断之前保存的是否和a[i][j]一样,不一样就保存,一样就不保存
for(k=0;k<x;k++)
{
if(b[k]!=a[i][j]) ;
else
{
flag=0;break;
}
}
//用来判断是否相等
if(flag==1)
{
b[x]=a[i][j];
x++;
}
else flag=1;
}
}
//计算筛选出的元素的支持度计数
for(i=0;i<D;i++)
{
for(j=0;a[i][j]!='\0';j++)
{
for(k=0;k<x;k++)
{
if(a[i][j]==b[k])
{
c[k]++;break;
}
}
}
}
//对选出的项集进行筛选,选出支持度计数大于等于2的,并且保存到d[x1]数组中
for(k=0;k<x;k++)
{
if(c[k]>=MinSupCount)
{
d[x1]=b[k];
count[x1]=c[k];
x1++;
}
}
//对选出的项集中的元素进行排序
for(i=0;i<x1-1;i++)
{
for(j=0;j<x1-i-1;j++)
{
if(d[j]>d[j+1])
{
t=d[j];d[j]=d[j+1];d[j+1]=t;
temp=count[j];count[j]=count[j+1];count [j+1]=temp;
}
}
}
//打印出L1
printf("L1 elements are:\n");
for(i=0;i<x1;i++)
{
printf("{%c} = %d \n",d[i],count[i]);
}
//计算每一行的元素个数,并且保存到n[]数组中
for(i=0;i<D;i++)
{
for(j=0;a[i][j]!='\0';j++);
n[i]=j;
}
//对a[][]数组的每一行进行排序
for(i=0;i<D;i++)
{
for(j=0;j<n[i]-1;j++)
{
for(k=0;k<n[i]-j-1;k++)
{
if(a[i][k]>a[i][k+1])
{
t=a[i][k];
a[i][k]=a[i][k+1];
a[i][k+1]=t;
}
}
}
}
//把L1中的每一个元素都放在b2[i][0]中
j1=x1;
for(i=0;i<j1;i++)
{
b2[i][0]=d[i];
}
//把L1中的元素进行组合,K=2开始,表示x1个元素选K个元素的组合
for(k=2;b2[0][0]!='\0';k++)
{ //u是用来计数组合总数的
u=0;v=1;//v 是用来在进行输出各种组合的标识数v=1 说明正在进行输出
for(i=0;i<100;i++)
{
c2[i]=0;
}
for(i=0;i<j1;i++)
{
for(i1=i+1;i1<j1;i1++)
{
for(j=0;j<k-2;j++)
{
if(b2[i][j]!=b2[i1][j])
{
flag1=0;break;
}
}
//进行组合的部分
if(flag1==1&&b2[i][k-2]!=b2[i1][k-2])
{
for(j2=0;j2<k-1;j2++)
{
b21[u][j2]=b2[i][j2];
}
b21[u][k-1]=b2[i1][k-2];
u++;
}
flag1=1;
}
}
counter=0;
for(i=0;i<D;i++) //a数组有5行元素
{
for(i1=0;i1<u;i1++) // 代表x1个元素选K个元素的所有组合总数
{
for(j1=0;j1<k;j1++) //K 代表一个组合中的元素个数
{
for(j=0;a[i][j]!='\0';j++) //逐个比较每一行的元素
{
if(a[i][j]==b21[i1][j1]) counter++;
}
}
if(counter==k) c2[i1]++; //把每种组合数记录在c2数组中
counter=0;
}
}
j1=0;temp=0;//这里的temp 是用来分行
//对u种情况进行选择,选出支持度计数大于2的*/
for(i=0;i<u;i++)
{
if(c2[i]>=MinSupCount)
{
if(v==1)
{
printf("L%d elements are:\n",k);
v=0;
}
printf("{");
for(j=0;j<k;j++) //输出每种组合k 个元素
{
b2[j1][j]=b21[i][j];
printf("%c,",b2[j1][j]);
}
j1++;
printf("\b}");
printf(" = %d \n",c2[i]);
temp++;
}
}
b2[j1][0]='\0';
}
}
五、结果截图。