当前位置:文档之家› 网络流量在线分析系统的设计与实现

网络流量在线分析系统的设计与实现

综合实训报告题目:网络流量在线分析系统的设计与实现信息学院计算机科学系目录一、实训目的 (3)二、实训内容 (3)三、主要设备及环境 (3)四、设计与步骤 (4)五、过程与调试 (22)六、整理与小结 (23)七、参考文献 (24)八、附录 (25)一、实训目的设计并实现一个网络流量的分析系统。

该系统具有以下功能:(1)实时抓取网络数据。

(2)网络协议分析与显示。

(3)将网络数据包聚合成数据流,以源IP、目的IP、源端口、目的端口及协议等五元组的形式存储。

(4)计算并显示固定时间间隔内网络连接(双向流)的统计量(如上行与下行的数据包数目,上行与下行的数据量大小等)。

在这些统计数据的基础上分析不同网络应用的流量特征。

二、实训内容(1)能够实时抓取网络中的数据包。

并实时显示在程序界面上。

用户可自定义过滤条件以抓取所需要的数据包。

(2)分析各个网络协议格式,能够显示各协议字段的实际意义。

例如,能够通过该程序反映TCP三次握手的实现过程。

(3)采用Hash链表的形式将网络数据以连接(双向流)的形式存储。

(4)计算并显示固定时间间隔内网络连接(双向流)的统计量(如上行与下行的数据包数目,上行与下行的数据量大小等)。

例如,抓取一段时间(如30分钟)的网络流量,将该段时间以固定时长(如1分钟)为单位分成若干个时间片,计算网络连接在每一个时间片内的相关统计量。

并在上述统计数据的基础上分析不同应用如WEB、DNS、在线视频等服务的流量特征。

注意,可根据实际的流量分析需要自己定义相关的统计量。

三、主要设备及环境硬件设备:(1)台式计算机或笔记本计算机(含网络适配器)软件设备:(2)Windows操作系统(3)网络数据包捕获函数包,Windows平台为winpcap(4)编程语言选用C/C++。

(5)编程环境为codeblocks四、设计与步骤(1)设计代码检索机器所连接的所有网络适配器,并在屏幕中显示适配器的名称和详细信息,用户可以输入适配器编号选择指定的适配器用来捕获包,如果没有找到适配器,提示用户检查WinPcap是否安装,代码与结果显示如下:/* set the source */if (pcap_createsrcstr(source, PCAP_SRC_IFLOCAL, NULL, NULL, NULL, errbuf) == -1) {printf("%s\n", errbuf);exit(-1);}printf("source: %s", source);/* find all devices */if (pcap_findalldevs_ex(source, NULL, &alldevs, errbuf) == -1) {printf("%s\n", errbuf);exit(-1);}/* choose one devices */d = alldevs;while (d != NULL) {printf("%s, %s\n", d->name, d->description);d = d->next;}printf("choose a device[number between 1 to 4]:");scanf("%d", &i);d = alldevs;while (--i)d = d->next;printf("\n----------------------------------------------\n");printf("selected device: %s\n", d->name);实验结果显示如下:(2)选择指定适配器后,调用ifprint();函数计算本机的IP地址、掩码、广播地址、目标地址等信息,并用声明static char b;用来记录本机IP地址,为接下来查找Hash表判断流量包的流向做准备:void ifprint(pcap_if_t *d){pcap_addr_t *a;/* 名称 *///printf("%s\n",d->name);/* 描述 */if (d->description)printf("\tDescription: %s\n",d->description);/* 回环地址 */printf("\tLoopback: %s\n",(d->flags &PCAP_IF_LOOPBACK)?"yes":"no");/* IP 地址 */for(a=d->addresses;a;a=a->next){printf("\tAddress Family: #%d\n",a->addr->sa_family);switch(a->addr->sa_family){case AF_INET:printf("\tAddress Family Name: AF_INET\n");if (a->addr)/* Y- IP 地址 */{printf("\tAddress: %s\n",iptos(((struct sockaddr_in *)a->addr)->sin_addr.s_addr));b = iptos(((struct sockaddr_in *)a->addr)->sin_addr.s_addr);}if (a->netmask)/* Y- 掩码 */printf("\tNetmask: %s\n",iptos(((struct sockaddr_in *)a->netmask)->sin_addr.s_addr));if (a->broadaddr)/* Y- 广播地址 */printf("\tBroadcast Address: %s\n",iptos(((struct sockaddr_in *)a->broadaddr)->sin_addr.s_addr));if (a->dstaddr)/* Y - 目标地址 */printf("\tDestination Address: %s\n",iptos(((struct sockaddr_in *)a->dstaddr)->sin_addr.s_addr));break;default:/* 未知 */printf("\tAddress Family Name: Unknown\n");break;}}printf("\n");}/* 来自 tcptracert, 把数字IP地址转换为点格式 */#define IPTOSBUFFERS 12char *iptos(u_long in){static char output[IPTOSBUFFERS][3*4+3+1];static short which;u_char *p;p = (u_char *)&in;which = (which + 1 == IPTOSBUFFERS ? 0 : which + 1);sprintf(output[which], "%d.%d.%d.%d", p[0], p[1], p[2], p[3]);return output[which];}结果显示如下:(3)接收到用户输入的适配器编号,打开指定适配器:/* open one device */cap_ins_des = pcap_open(d->name, 65536,PCAP_OPENFLAG_PROMISCUOUS, 1000, NULL, errbuf);if (cap_ins_des == NULL) {printf("%s\n", errbuf);pcap_freealldevs(alldevs);exit(-1);}(4)打开指定文件存储捕获的数据包:/* open a file to dump data */dumpfp = pcap_dump_open(cap_ins_des, "traffic1");if( dumpfp == NULL) {printf("Error on opening output file\n");exit(-1);}(5)在main()函数开始做一个声明,方便用户自由选择过滤规则,声明如下:int switchnum;char t1[] = "ip";//ip过滤规则char t2[] = "ip and tcp";//tcp过滤规则char t3[] = "ip and udp";//udp过滤规则char t4[] = "";//mac帧过滤char packet_filter[100]; // the filter设置过滤规则时使用swich()语句判断用户输入的编号,是对应的编号与对应的过滤规则相一致:/* open a file to dump data */dumpfp = pcap_dump_open(cap_ins_des, "traffic1");if( dumpfp == NULL) {printf("Error on opening output file\n");exit(-1);}/* get the netmask, used at compiling the filter */if (d->addresses != NULL)netmask = ((struct sockaddr_in*)(d->addresses->netmask))->sin_addr.S_un.S_addr; /*@#$%^&*!*/ elsenetmask = 0xffffff; /* 255.25.255.0 */// netmask = 0;/*选择过滤规则*/printf("\n----------------------------------------------\n"); printf("%d:%s\n",1, "IP协议");printf("%d:%s\n",2, "IP和TCP协议");printf("%d:%s\n",3, "IP和UDP协议");printf("%d:%s\n",4, "MAC帧");printf("请选择要获取的协议类型):");scanf("%d", &switchnum);switch (switchnum){case 1:strcpy(packet_filter,t1);break;case 2:strcpy(packet_filter,t2);break;case 3:strcpy(packet_filter,t3);break;case 4:strcpy(packet_filter,t4);break;default:printf("error\n");}/* compile the filter */if (pcap_compile(cap_ins_des, &fcode, packet_filter, 1, netmask) < 0) {printf("Error\n");pcap_freealldevs(alldevs);exit(-1);}结果显示如下:(6)用户可以根据提示设置抓包的时间长短,该功能的实现依靠创建一个线程:pthread_t ptClock;argument args;args.handle = cap_ins_des;int argv_time = atoi(argv[1]);int timeLen;printf("\n设置抓包时长:");scanf("%d",&timeLen);printf("设置抓包时长为 %d s",timeLen);args.timeLen = (argv_time > 0) ? argv_time : timeLen;//int argv_time = 2;//args.timeLen = argv_time;//printf("抓取时长:%d s\n", args.timeLen);if(pthread_create(&ptClock, NULL, thread_clock, &args)){printf("pthread_create(): Error!\n");return -1;}void *thread_clock(void *argv){pcap_t *handle = ((argument*)argv)->handle;int timeLen = ((argument*)argv)->timeLen; // set time// printf("%d",timeLen);Sleep(timeLen*1000);pcap_breakloop(handle);}结果显示如下:(7)抓包时调用函数pcap_loop()函数调用cb_getPacket()函数,实现在线程内的抓包,Sleep函数一旦结束,通过pcap_breakloop()退出抓包:pcap_loop(cap_ins_des, -1, cb_getPacket, (u_char*)dumpfp);void cb_getPacket(u_char *dumpfile, const struct pcap_pkthdr *pkthdr, const u_char *packet){// ip_header *seg_ip = (ip_header*)(package + ETHER_LEN);pcap_dump(dumpfile, pkthdr, packet);ethernet_protocol_packet_callback(dumpfile,pkthdr,packet);}(8)设置完成抓包时长后,系统开始进行抓包,一旦抓包结束,调用pcap_close()关闭会话并释放适配器列表:pcap_close(cap_ins_des);pcap_freealldevs(allAdapters);//释放适配器列表(9)捕获结束后将捕获的数据包存入traffic1.data文件中,再将文件打开进行分析,打开文件之前使用pcap_createsrcstr函数指明文件位置为本机文件,文件名为“traffic1.data”,在调用pcap_open()打开捕获文件:pcap_t *fp;//文件指针//pcap_createsrcstr指明打开文件的地方:本地文件if (pcap_createsrcstr(source,/*源字符串*/PCAP_SRC_FILE,/*本机文件*/NULL,/*远程主机*/NULL,/*远程主机端口*/"traffic1",/*文件名*/errbuf/*错误缓冲区*/) != 0){fprintf(stderr, "\nError in create sourcestring:%s\n",errbuf);return -1;}//打开捕获文件if ((fp = pcap_open(source,/*设备名*/65536,/*要捕捉的数据包的部分,65535保证能捕获到不同数据链路层上的每个数据包的全部内容*/PCAP_OPENFLAG_PROMISCUOUS, // 混杂模式1000, // 读取超时时间NULL, // 远程机器验证errbuf // 错误缓冲池)) == NULL){fprintf(stderr, "\nCan not open the file %s.\n", source);return -1;}(10)打开文件开始对数据包进行分析,通过timeval记录当前时间和上一次采样时间,通过计算可以求出延迟时间,根据数据包的大小,进行字节转换,求出采样时每秒的比特数以及每秒的数据包数量:struct timeval *old_ts = (struct timeval *)argument;u_int delay;LARGE_INTEGER Bps,Pps;struct tm *ltime;char timestr[16];time_t local_tv_sec;//以毫秒计算上一次采样的延迟时间//这个值通过采样到的时间戳获得delay=(packet_header->_sec - old_ts->tv_sec) * 1000000 - old_ts->tv_usec + packet_header->_usec;//获取每秒的比特数b/s//Bps.QuadPart=(((*(LONGLONG*)(packet_content + 8)) * 8 * 1000000) / (delay));/* ^ ^| || || |将字节转换成比特 -- | |延时是以毫秒表示的 --| */u_int m = (*(LONGLONG*)(packet_content + 8)) * 8 * 1000000;u_int n = ((*(LONGLONG*)(packet_content)) * 1000000);Bps.QuadPart = m/delay;Pps.QuadPart = n/delay;//printf("%I64u\n",m);// printf("%I64u\n",delay);//得到每秒的数据包数量// Pps.QuadPart=(((*(LONGLONG*)(packet_content)) * 1000000) / (delay));// 将时间戳转化为可识别的格式/*local_tv_sec = packet_header->_sec;ltime=localtime(&local_tv_sec);strftime( timestr, sizeof timestr, "%H:%M:%S", ltime);*///打印时间戳//printf("%s ", timestr);//打印采样结果//printf("%I64u\n",delay);printf("\n**************************************************\n每秒的比特数:");printf("BPS=%I64u\n", Bps.QuadPart);printf("每秒的数据包数量:");printf("PPS=%I64u\n", Pps.QuadPart);//存储当前的时间戳old_ts->tv_sec=packet_header->_sec;old_ts->tv_usec=packet_header->_usec;结果显示如下:(11)通过捕获的文件,对抓取的每个数据包的各层的首部进行解析,并将解析结果进行显示①首先对以太网协议进行解析:printf("捕获第%d个网络数据包\n",packet_number);printf("捕获时间:");printf("%s",ctime((consttime_t*)&packet_header->_sec));printf("数据包长度:");printf("%d\n",packet_header->len);printf("\n--------------以太网协议--------------\n");ethernet_protocol=(structether_header*)packet_content;//获得数据包内容printf("以太网类型:");ethernet_type=ntohs(ethernet_protocol->ether_type);//获得以太网类型printf("%04x\n",ethernet_type);switch (ethernet_type){case 0x0800: printf("上层协议是IP协议\n");break;case 0x0806: printf("上层协议是ARP协议\n");break;case 0x8035: printf("上层协议是RARP协议\n");break;case 0x814C: printf("上层协议是简单网络管理协议SNMP\n"); break;case 0x8137: printf("上层协议是因特网包交换(IPX:Internet Packet Exchange)\n"); break;case 0x86DD: printf("上层协议是IPv6协议\n"); break;case 0x880B: printf("上层协议是点对点协议(PPP:Point-to-Point Protocol)\n"); break;default:break;}printf("MAC帧源地址:");mac_string=ethernet_protocol->ether_shost;printf("%02x:%02x:%02x:%02x:%02x:%02x\n",*mac_string,*(mac_stri ng+1),*(mac_string+2),*(mac_string+3),*(mac_string+4),*(mac_str ing+5));printf("MAC帧目的地址:");mac_string=ethernet_protocol->ether_dhost;printf("%02x:%02x:%02x:%02x:%02x:%02x\n",*mac_string,*(mac_stri ng+1),*(mac_string+2),*(mac_string+3),*(mac_string+4),*(mac_str ing+5));if(ethernet_type==0x0800)//继续分析IP协议{ip_protool_packet_callback(argument,packet_header,packet_content + sizeof(structether_header));}printf("----------------------------------------------\n\n");packet_number++;结果显示如下:②对IP协议进行解析:struct tcp_header *tcp_protocol;// u_int offset;//u_char tos;u_int16_t checksum;tcp_protocol = (struct tcp_header *)packet_content;checksum = ntohs(tcp_protocol->check);// tos = tcp_protocol->tcp_tos;//offset = ntohs(tcp_protocol->tcp_off);printf("\n----------------TCP协议-----------------\n");printf(" 源端口:%d",tcp_protocol->source_port);printf(" 目的端口:%d\n", tcp_protocol->dest_port);printf(" SEQ:%d\n", ntohs(tcp_protocol->seq));printf(" ACK_SEQ:%d\n",ntohs(tcp_protocol->ack_seq));printf(" fin标志位:%d\n",tcp_protocol->fin);printf(" syn标志位:%d\n",tcp_protocol->syn);printf(" rst标志位:%d\n",tcp_protocol->rst);printf(" psh标志位:%d\n",tcp_protocol->psh);printf(" ack标志位:%d\n",tcp_protocol->ack);printf(" urg标志位:%d\n",tcp_protocol->urg);printf(" ece标志位:%d\n",tcp_protocol->ece);printf(" cwr标志位:%d\n",tcp_protocol->cwr);printf("check:%d\n",checksum);printf("滑动窗口:%d\n",tcp_protocol->window);printf("紧急字段:%d\n",tcp_protocol->urg_ptr);结果显示如下:③ 对UDP协议进行解析struct udp_header* udp_protocol;//u_int header_length = 0;u_int16_t checksum;udp_protocol = (struct udp_header *)packet_content;checksum = ntohs(udp_protocol->check);/* u_int16_t source_port; //源地址端口u_int16_t dest_port; //目的地址端口u_int16_t len; //UDP长度u_int16_t check; //UDP校验和*/printf("\n----------------UDP协议----------------\n"); printf("源端口:%d", udp_protocol->source_port);printf(" 目的端口:%d\n", udp_protocol->dest_port); printf("用户数据包长度:%d\n", udp_protocol->len);printf("校验和:%d\n", checksum);结果显示如下:④对TCP协议进行解析,其中三次握手的过程可以通过syn与ack标志位来实现:/* 1、syn=12、syn=1,ack=13、ack=1*/struct tcp_header *tcp_protocol;// u_int offset;//u_char tos;u_int16_t checksum;tcp_protocol = (struct tcp_header *)packet_content;checksum = ntohs(tcp_protocol->check);// tos = tcp_protocol->tcp_tos;//offset = ntohs(tcp_protocol->tcp_off);printf("\n----------------TCP协议-----------------\n");printf(" 源端口:%d",tcp_protocol->source_port);printf(" 目的端口:%d\n", tcp_protocol->dest_port);printf(" SEQ:%d\n", ntohs(tcp_protocol->seq));printf(" ACK_SEQ:%d\n",ntohs(tcp_protocol->ack_seq));printf(" fin标志位:%d\n",tcp_protocol->fin);printf(" syn标志位:%d\n",tcp_protocol->syn);printf(" rst标志位:%d\n",tcp_protocol->rst);printf(" psh标志位:%d\n",tcp_protocol->psh);printf(" ack标志位:%d\n",tcp_protocol->ack);printf(" urg标志位:%d\n",tcp_protocol->urg);printf(" ece标志位:%d\n",tcp_protocol->ece);printf(" cwr标志位:%d\n",tcp_protocol->cwr);printf("check:%d\n",checksum);printf("滑动窗口:%d\n",tcp_protocol->window);printf("紧急字段:%d\n",tcp_protocol->urg_ptr);结果显示如下:(12)建立Hash表对数据包进行分流存储,结点与表声明如下,调用InitHashTable()建立TCP和UDP的哈希表,然后调用Hash()函数利用用除留取余法获取最初的结点位置,通InsertHashTable查表将结点放入正确位置,SerchHashTable()查表返回bool值判断关键结点是否已经在哈希表中:typedef struct Node{struct in_addr ip_source_address;struct in_addr ip_dest_address;u_int16_t source_port;u_int16_t dest_port;u_int32_t sum;struct node *next;}HashNode;typedef struct Table{HashNode *Table;int count;}HashTable;void InitHashTable(HashTable* H){// printf("hahahahahahahahahhahahaah");int i;H -> count = MAXSIZE;H -> Table = ( HashNode* )malloc( ( H->count ) *sizeof( HashNode ) );for(i = 0;i < H->count; i++){// H->Table[i].ip_source_address = NULLKEY;// H->Table[i].ip_dest_address = NULLKEY;H->Table[i].ip_source_address;H->Table[i].ip_dest_address;H->Table[i].source_port = 0;H->Table[i].dest_port = 0;H->Table[i].sum = NULLKEY;H->Table[i].next = NULL;}}int Hash(int key){// printf("%d",key % MAXSIZE);return key % MAXSIZE;}int InsertHashTable(HashTable *H,struct in_addrsource_address,struct in_addr dest_address,u_int16_ts_port,u_int16_t d_port,int key){int addr;addr = Hash(key);if(H->Table[addr].sum != key && H ->Table[addr].sum != NULLKEY){HashNode *hashnode = (HashNode*)malloc(sizeof(HashNode));hashnode->next = H->Table[addr].next;hashnode->ip_source_address = source_address;hashnode->ip_dest_address = dest_address;hashnode->sum = key;hashnode->source_port = s_port;hashnode->dest_port = d_port;H->Table[addr].next = hashnode;addr++;return addr;}else if(H->Table[addr].sum = NULLKEY){H->Table[addr].sum = key;return addr;}}bool SerchHashTable(HashTable *H,struct in_addrsource_address,struct in_addr dest_address,u_int16_ts_port,u_int16_t d_port,int key){int addr;addr = Hash(key);if(H->Table[addr].sum == key &&(inet_ntoa(H->Table[addr].ip_source_address) == inet_ntoa(source_address)) &&(inet_ntoa(H->Table[addr].ip_dest_address) == inet_ntoa(dest_address)) &&(H->Table[addr].source_port == s_port) &&(H->Table[addr].dest_port == d_port)){return true;}HashNode *p = H->Table[addr].next;while(p != NULL){if((p->sum == key) && (inet_ntoa(p->ip_source_address) == inet_ntoa(source_address)) &&(inet_ntoa(p->ip_dest_address) ==inet_ntoa(dest_address)) && (p->source_port == s_port)&&(p->dest_port == d_port)){return true;}elsep->next;}return false;}(13)对基于TCP和UDP协议的两个哈希表进行初始化,通过判断协议号为6或17分别将数据包插入不同的链表中,实现数据包的分流,通过目的地址与本机地址的对比,判断数据包的流向是下载还是上传:HashTable Htcp;//基于TCP协议的哈希链表InitHashTable(&Htcp);//进行初始化HashTable Hudp;//基于UDP协议的哈希链表InitHashTable(&Hudp);//进行初始化while ((res = pcap_next_ex(fp, &header, &pkt_data)) >= 0) {int tcp_s = 0;int udp_s = 0;struct ip_header *ip_protocol;struct ip_header *ip_protocol1;ip_protocol = (struct ip_header *)(pkt_data + 14);struct tcp_header *tcp_protocol;tcp_protocol = (struct tcp_header *)(pkt_data + 34);struct udp_header *udp_protocol;udp_protocol = (struct udp_header *)(pkt_data + 34);if (ip_protocol -> ip_protocol == 17)/*UDP协议*/{int sum = inet_addr(inet_ntoa(ip_protocol->ip_souce_address));udp_s = InsertHashTable(&Hudp, ip_protocol ->ip_souce_address, ip_protocol -> ip_destination_address,udp_protocol -> source_port, udp_protocol -> dest_port, sum);//printf("%d",abs(udp_s));printf("该数据包为UDP协议:\n");printf("源IP地址:%s\n",inet_ntoa(Hudp.Table[abs(udp_s)].source_addr));printf("目的地址:%s\n",inet_ntoa(Hudp.Table[abs(udp_s)].dest_addr));printf("源端口:%d\n",ntohs(Hudp.Table[abs(udp_s)].source_port));printf("目的端口:%d\n",ntohs(Hudp.Table[abs(udp_s)].dest_port));printf("+++++++++++++++++++++++++++++++++++++++++++++\n");}else{if (ip_protocol -> ip_protocol == 6)/*TCP协议*/{printf("该数据包为TCP协议:\n");printf("源IP地址:%s\n",inet_ntoa(Hudp.Table[abs(tcp_s)].source_addr);printf("目的地址:%s\n",inet_ntoa(Hudp.Table[abs(tcp_s)].dest_addr);printf("源端口:%d\n",ntohs(Hudp.Table[abs(tcp_s)].source_port));printf("目的端口:%d\n",ntohs(Hudp.Table[abs(tcp_s)].dest_port));int sum = inet_addr(inet_ntoa(ip_protocol -> ip_souce_address));//printf("%s",b);if(inet_ntoa(ip_protocol -> ip_souce_address) == b){printf("目的地址与本机地址对比,判断为上传数据包\n");}elseprintf("目的地址与本机地址对比,判断为下载数据包\n");tcp_s = InsertHashTable(&Htcp, ip_protocol -> ip_souce_address, ip_protocol -> ip_destination_address, tcp_protocol ->source_port, tcp_protocol -> dest_port, sum);printf("++++++++++++++++++++++++++++++++++++++++++++\n");}}}if (res == -1){printf("文件读取发生错误: %s\n", pcap_geterr(fp));}结果显示如下:五、过程与调试(1)调试过程中最先出现的错误就是头文件的引用,我使用的编译环境是codeblocks,在配置环境时有一个动态链接库没有被添加进去,所以在调试错误期间反复出现头文件的引用错误,耽误了不少时间;(2)创建线程时出现了错误,Sleep函数中的参数是以毫秒为单位的,所以用户输入timeLen的数值后,还需要转换一下时间,否则会因为时间过短而导致程序异常关闭:(3)指针的使用最常出现问题,H声明的是hashtable指针,但是赋值的hashnode 是结点变量,会提示类型不同,但是因为hashtable结构体中也同样引用了node 结构体变量,所以会出现警告信息(4)除留取余法确定关键节点的初始位置时也会出现问题,Hash函数返回的数值有可能会是负值,但是这点是可以不用理会的,使用abs()函数对返回值取绝对值然后再进行插入即可:(5)对于将捕获的数据包保存到文件中再进行流量统计时,有的网站教程中会将接口先设置成统计模式再使用回调函数分析数据,但是我在使用这段代码时会出现所有结果全部显示为0的情况,将其屏蔽后结果正常显示,所以不设置成统计模式并不会影响结果的输出:(6)用下图所示的等式计算每秒的比特数时结果显示会超过16位:如果将公式分段写,结果能够正确显示,修改代码如下图:六、整理与小结本次实训的最终目标是将捕获的数据包保存到文件中,通过构造哈希表对文件中的数据包进行分流处理,实现数据流量的统计。

相关主题