当前位置:文档之家› 平凡之路——北大数据科学,人大信息学院数学系,清华伯克利深圳学院(TBSI)数据科学

平凡之路——北大数据科学,人大信息学院数学系,清华伯克利深圳学院(TBSI)数据科学

平凡之路写在最前:如果选择了保研这条路,就努力去拼搏吧,没有一条路是容易而平坦的。

黎明的时候去问问这条路怎么走,清晨的时候全力去奔跑,这样才能在午后悠闲的散步,回顾你我曾走过的平凡之路。

个人情况本科院校:北京理工大学数学与统计学院985和211专业排名:夏令营时成绩3/44,推免时成绩4/44,综合3/44双学位:北京大学国家发展研究院经济学双学位GPA 3.49/4英语:四级613 六级544荣誉:一次国家奖学金、两次国家励志奖学金、四次优秀学生一等奖学金、两次优秀学生二等奖学金、三次基础课学习优秀个人三等奖、校级数学分析邀请赛二等奖、三等奖校级数学建模竞赛二等奖、美国数学建模竞赛H奖获校“励志先锋”“新星团员”“优秀学生”“优秀团员”等称号学生工作:校演讲队队长,曾获2015“宗平杯”我心中的巫山红叶全国大学生演讲比赛个人特等奖预录取院校:北京大学前沿交叉学科研究院数据科学,清华伯克利深圳学院数据科学和信息技术,中国人民大学信息学院数学系最终去向:北京大学前沿交叉学科研究院数据科学保研准备——黎明问道我是一个幸运的人,在高考结束后,班主任在组织大家交代填志愿的事情的同时,也交代了本科生和研究生的事情,那是我第一次听到保研这个词,那么耀眼。

我在大一的时候就确定下了保研这条路,甚至连目标都确定了,北大。

既然是保研,成绩肯定是最重要的,所以在大学前两年自己都保持了非常不错的成绩,但是大三的时候,自己对经济学很感兴趣,想在研究生转专业,另一方面自己的排名很难再有大的突破,所以我就选择了在北京大学修经济学双学位。

保研夏令营申请的时候,自己没有选择经济学,在专业和学校上权衡,我选择了学校,同时,数据科学这个新的方向也是我的兴趣所在,所以申请了北大清华数据科学的方向。

另外还报了人大的信息学院的数学系。

申请夏令营的时候建议大家分梯度的申请,分成三个梯队:第一梯队的学校为自己可以冲刺的学校。

第二梯队为大概率录取的学校,第三梯队为一定能录取的学校。

这样的话,降低了风险的同时,也更加便于管理。

还有三个小tips:第一,建立Excel表管理各个学校的信息,像提交的材料和deadline等。

第二,用163邮箱提交电子材料后可以将163邮箱和qq邮箱绑定,这样一旦有任何关于申请学校的信息就可以在QQ 或者微信中看到,而不用总刷邮件,浪费时间而且容易让人烦躁。

第三、搜集信息方面一定要关注保研论坛,非常全面。

保研过程——清晨狂奔1、北京大学前沿交叉科学研究院数据科学专业(7月3日—7月6日)北大的数据科学专业今年是第二年招研究生,第一届是没有夏令营的,只有推免,且招生名额为50学硕。

今年是第二年,有夏令营和推免,招生名额也比较多(可能是因为大数据比较热门,国家有战略支持),今年招生计划共有80个名额(大多数为学术型硕士),推免65,考研15。

夏令营入营120人,入营的学生主要来自于计算机、软件、数学、统计、电子信息等本科背景,最终录取了50个左右。

7月3日下午6:00我们在北大西门锡华商务酒店地下一层进行冷餐会,由交叉学院领导和各个专业的主要负责老师讲解各个专业的培养和招生情况。

数据科学专业由中科院院士、北京大学、普林斯顿教授鄂维南院士讲解学科发展和招生情况。

餐会结束,大家就各自回学校准备第二天的宣讲会。

4日是一天的宣讲会,讲解各个实验室的研究方向和各个课题组的情况,叉院的老师大部分来自于数院和信科,所以以后可以选择这两个学院的导师。

另外就是培养方案,由于项目比较新,数据科学的使用价值又非常大,所以鄂维南院长说有两种培养模式,一种是科研方向,计算机有自然语音处理等较为基础的科研方向,数学方向可以做统计机器学习算法方向,另外一种是应用型的方向,大数据研究院下面有金融大数据、交通大数据等研究中心,可以做应用型的项目。

下午4点宣讲结束后是数学类的笔试和计算机的机试。

笔试数学三难度,选择和大题,都是基本的题比如,线性方程组求解,矩阵的运算,多元函数极值判断等,不是很难,主要考察基本功。

机试可使用的语言有C++和Java,好像Python也可以,稍微有些难度,可以刷北大oj作为练习。

最后笔试和机试成绩招生老师说只作为参考,不计入最后成绩,但是肯定越高越好。

5号主要是面试,面试分成了四组:数学统计组、计算机软件组、通信物理等组、电子信管等组(后面两组的分类不是很清晰,但是主要是理工科)。

数学统计组面试有5个老师,我遇到的有这样几个题:1、英文自我介绍。

这个地方口语好是可以加分的,所以一定要提前准备好中英文的自我介绍,过程中老师向我确认了一下排名rank No.3 among 44,说明老师还是非常注重学习成绩排名的。

2、老师看了一眼成绩单,概率论和数理统计都是满分,那你讲讲什么是中心极限定理吧。

我在黑板上边写边叙述这个定理的内容,老师继续追问会证明吗?这个定理我只会证独立同分布的情况,然后就向老师确认证明独立同分布的情况?老师说是,我就继续在黑板上边写边证明,写到一半多,老师大概明白我会,就示意我停下来。

3、由于我提交了我的统计计算的课程论文,所以这一块被问到了。

老师说,你这个地方用了主成分分析,你能讲一讲吗?我就把矩阵写出来,将这个方法的原理,老师好像觉得我矩阵那个地方讲的不清楚,然后打断我,问我行和列的意义,怎么加权?这个地方,回答问题要注意讲清楚数学含义是什么。

然后又问我这个模型有什么问题?4、美赛数学建模也问到了,问我主要做什么工作?我说数学模型的建立,然后老师说,那你们论文建立了什么模型?这个地方,你提交的数学建模和课程论文属于必问的问题。

5、然后老师问我想不想读博?我大概就觉得自己录取有戏了,我说,希望自己先读硕士,如果要读博,出国读。

6、最后老师又问了一些数理统计的问题:第一类第二类错误?什么是假设检验?原假设和备择假设能否互换?最后一个问题,我忘了就如实说我忘了,回去之后会弄清楚。

总体来说,自己面试还是非常轻松愉快的,老师也比较友善,如果你没有答上来,老师会提示你。

本来时间规划里,有6号的,但是5号面试结束后,老师说就可以回学校了,夏令营结束了。

12号早上收到了北大的录取通知,由于自己的理想学校就是北大,就直接确认了。

2、中国人民大学信息学院数学系(7月6日—7月8日)6日下午在人大报道,回到寝室,和夏令营的室友谈谈天南海北,准备第二天紧锣密鼓的宣讲和面试。

7日上午是信息学院的宣讲会,先是数学系和计算机系一起开宣讲会,之后由各自的老师进行宣讲。

数学系是人大信息学院的比较小的专业,老师比较少,每老师讲了讲自己的方向和毕业生去向,上午的宣讲会就结束了。

下午是各专业的面试,数学系分为两个面试环节:专业面试和英语面试。

专业面试主要考察专业知识,主要的一些问题有:什么是对称矩阵,柯西收敛定理,假设检验的第一类第二类错误等等。

还会问一些想法类的,你打算出国吗?我说研究生不打算,如果读博士,有可能。

整体氛围较为愉快,答不上来,老师会提示。

英语面试主要考察口语,比如:你了解人民大学信息学院数学系吗?四六级的成绩。

还有你学过哪些专业课?都是一些常规的问题,可以提前准备。

8日上午是笔试,考数学分析和高等代数,各5道大题。

数学分析部分我记得有Gamma 函数的连续性和无穷阶可导性的证明,傅里叶变换,第二类曲面积分等,高等代数部分有多项式可约问题,正定矩阵,线性方程组求解等。

整体难度一般,但是还是要提前复习的。

笔试完,夏令营就结束了。

7月26日邮件确认录取通知,但是当时已经确认去北大了,就婉言拒绝了。

3、清华伯克利深圳学院(TBSI)数据科学和信息技术(8月7日—8月16日)清华伯克利深圳学院是清华和伯克利合办的一个学院,地点在深圳,该项目为全英文教学,非常的国际化。

学生第一年在深圳学习,在第二年可以选择申请去伯克利学习一年,然后再回到深圳或者北京做毕业设计。

该夏令营也是全英文的环境,包括平时活动面试和项目。

TBSI的夏令营主要是在10天内做一个项目,今年的主题为:Redefine the future.希望同学能够利用自己本科所学知识,大胆创新,构想甚至实现一个非常有突破性的idea.这10天共分为3个部分,workshop,hackathon,competition.第一个部分主要是创意阶段,主要完成的任务为tell a story.第二部分就是要做一些技术性的工作,比如UI设计,网站设计,数据处理等等。

第三部分就是做final PPT和speech的一些工作。

整体来讲,活动形式非常有新意。

我们组做的是个性化教育网站:Iducation,服务于我的教育。

希望通过实现网络课程资源的整合,通过学生的学习行为,确定学生的学习特点,推荐个性化的课程,同时还要做到系统化,我们实现了网站的初步设计,并且演示了我们想做的各个模块。

最后我们拿到了Most Valuable Award。

在做项目过程中,会有一些其他有趣的活动。

比如企业参访,我们参观了一家大数据医疗公司,公司负责人向我们讲解了公司的发展历程,和与各个医院的数据合作,还有就是医疗大数据领域前沿的处理方法等,营员们都觉得受益匪浅。

再比如,Open fiesta的VR体验和密室逃脱,清华和伯克利老师的讲座等等。

在最后一天我们进行了全英文的面试,也是最重要的考核环节。

首先在候场教室,会给你2-3页的关于大数据的英文论文,然后5分钟阅读。

之后进入面试教室,5位老师,都是TBSI最主要的负责老师包括院长。

第一个问题是自我介绍,然后会问论文里的问题,其实还是问一些最主要的问题,比如数据收集后处理起来最难的点在哪?我答的是如何识别结构化数据和非结构化数据,还有就是如何处理非结构化数据。

另外一个老师问了一个关于sensor的问题,我表示没有学过,也不是很了解就过了。

接下来就问到,你在这10天的项中,担任什么样的角色?我说我主要负责个性化推荐模型的构建,创意设计(Iducation)和最后的展示。

然后老师看简历问了一些问题,我写到我拿过全国大学生演讲特等奖,老师问我比赛有多少人?感觉还是挺看重综合素质的。

老师还问道概率论和统计的区别?让我举例说明。

另外还看到我经济学的学习,问我统计在经济学的应用?我举的计量经济学里面的例子。

最后问了一些个人的基本情况,你的高中、父母职业等等。

整个面试,氛围比较愉快,只要是英语不错,能够流畅表达问题都不大。

8月19日收到了预录取邮件,由于已经确认去北大,所以就婉言拒绝了。

我在夏令营遇到了非常多优秀的小伙伴都去了TBSI,我们也成为了很好的朋友,至今还在一起讨论数据科学的相关知识和想法,也会组织party。

保研感悟——午后漫步保研只是人生中非常小的一个阶段,保研不代表保了未来。

在这个过程中,我们要学会去管理自己,安排好时间,同时还有调整心态不要患得患失。

相关主题