目录第1章活动概要 (1)1.1活动简介 (1)1.2参与数据概述 (2)1.2.1师生参与进程 (2)1.2.2参与分布情况 (3)1.2.3男女比例 (4)1.2.4写作时段分布 (4)第2章学生互动写作行为数据 (5)2.1概况 (5)2.2修改次数 (6)2.3分数变化 (8)2.4维度统计值变化 (11)2.5作文错误处理情况 (12)2.6中式英语修正情况 (15)2.7具体修改案例 (16)第3章内容分析 (19)3.1阅读的益处 (19)3.2学生关注的作品 (20)3.3学生关注的名人 (21)3.4名言警句使用情况 (22)3.5信息化阅读 (24)第4章错误类型分析 (25)4.1错误概况 (25)4.1.1错误分析概况一览 (25)4.1.2分级错误情况对比 (29)4.1.3各类院校高频错误 (30)4.2具体错误 (31)4.2.1错误类型:大小写错误 (31)4.2.2错误类型:词性误用 (33)4.2.3错误类型:动词连用错误 (35)4.2.4错误类型:不定式错误 (38)4.2.5错误类型:介词误用 (40)4.2.6错误类型:名词可数性 (42)4.2.7错误类型:连词错误 (45)4.2.8错误类型:搭配错误 (48)4.2.9错误类型:主谓一致错误 (50)4.2.10错误类型:成分缺失 (52)4.3高低分数段作文错误情况 (55)4.3.1高低分组作文错误分布 (56)4.3.2高低分组作文高频错误 (58)4.3.3高低分组典型错误对比 (58)第5章各类院校维度分析 (59)5.1词汇 (62)5.1.1平均词长 (62)5.1.2词汇丰富度 (64)5.1.3学术词汇占比 (66)5.2句子 (68)5.2.1平均句长 (68)5.2.2从句密度 (70)5.3篇章 (72)5.3.1平均作文长度 (72)5.3.2平均段落数 (74)5.4高低分数段维度对比 (76)第6章频度统计 (83)6.1词汇 (88)6.1.1名词频度 (90)6.1.2动词频度 (98)6.1.3形容词频度 (106)6.1.4副词频度 (114)6.2词组 (1199)6.2.1名词词组 (121)6.2.2动词词组 (126)6.2.3形容词词组 (131)6.2.4副词词组 (136)6.3搭配 (141)6.3.1动词+名词 (143)6.3.2形容词+名词 (150)6.3.3名词+动词 (156)6.4中式英语 (162)第7章优秀作文 (164)7.1985院校 (164)7.2211院校 (172)7.3一般本科院校 (183)7.4高职院校 (193)7.5中学 (201)第8章参与院校名单(部分) (2100)第1章活动概要1.1活动简介“百万同题英文写作”活动是由批改网()主办,在中国高校英语写作教学联盟和北京语言智能协同研究院指导下举办的特色线上活动,旨在深入地分析中国学生英文写作现状,发掘大数据的力量,支持中国英语教学工作,同时响应国家四月“全民读书月”的号召。
第二届“同题英文写作活动”与当当第九届书香节携手,让学生“饱览群书嗅书香,激活智慧书美文”,用一篇篇动人的文章展现中国学生个性风采、提升国际交流能力、锻炼英文写作能力。
本次活动题目“We Are What We Read”由清华大学提供,同样的题目内容,根据大学和中学学生不同的写作要求,分成大学组和中学组两个活动组。
1.2参与数据概述2015年4月16日至5月31日活动进行的46天中,来自全国31个省市地区的2792所学校的老师引用布置题目17,662次,共计收到学生作文1,093,126篇。
1.2.1师生参与进程在活动进行的46天当中,教师引用布置题目共17,662次,多在周一到周五工作日留下题目;而答题学生共有1,093,126人,提交作文多集中于活动后半段,学生作文提交量直线上升。
1.2.2参与分布情况本次活动参与师生覆盖中学以及高等教育两个学段。
参与的院校类型包括985、211、一般本科院校、高职及中学(以高中为主)。
本科院校参与学生人数众多,占总人数的近80%。
全国共有31个省市地区的师生参与活动,其中参与人数超过4万人的省份地区有7个,分别是四川(139,206),江苏(106,075)、山东(98,183)、北京(81,081)、广东(73,211)、黑龙江(48,212)、湖北(44,054),其余省份参与情况如下表:省份/地区学校数(所)人数(人)省份/地区学校数(所)人数(人)四川215139,206浙江12221,856江苏248106,075江西8921,330山东17998,183贵州4219,648北京41281,081吉林6119,108广东19973,211上海8317,711黑龙江8048,212甘肃6517,339湖北12444,054广西5417,227云南5636,019天津4516,097河南9933,404海南1713,978安徽8428,271山西6113,590河北7127,407内蒙古348,450陕西7525,690新疆265,275福建8025,292宁夏112,480重庆7324,692青海92,028湖南7923,314西藏373辽宁6022,224------1.2.3男女比例参加本次活动的学生中,有56.91%是女生,男生样本稍少,占比43.09%。
1.2.4写作时段分布通过统计学生提交的770多万个作文版本的时间,可以发现以下规律:学生写作时间多集中在下午和晚上两个时段,19:00后进入写作高峰,峰值出现在22:00。
少部分学生选择在深夜学习,在0:00至2:00间仍有学生提交记录。
从整体分布趋势上看,学生的学习时段覆盖到了全天的70%。
学生倾向于在较晚的时段学习,且整体上学习分布时间跨度较大。
第2章学生互动写作行为数据2.1概况本次活动期间大多数的老师均允许学生自主修改自己的文章,学生在多次修改中会形成一个自主学习的过程,相关数据如下:1、系统和学生互动总次数为7,761,959次2、学生每篇作文平均修改次数为7.1007次3、修改过程中共改正4167188个错误4、71%的学生都对自己的文章进行了至少一次修改5、修改5次以内的学生占39%6、超过1%的学生修改次数超过50次7、9个省份的学生的平均修改次数在7次以上52.2修改次数修改次数分布62015百万同题英语写作大数据分析报告(全学段·详尽版)分类1-56-1011-2021-5051-100101+ 985院校49.74%23.37%16.83%8.99%0.96%0.11% 211院校51.50%21.73%16.26%9.23% 1.13%0.14%本科院校53.89%19.52%15.55%9.72% 1.16%0.15%高职院校59.69%15.70%13.49%9.30% 1.57%0.25%中学77.86%11.07%7.74% 3.07%0.21%0.04%根据以上图表可以看出,各类院校的作文修改,次数越多,占比越小,均集中在1-5次,并且6次以上区间比例远低于1-5次的比例。
尤其是中学生,1-5次修改的比例达到了77.86%,而985院校则为49.74%。
另外值得注意的是,高等院校修改次数虽然也集中在1-5次,但是该区间占比大多在50%到60%之间,大于100次修改的比例相比于中学要高若干倍,而中学生中有约80%的学生作文修改停留在1-5次之间。
在全国所有参与本次活动的省市地区中,绝大多数地区平均修改次数都超过6次,重庆、北京、浙江、四川、陕西、广东、湖南、云南、河北这9个省市地区的平均修改次数都在7次以上,其中重庆、北京、浙江和四川的平均修改次数更是达到8次以上。
同学们根据批改提示,修改完善自己的文章,精益求精,在批改的过程中积累学习。
82.3分数变化初版分数分布9终版分数分布各类院校初终版作文平均分数对比由上图可以看到,相比较于初始版本作文平均分,五类院校最终版本作文平均分均有明显提高,基本都有3至4分的涨幅,其中985院校分数提升最多,达到4.07分,这意味着通过多次修改,平均每一篇作文都提升了4分。
平均分数变化通过对比全体学生初始版本作文和最终版本作文的平均分可以看到,学生自主修改后作文分数平均提高了3.7分。
(注:统计分数为批改网原始机器分,和教师设置打分公式无关)2.4维度统计值变化◆词汇方面:词汇丰富度、平均词长、平均词汇难度测量值均有提升,证明学生在终版作文中词汇的使用比初版作文丰富,使用单词难度略有提升。
◆句子方面:平均句长略有下降,但是从句密度测量值略有提升,说明学生在不断调整自己的句式结构合理性,通过使用从句使文中句式更加丰富。
◆篇章方面:文章长度平均增加6个单词,同时学生使用连词的数量变多,说明学生在写作过程中注意到使用衔接词可提升文章结构的连贯性。
另外在终版作文中首段和尾段所占篇幅下降了,本题目为议论文,可能学生通过精简首尾两段的篇幅,让首段提纲挈领和尾段总结概括更加清晰有力。
2.5作文错误处理情况通过修改,终版作文中错误数量只有初版作文错误数量的一半左右,四类语法错误在数量上都有大幅下降。
初终版作文典型错误对比情况错误类型初版错误次数终版错误次数修正率名词可数性错误166,68172,02056.79%不定式错误17,1887,93053.86%动词连用错误608,207300,59950.58%介词误用51,15525,30350.54%主谓一致错误1,025,879546,06746.77%大小写错误696,386378,42345.66%词性误用101,72157,39043.58%连词错误28,73016,76041.66%搭配错误1,419,252909,69235.90%成分缺失202,952134,20233.88%416718849.19%129424615.28%90969210.74%88579610.46%121786514.38%通过修改过程的人机互动,上图中显示最终版学生作文中各类错误的数量有30%-50%的下降。
从语法错误率维度的统计值上亦可看出,终版作文的语法错误率统计值较初版下降了42.77%。
语法错误率是指一篇文章中平均每个句子中包含的语法错误数量。
从以上数据可看出,通过让学生进行自主的思考和修正,文中出现的语法错误可有明显减少,但是碍于学生自身语言基础知识积累有限,且自我思考和新知识分析能力的不同,通过自主学习不能够完全消灭文中的语言问题。
2015百万同题英语写作大数据分析报告(全学段·详尽版)如图表所示,学生在机器自动批改服务的帮助下,在初版作文中发现的大部分错误得到了明显的改善,其中大部分错误的修正率都在一半以上,以大小写错误,动词连用错误,不定式错误,介词误用,名词可数性错误以及主谓一致错误的改善尤为明显。