数据的艺术续集:从四所区龙高三调研考看数据
更新时间:2026-02-06 18:15 浏览量:1
上个月底发了一篇文章,特控率和本科率的真相与艺术。里面有一串的的数据,能够大抵从大数据的角度看到一个参加广州中考的学生,其中考成绩和高考线之间的关系。
如果不想点进去看的话,那我再放个结论:可以推断,整体上,
中考接近第一梯度线,高考有较大概率能上特控,中考超过第三梯度线15分,高考有较大概率上本科
。
据此,评价一所学校的特控率是否合理,加工率强弱,其实很直观可以换算成这所学校每一届招收到的一梯度学生有多少。
当然,这个数据也不是公开数据,我们无从得知。但是作为对中考方方面面有点经验的我们,大概就能推断出一所学校公开的数据是否合理。
巧了,最近几天很多高中各年级的成绩数据暴风雨式出现,引发了热烈讨论,比如下面这份:
这是四所区属龙头高中高三调研考的数据,某学校流出。
前100没有,前200稀少——这部分基本可以看作是清北种子选手,区属在超尖这一块还是很难的,能理解,我也是希望区属最后能冲上来一些,让广州教育百花齐放。
其他的,大家看图说话就行了。我还是想接着上次的文章,谈谈数据的“艺术成分”。
这份数据,
第一行的学校在前2000名上是有明显的数量优势的,如果我是该校老师,肯定会抓住这个展开讲
。但细心的你会发现,第二行学校因为招生人数少,在“率”上有很大优势,所以
如果我是第二行学校的老师,我呈现的就不会是人数,而是比例
。
如果我是三、四行的老师,这些数据好像都不占优,怎么办?很简单,换一个呈现方式,调其他东西讲,比如历史类会不会比较好?比如比较对象可否不是上面两个,而是换成其他“软柿子”学校?
看图说话的东西,大家肯定也看过了。最后,还有一个我自己换算的特控数据,大家不妨看看。
解释一下,第一张图展示的是物理类的人数,但采用的是当年招生人数。按照合理的物理历史人数比,我们按照招生人数85%算,分别得出第二列的数据,模拟出该校选择物理类的学生人数。
开头的文章提到,25年高考广州特控上线约1.47万人,而该表恰好有前15000名人数,可以看成约等于特控线人数。那么,我们用前15000名人数,除以物理类人数,可以模拟出一个这次考试的物理类特控率。
可以看到,第二行学校依旧保持在九成,第一行学校在84%附近,另外两所学校则在七成左右。
特别提醒,任何一次考试特控率均有差异,该模拟当然也会有出入,不代表真实,仅供参考。但有一说一,该数据和一些我了解到的内情能够交叉印证,起码是八九不离十,巧了不是?
学校数据不是公开的,都是偶尔才能传出来,或者我们私下和学校关系不错,学校给我们私下展示,并千叮万嘱不能公开的。数据靠谱程度,或者说含水量的高低,我们一般会交叉比对,觉得还挺靠谱才会采用。
ps:如果大家看到民间网传版和喜报,有考试人数而不仅仅只有一个“率”,靠谱程度会高很多。因为
学校如何呈现数据是艺术,但如果人数上瞎编那就是“造假”,性质不一样
。
所以不得不说,一个人的力量是有限的,最近我和另外六位前辈成立的教育新媒体联盟,在减少信息差方面真的很有帮助,有些东西大家对一对便知情况。
我们尚且如此,何况普通家长。这时候,大家想想你们可以从各种渠道上看到的学校特控率,和这个有多少差距?
当然,聪明如你应该会想到,这里会不会是分母不同呀?当年入学的学生可能因为种种原因已经不参加高考了。然而,25年广州高考报名人数约6.61万,而22年广州中考普高招生计划约6.24万个……更何况,转走的学生比例更大的应该是出现了一些问题需要换个环境(或赛道)的,
一个学生你不能成绩好的时候算自己的学生,成绩不好的时候不算吧?
综上,上述数据我认为是更接近真实特控率的。
加工也是要讲基本法的。我拍脑袋想,能把最终特控率比预期提高几个点已经很不错了,10个点怎么都是天花板了吧?
这时候,一所如果说自己有60%特控。那么很简单,你考虑一下它会不会在三年前录取到50%的一梯度学生。如果想想都知道不可能,那它凭什么有60%特控?
最后抛个问题给大家:如果一所学校有两个校区,尤其是中考签约深度捆绑的那种,你猜猜它在展示数据的时候,会把两个校区优秀学生都算上,还是只算主校区?如果你觉得是前者,那么又来猜猜它这个“率”里面的分母,是把两个校区总数都算上,还是只算主校区?
别问,问就是艺术。
