孩子,懂这些样本知识,足以帮你辨识日常信息的可信度
发布时间:2025-06-15 20:53 浏览量:30
这篇我们说样本
01
例子
当你告诉妈妈该提升自己零花钱的额度了。
妈妈问为什么?
你说同桌小明一个星期20元,前桌也是20,后桌上周拿了22,更有甚者班长一个星期能有30元!
大家都比你多,你只有10块钱,你想赶上大家,赶不上班长,至少也跟普遍水平一样吧,20元不多,必须给。
妈妈回话了:小明和前桌家庭条件特别好,属于你们特别的,班长学习好家里有奖励,你不能跟他们比,你跟大多数人一样就行。
你不满,说:大多数都是20!
妈妈不信,说你明天挨个给我问问,我倒要看看大多数人的零花钱水平,是跟你说的一样还是跟我说的一样。
你急了,说我们班有60名同学,挨着问太麻烦了。
好,妈妈要求:明天大课间,站班门口,过来一个同学问一下,问20个人,看看大家每周多少零花钱。
你照做了。
结果,这20个同学有一个5元、2个20元,其他都是10元。
妈妈说,你看普遍都是10元。
于是你的零花钱被妈妈固定在10元,你不能向同桌和班长看齐了。
02
样本
上面这个例子里,小明、前桌、后桌、班长,都是你要零花钱的【参照样本】。
妈妈让你问的【全班同学、随机20个人】,也是样本。
只不过,小明和班长等属于“你想达到的样本”;全班同学和随机的20人,属于妈妈想让你参照的样本。妈妈希望你跟“大家一样”——这是妈妈的目标。
按照这个目标,她希望你问问班级60个同学,看看大部分人的零花钱在什么水平。
60个人太多了,问起来麻烦,妈妈又让你问20个。
60是总体,20是随机抽样——从总体中随机抽出一部分,通过调查这一部分人,来推断总体情况。
那么,20这个样本能推测整体吗?或者说推测的准确吗?
可以说基本准确,误差很小。
因为它:
符合妈妈的“研究目标”——普遍水平而不是条件好的孩子;样本是随机的,不会偏向零花钱过多或者过少的同学;样本数也够,占总数的三分之一,不算少了。03
取样标准
现在你可以心服口服了吗?
不,你永远希望零花钱多一些!
其实你选班长也没错,因为你的目标跟妈妈不同,你想提高零花钱。
如果妈妈没有样本的知识,她可能就被说服了。
注意这里的【样本知识】,如果我们没有样本的知识也可能被说服,被带着走。
假如,你将来有了孩子,他向你要零花钱。
他也调查了全班三分之一的同学,但是他调查的时间是在春节过后。得出的结论是大家每周花200元,你会提高他的零花钱水平吗?如果你不懂样本知识,就可能答应他。
如果你懂取样,会反应过来:取样还要看时间,刚过完年,大家都有压岁钱,跟平时标准肯定不同。
其实取样有很多讲究。
再举个例子,场景不同,取样也不同。初中和小学就不同,随机抽样小学生可以站门口问,初中生则不然。
初中爱学习的学生下课都不出来,坐在座位上消化上节内容。
出来的大多爱玩爱耍,本身对零花钱的需求就大,他们跟另外一些同学的需求不同,作为样本也有失偏颇。
还要考虑外界扰动。比如老师某天在班级群里说:最近有些同学拿零花钱买卡牌,家长不要给小孩那么多零花钱。
那么第二天,好多同学的零花钱肯定就没了或者减少了——在老师这个外界扰动之下做调查,不准确了。
还有最常见的,很多人的样本数不够。比如一些学霸的妈妈总说,我的孩子怎么怎么样,所以大家按照我的方法就行。
她的孩子往往是极端样品,她说的只能作为个例,大家知道有这么个事,但不能作为行动参考。
还有一些取样非常有目的性。你想提高零花钱的标准,你会找一些零花钱比较多的同学作为参照,从而误导家长。
你妈妈想让你提高学习成绩,她会找隔壁学霸作为参考,从而让你有样学样。
你看,想误导别人,那么样本、根据样本产生的数据,也会被设置的非常有目的性。
……
04
区分
看完上面这些,你可能会觉得有道理,但同时也觉得很麻烦——这么多影响样本的因素,我头都大了。
不要怕,你还没到做科学实验的程度,日常生活中抓住3点就好:
目的、随机、数量。
当别人给你举例谈数据时,你要注意这个人的目的——注意,是这个人的目的,而不是他的调查目标。比如说爸妈想说服你少喝奶茶,那么他们在目的怂恿下就很容易只选符合自己目标的数据。
还有一层,爸妈可能只选本身不适合喝奶茶,喝了出事的群体来做样本,试图让你害怕。
在这个目的之下,他们的取样是不是符合原本的研究目标不重要,他们的动机更重要。
大部分人把说服别人看得更重要,事实本身并没那么重要。
接下来才是样本本身,你要看看样本是否随机。还是喝奶茶这件事,如果他们只问了身边的人,或者只找了一些喝奶茶出事的人的,很显然,样本在人群中根本没有随机性。
没有随机性,就代表不了“任意”,那么,他们说的就只能当个事儿听听,不能武断拿来决定喝还是不喝奶茶。
最后,看一看样本数量。要调查全校同学的身高情况,就选了50人做统计——全校有2000人,50人合适吗?
肯定不合适。
样本数量要尽可能大,让它覆盖到各个阶段的人群。
就这一点,足以筛选掉许多人的话:我如何如何,我邻居如何如何,朋友的儿子……
都是个案,听听得了,全当聊八卦。
总结一下:
目的、随机、数量——抓住这几个关键词,下次再听某个人举例试图证明自己、试图说服,你就知道该不该“听话”了。
当然,具体到科学实验、大数据分析时,样本会更复杂。
我们这里说的都是简化了的版本,目的是帮你快速理解样本,也帮你区分日常信息——靠不靠谱,看看样本就七七八八了。
本文结束,谢谢阅读。