1.如果一组数据的中位数比平均数小很多,则下列说法一定错误的是( )
A.这组数据可能是对称的
B.数据中可能有异常值
C.数据中可能有极端大的值
D.数据中众数可能和中位数相同
中位数是一组数据从小到大排列,中间位置的一个数或两个数的平均数,平均数表示一组数据的平均水平,如果一组数据的中位数比平均数小很多,说明数据分布极不均匀,所以这组数据不对称, $ \mathrm{A} $ 错误;这一组数据的中位数比平均数小很多,说明其中可能有异常数据,且异常数据偏大,即可能有极端大的值, $ \mathrm{B} $ , $ \mathrm{C} $ 正确;众数是出现次数最多的数,可能不止一个,故可能和中位数相同, $ \mathrm{D} $ 正确.故选 $ \mathrm{A} $ .
2.有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲:7 8 10 9 8 8 6
乙:9 10 7 8 7 7 8
则下列判断正确的是( )
A.甲射击的平均成绩比乙好
B.乙射击的平均成绩比甲好
C.甲射击的成绩的众数小于乙射击的成绩的众数
D.甲射击的成绩的中位数等于乙射击的成绩的中位数
由题意得,甲射击的平均成绩为 $ {\overline{x}}_{甲}=\dfrac{7+8+10+9+8+8+6}{7}=8 $ ,众数为8,中位数为8;乙射击的平均成绩为 $ {\overline{x}}_{乙}=\dfrac{9+10+7+8+7+7+8}{7}=8 $ ,众数为7,中位数为8.
故甲射击的平均成绩等于乙射击的平均成绩,故 $ \mathrm{A} $ , $ \mathrm{B} $ 错误;甲射击的成绩的众数大于乙射击的成绩的众数,故 $ \mathrm{C} $ 错误;甲射击的成绩的中位数等于乙射击的成绩的中位数,故 $ \mathrm{D} $ 正确.故选 $ \mathrm{D} $ .
3.若数据 $ {x}_{1} $ , $ {x}_{2} $ , $ {x}_{3} $ , $ \cdots $ , $ {x}_{10} $ 的平均数为2,则数据 $ 2{x}_{1}-1 $ , $ 2{x}_{2}-1 $ , $ 2{x}_{3}-1 $ , $ \cdots $ , $ 2{x}_{10}-1 $ 的平均数为( )
A.1
B.2
C.3
D.4
若数据 $ {x}_{1} $ , $ {x}_{2} $ , $ {x}_{3} $ , $ \cdots $ , $ {x}_{10} $ 的平均数为2,则数据 $ 2{x}_{1}-1 $ , $ 2{x}_{2}-1 $ , $ 2{x}_{3}-1 $ , $ \cdots $ , $ 2{x}_{10}-1 $ 的平均数为 $ 2×2-1=3 $ .故选 $ \mathrm{C} $ .
4.有一组样本数据 $ {x}_{1} $ , $ {x}_{2} $ , $ \cdots $ , $ {x}_{n} $ ,其样本平均数为 $ \overline{x} $ .现加入一个新数据 $ {x}_{n+1} $ ,且 $ {x}_{n+1} < \overline{x} $ ,组成新的样本数据 $ {x}_{1} $ , $ {x}_{2} $ , $ \cdots $ , $ {x}_{n} $ , $ {x}_{n+1} $ ,与原样本数据相比,关于新的样本数据下列说法正确的是( )
①平均数不变; ②众数可能不变; ③中位数变小;④第20百分位数可能变大.
A.①②
B.①③
C.②④
D.②③
因为 $ {x}_{n+1} < \overline{x} $ ,所以新的样本数据平均数减小,①错误;
加入一个新数据 $ {x}_{n+1} $ ,则众数仍有可能为原数据的众数,②正确;
中位数也有可能不变,③错误;
若 $ {x}_{n+1} $ 大于原数据从小到大排列的第20百分位数,则在新样本数据中,因为样本数增加,所以第20百分位数可能后移,则新数据的第20百分位数可能变大,④正确.故选 $ \mathrm{C} $ .
5.将一次学校数学模拟竞赛的成绩统计整理成如图所示的频率分布直方图,记本次模拟竞赛成绩的中位数为 $ a $ ,则 $ a= $ ( )

A. $ 76\dfrac{2}{3} $
B. $ 76\dfrac{1}{3} $
C.75
D. $ 75\dfrac{2}{3} $
由题图可知 $ 0.04+0.06+0.2+10m+0.24+0.16=1 $ ,解得 $ m=0.03 $ ,所以前3组的频率和为 $ 0.04+0.06+0.2=0.3 < 0.5 $ ,前4组的频率和为 $ 0.04+0.06+0.2+0.3=0.6 > 0.5 $ ,故 $ a $ 在第4组,且 $ a=70+\dfrac{0.5-0.3}{0.3}×10=76\dfrac{2}{3} $ .故选 $ \mathrm{A} $ .
6.某校举办了数学知识竞赛,并将1 000名学生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图(每组为左闭右开的区间),则以下四个说法正确的个数为( )

$ ①a $ 的值为0.005;
②估计这组数据的众数为75;
③估计这组数据的平均数为71;
④估计成绩不低于80分的有300人.
A.1
B.2
C.3
D.4
由频率分布直方图可知 $ 10×(2a+3a+3a+6a+5a+a)=1 $ ,解得 $ a=0.005 $ ,①正确;根据频率分布直方图可知众数落在区间 $ [70,80) $ ,用区间中点值表示众数,即众数为75,②正确;平均数为 $ 0.1×45+0.15×55+0.15×65+0.3×75+0.25×85+0.05×95=71 $ ,③正确;
成绩高于80分的频率为 $ (0.025+0.005)×10=0.3 $ ,所以估计成绩不低于80分的有 $ 1000×0.3=300 $ (人),④正确.综上,①②③④正确.故选 $ \mathrm{D} $ .
7.某医院急救中心随机抽取20位病人等待急诊的时间(单位:分)记录如表:
等待时间 | $ [0,5) $ | $ [5,10) $ | $ [10,15) $ | $ [15,20) $ | $ [20,25] $ |
频数 | 4 | 8 | 5 | 2 | 1 |
用上述分组资料计算出病人平均等待时间的估计值 $ \overline{x}= $ .
9.5
由题意得, $ \overline{x}=\dfrac{1}{20}×(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5 $ .
1.一组样本数据中,1,2,3,4出现的频率分别为 $ {p}_{1} $ , $ {p}_{2} $ , $ {p}_{3} $ , $ {p}_{4} $ ,且 $ {p}_{1}+{p}_{2}+{p}_{3}+{p}_{4}=1 $ .设这组数据的平均数为 $ \overline{x} $ ,中位数为 $ m $ .下列条件一定能使得 $ \overline{x} > m $ 的是( )
A. $ {p}_{1}:{p}_{2}:{p}_{3}:{p}_{4}=1:1:1:1 $
B. $ {p}_{1}:{p}_{2}:{p}_{3}:{p}_{4}=1:4:4:1 $
C. $ {p}_{1}:{p}_{2}:{p}_{3}:{p}_{4}=1:4:3:2 $
D. $ {p}_{1}:{p}_{2}:{p}_{3}:{p}_{4}=2:3:4:1 $
设样本容量为 $ 20n $ , $ n\in {\boldsymbol{N}}^{\ast } $ .对于 $ \mathrm{A} $ , $ \overline{x}=\dfrac{1×5n+2×5n+3×5n+4×5n}{20n}=\dfrac{5}{2} $ , $ m=\dfrac{5}{2} $ , $ \mathrm{A} $ 不满足题意;
对于 $ \mathrm{B} $ , $ \overline{x}=\dfrac{1×2n+2×8n+3×8n+4×2n}{20n}=\dfrac{5}{2} $ , $ m=\dfrac{5}{2} $ , $ \mathrm{B} $ 不满足题意;
对于 $ \mathrm{C} $ , $ \overline{x}=\dfrac{1×2n+2×8n+3×6n+4×4n}{20n}=\dfrac{13}{5} $ , $ m=\dfrac{5}{2} $ , $ \mathrm{C} $ 满足题意;
对于 $ \mathrm{D} $ , $ \overline{x}=\dfrac{1×4n+2×6n+3×8n+4×2n}{20n}=\dfrac{12}{5} $ , $ m=\dfrac{5}{2} $ , $ \mathrm{D} $ 不满足题意.故选 $ \mathrm{C} $ .
2.小明在整理一组数据 $ {\rm 3,1,5,2,3,6,4,} x $ , $ y $ 时,不小心漏掉了2个数据,用 $ x $ , $ y $ 代替.已知 $ x $ , $ y $ 都是1到6中的一个整数(包含1和6),且这组数据的中位数和众数都是3,则 $ |x-y| $ 的值不可能是( )
A.1
B.2
C.3
D.4
不妨设 $ x\leqslant y $ ,
当 $ x=1 $ , $ y=3 $ 时,1,1,2,3,3,3,4,5,6,
满足题意且 $ |x-y|=2 $ ;
当 $ x=2 $ , $ y=3 $ 时,1,2,2,3,3,3,4,5,6,满足题意且 $ |x-y|=1 $ ;
当 $ x=3 $ , $ y=3 $ 时,1,2,3,3,3,3,4,5,6,满足题意且 $ |x-y|=0 $ ;
当 $ x=3 $ , $ y=4 $ 时,1,2,3,3,3,4,4,5,6,满足题意且 $ |x-y|=1 $ ;
当 $ x=3 $ , $ y=5 $ 时,1,2,3,3,3,4,5,5,6,满足题意且 $ |x-y|=2 $ ;
当 $ x=3 $ , $ y=6 $ 时,1,2,3,3,3,4,5,6,6,满足题意且 $ |x-y|=3 $ .故选 $ \mathrm{D} $ .
3.(多选)某市7天国庆节假日期间的楼房认购量(单位:套)与成交量(单位:套)的折线图如图所示,则以下说法错误的是( )
(多选)
A.成交量的中位数是16套
B.日成交量超过日平均成交量的有1天
C.认购量越大,则成交量就越大
D.认购量的第一四分位数是100套
由题图可知,将日成交量的数据从小到大排序为8,13,16,26,32,38,166,故可得中位数为26套,可知 $ \mathrm{A} $ 错误;
由题图中折线可知,日平均成交量 $ =\dfrac{1}{7}×(13+8+32+16+26+38+166)\approx 43 $ (套),
所以日成交量超过日平均成交量的只有10月7日1天,故 $ \mathrm{B} $ 正确;
由题中折线图可知10月2日到10月3日认购量减少,但成交量增加,故 $ \mathrm{C} $ 错误;
将日认购量的数据从小到大排列为91,100,105,107,112,223,276,
因为 $ 25\%×7=1.75 $ ,所以认购量的第一四分位数是100套, $ \mathrm{D} $ 正确.
故选 $ \mathrm{A}\mathrm{C} $ .
4.某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间 $ [50,100] $ 内,按分数分成5组: $ [50,60),[60,70) $ , $ [70,80),[80,90) $ , $ [90,100] $ ,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论

A.成绩在 $ [80,90) $ 内的人数最多
B.成绩不低于70分的学生所占比例为 $ 70\% $
C.50名学生成绩的平均数小于中位数
D.50名学生成绩的极差为50
设 $ [70,80) $ 组的频率为 $ a $ ,则由各组频率之和为1可得 $ 10×(0.01+0.02+0.03+0.02)+a=0.8+a=1 $ ,解得 $ a=0.2 $ .故 $ [50,60) $ , $ [60,70) $ , $ [70,80) $ , $ [80,90) $ , $ [90,100] $ 各组频率依次为 $ 0.1 $ , $ 0.2 $ , $ 0.2 $ , $ 0.3 $ , $ 0.2 $ .
对于 $ \mathrm{A} $ , $ [80,90) $ 这一组频率最大,即成绩在 $ [80,90) $ 内的人数最多,故 $ \mathrm{A} $ 正确;
对于 $ \mathrm{B} $ ,成绩低于70分的学生频率为 $ 0.1+0.2=0.3 $ ,即不低于70分的学生频率为 $ 1-0.3=0.7 $ ,所以成绩不低于70分的学生所占比例为 $ 70\% $ ,故 $ \mathrm{B} $ 正确;
对于 $ \mathrm{C} $ ,根据频率分布直方图,可得50名学生成绩的平均数约为 $ 55×0.1+65×0.2+75×0.2+85×0.3+95×0.2=78 $ ,
由 $ 0.1+0.2+0.2=0.5 $ ,知50名学生成绩的中位数约为80,所以
对于 $ \mathrm{D} $ ,极差为数据中最大值与最小值的差,已知50名学生的成绩都在区间 $ [50,100] $ 内,但成绩的最大值不一定是100,最小值也不一定是50,故极差小于等于50,故 $ \mathrm{D} $ 错误.故选 $ \mathrm{A}\mathrm{B}\mathrm{C} $ .
5.某地区市政府为了鼓励居民节约用电,计划调整居民生活用电收费方案,拟确定一个合理的月用电量标准 $ x $ (千瓦时):月用电量不超过 $ x $ 的部分按平价收费,超出 $ x $ 的部分按议价收费.为了了解居民用电情况,通过抽样,获得了100位居民每人的月均用电量(千瓦时),将数据按照 $ [0,100),[100,200),\cdots ,[600,700) $ 分成7组,制成了如图所示的频率分布直方图.

(1)求频率分布直方图中 $ a $ 的值,并且计算样本的平均数;
(2)若该市有900万居民,估计全市居民中月均用电量不低于400千瓦时的人数;
(3)若该地区市政府希望使 $ { { 8 } }{ { 5 } }{ \rm{ \% } } $ 的居民每月的用电量不超过标准 $ x $ (千瓦时),估计 $ x $ 的值.(结果保留整数)
(1) $ a=0.0015 $ , 395(千瓦)
(2)495万人
(3) $ x\approx 567 $ (千瓦).
(1)由频率之和为1,可得 $ (0.0005+0.001\times 3+a+0.002+0.003)\times 100=1 $ ,
解得 $ a=0.0015 $ ,
样本的平均数为:
$ 50\times 0.05+150\times 0.1+250\times 0.1+350\times 0.2+450\times 0.3+550\times 0.15+650\times 0.1=395 $ (千瓦).
(2)由图可得,用电量不低于400千瓦的频率为 $ 0.3+0.15+0.1=0.55 $ ,
故全市居民中月均用电量不低于400千瓦的人数为 $ 900\times 0.55=495 $ 万人.
(3)由图可得,前5组的频率之知为 $ 0.05+0.1\times 2+0.2+0.3=0.75 $ ,
前6组的频率之和为 $ 0.05+0.1\times 2+0.2+0.3+0.15=0.9 $ ,
设第85百分位数为 $ x $ ,则 $ x\in [500,600) $ ,
故 $ 0.75+(x-500)\times 0.0015=0.85 $ ,
解得 $ x\approx 567 $ (千瓦).