- 从零开始利用Excel与Python进行数据分析
- 兰一杰
- 537字
- 2023-04-21 19:50:32
2.1.1
集中趋势
平均数、中位数、众数3个统计量用于反映数据的集中趋势,这3个统计量的计算方法和使用场景如表2-1所示。
表2-1 反映数据集中趋势的统计量
![](https://epubservercos.yuewen.com/B9C8D4/26001776901930206/epubprivate/OEBPS/Images/9787301332146_Figure-0020-0008.jpg?sign=1739360275-s8viYroZNBikpHcVTRvbf1A8MTP1LJFi-0-10a11f2a2a1999ee4354dce8917f7c54)
下面举例说明反映数据集中趋势的统计量的应用方法,让读者对各统计量的计算方法与使用场景有更深入的理解。本例模拟将苹果按重量划分类别,划分标准为150~200克为小,200~250克为中,250~300克为大。
1.平均数
假设有5个苹果,它们的重量如表2-2所示。5个苹果重量的平均数为(220+235+210+215+240)÷5=224(克),类别划分为“中”,这组数据相对集中且没有异常值,因此通过平均数可以很好地反映数据的整体水平。
表2-2 平均数计算数据
![](https://epubservercos.yuewen.com/B9C8D4/26001776901930206/epubprivate/OEBPS/Images/9787301332146_Figure-0020-0009.jpg?sign=1739360275-I5lDWilLqNZear86CPyNTIAWCeVobHJ3-0-b2868071bf1a086437b7121b30432b84)
2.中位数
假设有5个苹果,它们的重量如表2-3所示。5个苹果重量的平均数为(220+235+210+215+500)÷5=276(克),类别划分为“大”,很明显该划分结果与数据集中的多数数据不匹配。导致划分结果与多数数据不匹配的主要原因是有一个500克的苹果,属于异常数据。此时可以使用中位数进行判断,该组数据的中位数为220克,可以反映数据的整体水平。
表2-3 中位数计算数据
![](https://epubservercos.yuewen.com/B9C8D4/26001776901930206/epubprivate/OEBPS/Images/9787301332146_Figure-0021-0010.jpg?sign=1739360275-VPdR3ruGyDe3IdSMCiKXu646BzZZXrED-0-9e347585bfaf17236842ab6bcefe0d84)
3.众数
假设有10个苹果,分别属于两个品种,它们的重量如表2-4所示。10个苹果重量的平均数为197克,中位数为200克。可以发现这两个统计量的差距不大,但都无法反映数据的整体水平。此时可以通过数据的众数160克、230克,反映两个品种苹果重量的整体水平。
表2-4 众数计算数据
![](https://epubservercos.yuewen.com/B9C8D4/26001776901930206/epubprivate/OEBPS/Images/9787301332146_Figure-0021-0011.jpg?sign=1739360275-JTKErbCp2Ru80CfZfaHzcb8fMCW6gw6Q-0-c6cff5e93eaf1553bc278e63d38fe412)