ML |原始和中心时刻

原文:https://www.geeksforgeeks.org/ml-raw-and-central-moments/

是一组统计参数,用于描述频率分布的不同特征和特性,即频率曲线的中心趋势、色散、对称性和峰值(驼峰)。

对于未分组数据即离散数据,变量 X 的观测值作为x_1, x_2, x_3, ...., x_n获得,对于分组数据即连续数据,变量 X 的观测值作为频率表中的 K 类区间获得并列表。区间的中点由x_1, x_2, x_3, ...., x_n表示,它们分别以频率f_1, f_2, f_3, ...., f_nn=f_1, f_2, f_3, ...., f_n出现。

班级间隔 中点(x_i) 绝对频率(f_i)
c_1 - c_2 x_1 = (c_1 + c_2)/2 f_1
c_2 - c_3 x_2 = (c_2 + c_3)/2 f_2
c_3 - c_4 x_3 = (c_3 + c_4)/2 f_3
c_k_-_1 - c_k x_k = (c_k_-_1 + c_k)/2 f_k

关于任意点 A 的力矩 关于观测值上任意点 A 的变量 X 的r^t^h力矩x_1, x_2, x_3, ...., x_n定义为:

对于未分组的数据  \mu^'_r = \frac{1}{n}\sum_{i=1}^{n}(x_i - A)^r

分组数据  \mu^'_r = \frac{1}{n}\sum_{i=1}^{n}f_i(x_i - A)^r

其中  n = \sum_{i=1}^{k}f_i

关于 Python 中任意点的时刻–

考虑给定的数据点。以下是 20 个不同的人每周在极客博客门户网站上花费的时间(以小时为单位)。

15, 25, 18, 36, 40, 28, 30, 32, 23, 22, 21, 27, 31, 20, 14, 10, 33, 11, 7, 13
# data points
time = [15, 25, 18, 36, 40, 28, 30, 32, 23, 22, 
        21, 27, 31, 20, 14, 10, 33, 11, 7, 13]

# Arbitrary point 
A = 22

# Moment for r = 1
moment = (sum([(item-A) for item in time]))/len(time)

原始时刻–

原点 A = 0 周围的r^t^h力矩称为原始力矩,定义为:

对于未分组的数据,\mu^'_r = \frac{1}{n}\sum_{i=1}^{n}x_i^r 对于分组的数据, \mu^'_r = \frac{1}{n}\sum_{i=1}^{n}f_i x_i^r

其中,n = \sum_{i=1}^{k}f_i

备注:

- > 我们可以通过用 1 替换 r 来找到第一个原始时刻(\mu^'_1),通过用 2 替换 r 来找到第二个原始时刻(\mu^'_2)以此类推。 - > 当 r = 0 时,分组和非分组数据的时刻\mu^'_0 = 1

Python 中的原始时刻–

# data points
time = [15, 25, 18, 36, 40, 28, 30, 32, 23,
       22, 21, 27, 31, 20, 14, 10, 33, 11, 7, 13]

# Moment for r = 1
moment = sum(time)/len(time)

中心时刻–

变量 X 关于算术平均值(\overline{x})的矩称为中心矩,定义为:

对于未分组的数据,\mu_r = \frac{1}{n}\sum_{i=1}^{n}(x_i-\overline{x})^r

对于分组数据,\mu_r = \frac{1}{n}\sum_{i=1}^{n}f_i (x_i-\overline{x})^r

其中n = \sum_{i=1}^{k}f_i  \overline{x} = \sum_{i=1}^{k}f_ix_i

备注:

- > 我们用 1 代替 r 就可以找到第一个原始矩(\mu_1),用 2 代替 r 就可以找到第二个原始矩(\mu_2)以此类推。 - > 当 r = 0 时的时刻\mu_0 = 1,以及当 r = 1 时的时刻\mu_1 = 0对于分组和未分组的数据。

# data points
time = [15, 25, 18, 36, 40, 28, 30, 32, 23, 22,
       21, 27, 31, 20, 14, 10, 33, 11, 7, 13]

# Mean 
A = sum(time)/len(time)

# Moment for r = 1
moment = (sum([(item-A) for item in time]))/len(time)

原始时刻和中心时刻之间的关系–