2.11 连续随机变量的变换

如果X是服从连续分布F的随机变量,那么对任意函数gx),Y=gX)仍是随机变量.Y的分布是什么?

首先考虑支撑.如果X的支撑是X且函数gXY,则Y的支撑为Y.例如,如果X的支撑是[0, 1]且gx)=1+2x,则Y=gX)的支撑是[1, 3].如果X的支撑是R+gx)=log(x),则Y=gX)的支撑为R.

Y的概率函数为FYy)=P[Yy]=P[gX)≤y].令By)是集合{x∈R:gx)≤y}.事件{gX)≤y}和{XBy)}是等价的.所以Y的分布函数为

FYy)=P[XBy)]

因此,Y的分布由X的概率函数确定.

gx)单调递增时,gx)有反函数

hy)=g-1y

X=hY)且By)=(-∞, hy)].Y的分布函数为

FYy)=P[Xhy)]=FXhy))

它的密度函数是分布函数的导数.根据链式法则,可得

最后一个等号成立是因为hy)关于y的导数为正.

现考虑gx)单调递减的情况,设其反函数为hy),则By)=[hy),∞),

FYy)=P[Xhy)]=1-FXhy))

它的密度函数是分布函数的导数,

最后一个等号成立是因为hy)关于y的导数为负.

gx)严格单调时,Y的密度为

fYy)=fXg-1y))Jy

其中

称为变换的雅可比行列式(Jacobian).这个概念与微积分中类似.

由此得到下述定理.

定理2.4 XfXx),fx)是X上的连续函数.设gx)严格单调,g-1y)在Y上连续可微,则对所有的yY,都有

fYy)=fXg-1y))Jy

其中.

定理2.4给出了一个变换Y的密度函数的简洁公式.下述四个例子具体说明定理2.4.

例13 fXx)=exp(-x), x≥0.设Y=λXλ>0,即gx)=λx.Y的支撑为Y=[0,∞).设函数gx)是单调递增的,其反函数为hy)=y/λ.雅可比行列式是反函数的导数,

Y的密度函数为

其中y≥0.由于

其中第二个等号通过变量变换x=y/λ得到,故密度是合理的.

例14 fXx)=1,0≤x≤1.设Y=gX),其中gx)=-log(x).由于X的支撑为[0, 1],Y的支撑为Y=(0,∞).函数gx)单调递减,其反函数为

hy)=g-1y)=exp(-y

hy)求导得到雅可比行列式:

注意,fXg-1y))=1,y≥0.计算Y的密度,

fYy)=fXg-1y))Jy)=exp(-y

其中y≥0.这是指数分布的密度函数.也就是说,如果X服从均匀分布,则Y=-log(X)服从指数分布.

例15 X有任意连续可逆(严格递增)的累积分布函数FXx).定义随机变量Y=FXx).Y的支撑为Y=[0, 1]:则在[0,1]上Y的累积分布函数为

求导得概率密度函数:

这是服从U[0, 1]随机变量的密度函数.故YU[0, 1].

变换Y=FXx)被称为概率积分变换(probability integral transformation).无论初始X的分布是什么,该公式都能将Y变换为均匀分布,这个事实是相当奇妙的.

例16fXx)表示图2-7中时薪的密度函数.令Y=log(X).如果X的支撑为R+,则Y的支撑为R,其反函数为hy)=exp(y),雅可比行列式为exp(y).Y的密度为fYy)=fX(exp(y))exp(y).如图2-8所示,该密度函数比时薪的密度更对称,偏度更小.

图2-8 时薪对数的密度函数