وبلاگ علمی دنفر

ریاضیات و فیزیک ، جهانی جدا

وبلاگ علمی دنفر

ریاضیات و فیزیک ، جهانی جدا

وبلاگ علمی دنفر

وارد علـم شو ،
تا از مـا شوی !

کلمات کلیدی

تابع چگالی احتمال

دوشنبه, ۷ دی ۱۳۹۴، ۰۱:۴۶ ب.ظ

در آمار و احتمالات تابع چگالی احتمال به تابعی اطلاق می‌شود که توزیعی آماری را به شکل انتگرالی نمایش دهد. مقدار این تابع غیر منفی است.

توزیع پیوسته یک متغیره

 
تابع توزیع نرمال N(0, σ2).

احتمال آنکه متغیر تصادفی در بازه [a,b] واقع شود از رابطهٔ زیر بدست می‌آید:

\Pr(a \leq X \leq b) =\int_a^b f(x)\,dx

همچنین کل مساحت زیر نمودار برابر است با ۱؛ یعنی:

 \int_{-\infty}^\infty \,f(x)\,dx = 1

در نتیجه تابع توزیع تجمعی را می‌توان بصورت زیر نوشت:

F(x) = \int_{-\infty}^x f(u) \, \mathrm{d}u ,

و اگر f تابعی پیوسته باشد:

 f(x) = \frac{\mathrm{d}}{\mathrm{d}x} F(x) .

تعریف

متغیر تصادفی X را در نظر بگیرید که مقدار آن در فضای اندازه (\mathcal{X}, \mathcal{A}) تعریف شده و توزیع احتمال آن اندازه XP در (\mathcal{X}, \mathcal{A}) است، آنگاه چگالی X نسبت به اندازه مرجع μ در (\mathcal{X}, \mathcal{A}) بواسطهمشتق رادون−نیکودیم به شکل زیر تعریف می‌شود:

f = \frac{\mathrm d X_*P}{\mathrm d \mu} .

بعبارت دیگر، به ازای هر مجموعه اندازه‌پذیر A \in \mathcal{A}، f می‌تواند هر تابع قابل اندازه‌گیری با ویژگی زیر باشد:

\Pr [X \in A ] = \int_{X^{-1}A} \, \mathrm d P = \int_A f \, \mathrm d \mu

برخلاف احتمالی که به یک متغیر تصادفی گسسته نسبت داده می شود، تابع چگالی احتمال می تواند مقادیر بیشتر از یک را نیز اختیار کند. به طور مثال توزیع یکنواخت در بازه [1/2 ,0] چگالی احتمالی f(x) = 2 برای 0 ≤ x ≤ ½ دارد و f(x) = 0 برای خارج این بازه دارد با داشتن تابع چگالی احتمالی متغیر تصادفی X می توان مقدار امید ریاضی آن را به شکل زیر محاسبه کرد


    \operatorname{E}[X] = \int_{-\infty}^\infty x\,f(x)\,dx.

چند روش محاسبه

از روش های بدست آوردن تابع چگالی احتمالی متغیر تصادفی X مشتق گیری از تابع توزیع تجمعی (FX(x آن است و که به صورت زیر تعریف می شود x \to F_X(x) = \operatorname{P}(X\leq x)


    \frac{d}{dx}F(x) = f(x).

یک روش دیگر برای بدست آوردن تابع چگالی احتمالی متغیر تصادفی X تخمین مقدار آن در یک بازه کوچک مانند  [x, x + \varepsilon] : است.


    \Pr(x<X<x+\varepsilon) = f(t)\,\varepsilon.

یا به عبارت دیگر 
\lim_{\varepsilon \to 0} P(x <X <x + \varepsilon) / \varepsilon 
 :

رابطه بین توزیع های گسسته و پیوسته

می توان بعضی از متغیر های تصادفی گسسته را نیز با استفاده از تابع چگالی احتمالی توصیف کرد. به طور مثال برای متغیر تصادفی که دو مقدار 1 و -1 را هر کدام با احتمال 1/2 می گیرد، می توان چگالی احتمال زیر را نسبت داد

f(t) = \frac{1}{2}(\delta(t+1)+\delta(t-1)).

به طور کلی اگر متغیر تصادفی n مقدار حقیقی را اختیار کند می توان تابع چگالی احتمای آن را به این شکل نوشت

f(t) = \sum_{i=1}^np_i\, \delta(t-x_i),

که مقادیر x1, …, xn مقادیری هستند که متغیر تصادفی X با احتمال p1, …, pn اختیار می کند..

چگالی احتمال توابع چند متغیره

برای متغیرهای تصادفی X1, …, Xn همچنین این امکان وجود دارد که یک تابع چگالی چند متغیره تعریف کنیم که به تمامی "X" ها بستگی داشته باشد که به آن تابع چگالی احتمال مشترک (توام) گویند. این تابع چگالی تابع چگالی n متغیره نام دارد به طوری که به ازای هر فضای احتمال "n" بعدی "D" از متغیر های تصادفی x1, …, xn احتمال اینکه این دسته متغیرها در "D" قرار بگیرند، به صورت زیر است:

\Pr \left( X_1,\ldots,X_N \isin D \right) 
 = \int_D f_{X_1,\dots,X_N}(x_1,\ldots,x_N)\,dx_1 \cdots dx_N.

اگر( F(x1, …, xn) = Pr(X1 ≤ x1, …, Xn ≤ xn باشد، به آن توزیع تجمعی احتمال بردار (X1, …, Xn) گوییم که در آنصورت توزیع چگالی احتمال توام از طریق مشتق گیری از آن بدست می آید:


    f(x) = \frac{\partial^n F}{\partial x_1 \cdots \partial x_n} \bigg|_x

چگالی توزیع حاشیه ای

(fXi(xi به ازای i=1, 2, …,n چگالی توزیع حاشیه ای می گوییم که فقط تابع Xi است. میتوان آنرا از طریق انتگرال گیری از توزیع تجمعی نسبت به n-1 متغیر دیگر بدست آورد.

f_{X_i}(x_i) = \int f(x_1,\ldots,x_n)\, dx_1 \cdots dx_{i-1}\,dx_{i+1}\cdots dx_n .

استقلال

تابع توزیع مشترک n متغیره X1, …, Xn مستقل از تک تک آنها مستقل است اگر و تنها اگر:

f_{X_1,\dots,X_n}(x_1,\ldots,x_n) = f_{X_1}(x_1)\cdots f_{X_n}(x_n).

نتیجه فرعی

اگر بتوان تابع توزیع مشترک یک بردار n تایی را به صورت حاصلضرب n تابع تک متغیره نوشت

f_{X_1,\dots,X_n}(x_1,\ldots,x_n) = f_1(x_1)\cdots f_n(x_n),

(لزومی ندارد که هر fi یک چگالی احتمال باشد) در آنصورت n متغیر از یکدیگر مستقل هستند و چگالی توزیع احتمال هریک به صورت زیر محاسبه میشود:

f_{X_i}(x_i) = \frac{f_i(x_i)}{\int f_i(x)\,dx}.

مثال

این مثال ابتدایی حالت ساده دو متغیره از تعریف تابع چکالی احتمال چند متغیره است. فرض کنید فضای \vec R یک فضای دو متغیره با بردار مختصات (XY) است. احتمال اینکه \vec R در کنج مثبت باشد، اینگونه است:

\Pr \left( X> 0, Y> 0 \right)
 = \int_0^\infty \int_0^\infty f_{X,Y}(x,y)\,dx\,dy.

جمع دو متغیر تصادفی مستقل

تابع چگالی احتمال دو متغیر مستقل U و V، که هر یک دارای یک تابع چگالی احتمالند، کانولوشن تابع چگالی تک تک آن هاست:


f_{U+V}(x) = \int_{-\infty}^\infty f_U(y) f_V(x - y)\,dy
= \left( f_{U} * f_{V} \right) (x)

میتوان رابطه بالا را به N متغیر مستقل، با چگالی های U1, …, UN تعمیم داد:


f_{U_{1} + \ldots + U_{N}}(x)
= \left( f_{U_{1}} * \ldots * f_{U_{N}} \right) (x)

متغیرهای وابسته و تغییر متغیر

اگر تابع چگالی احتمال متغیر تصادفی X به صورت (fX(x داده شده باشد، میتوان(ولی معمولاً غیر ضروری است، زیر را مشاهده کنید) تابع چگالی احتمال متغیری مانند (Y = g(X را محاسبه کرد. به این کار "تغییر متغیر" میگویند و در عمل برای تولید متغیر تصادفی با شکل دلخواه fg(X) = fY با استفاده از مولد عدد تصادفی شناخته شده(برای مثال یکنواخت)، مورد استفاده قرار میگیرد.

اگر تابع g یکنواخت باشد، در آنصورت تابع چگالی حاصل به صورت زیر است:

f_Y(y) = \left| \frac{1}{g'(g^{-1}(y))} \right| \cdot f_X(g^{-1}(y)).

در اینجا منظور از g−1، تابع معکوس و منظور از 'g، تابع مشتق است.

این به دنبال این حقیقت ناشی میشود که احتمال در ناحیه مشتق گیری تحت تاثیر تغییر متغیر، باید ثابت بماند. یعنی:

\left| f_Y(y)\, dy\right| = \left| f_X(x)\, dx\right|,

یا

f_Y(y) = \left| \frac{dx}{dy} \right| f_X(x) = \left| \frac{1}{g'(x)} \right| f_X(x) = \left| \frac{1}{g'(g^{-1}(y))} \right|f_X(g^{-1}(y)).

برای توابعی که یکنواخت نیستند، تابع چگالی احتمال "y" به صورت زیر است:

\sum_{k=1}^{n(y)} \left| \frac{1}{g'(g^{-1}_{k}(y))} \right| \cdot f_X(g^{-1}_{k}(y))

که در آن (n(y تعداد جواب های "x" برای رابطه g(x) = y و (g−1k(y ها همان جواب ها هستند.

حال وسوسه انگیز است که در مورد امید ریاضی((E(g(X نیز بیندیشیم. به این منظور ابتدا باید چگالی احتمال( fg(X را برای متغیر تصادفی جدید (Y = g(X بیابیم. به جای محاسبه

 E(g(X)) = \int_{-\infty}^\infty y f_{g(X)}(y)\,dy,

بهتر است

E(g(X)) = \int_{-\infty}^\infty g(x) f_X(x)\,dx.

را محاسبه کرد.

دو انتگرال در تمامی شرایط در حالی که X و (g(X دارای تابع توزیع چگالی باشند، جواب یکسانی دارند. هیچ الزامی وجود ندارد که تابع g یک تابع یک به یک باشد. برخی مواقع انتگرال دوم، بسیار راحت تر از اولی قابل محاسبه است.

متغیرهای چندگانه

فرمول بالا را میتوان به متغیرهایی (که آنها را دوباره y می نامیم) وابسته به چند متغیر تصادفی تعمیم داد. (f(x0x1, …, xm−1 را میتوان به عنوان تابع چگالی احتمال y در نظر گرفت که به آنها وابسته است که این وابستگی به صورت y = g(x0x1, …, xm−1) است. در نتیجه تابع چگالی به صورت زیر بدست می آید:

 \int\limits_{y = g(x_0, x_1, \dots, x_{m-1})} \frac{f(x_0, x_1,\dots, x_{m-1})}{\sqrt{\sum_{j=0}^{j<m}} (\frac{\partial g}{\partial x_j}(x_0, x_1, \dots , x_{m-1}))^2} \; dV

که در آن انتگرال روی m-1 بعد است و باید dV را متناسب با این انتگرال پارامتریزه جایگزین کرد. متغیرهای تصادفی x0x1, …, xm−1 باالتبع توابعی از این پارامتریزه کردن ها هستند.

شاید بصری به نظر برسد، ولی این ناشی از مطلب زیر است: فرض کنید 'x' یک متغیر تصادفی n-بعدی با تابع چگالی احتمال f است. اگر y = H(x) و H تابعی دوسویه و تشخیص پذیر باشد، y دارای چگالی احتمال g است:

g(\mathbf{y}) = f(\mathbf{x})\left\vert \det\left(\frac{d\mathbf{x}}{d\mathbf{y}}\right)\right \vert

که مشتق در نظر گرفته شده، ماتریس ژاکوبی معکوس تابع H نسبت به y است.

با استفاده از تابع دلتا، (و فرض بر استقلال) جواب یکسانی به صورت زیر بدست می آید.

اگر تابع چگالی احتمال متغیرهای تصادفی مستقل Xii = 1, 2, …n به صورت (fXi(xi داده شده باشند، میتوان تابع چگالی احتمال متغیرهایی مانند (Y = G(X1X2, …Xn را حساب کرد. فرمول زیر ارتباطی بین تابع چگالی احتمال y که با (fY(y نشان میدهیم و (fXi(xi با استفاده از تابع دلتای دیراک برقرار میکند:

f_Y(y) = \int_{-\infty}^\infty \int_{-\infty}^\infty \ldots \int_{-\infty}^\infty f_{X_1}(x_1)f_{X_2}(x_2) \ldots f_{X_n}(x_n)\delta(y-G(x_1,x_2,\ldots x_n))\,dx_1\,dx_2\,\ldots dx_n
  • hossein heydari

نظرات  (۱)

I found out that the huge constant CPU load was caused by Google Checker Gmail Plus 10.2 extension. When disabled, it's OK. I am using "Gmail checked plus clussic&qaot; instead which is OK.

ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی