辨識

N P
真實N TN FP
真實P FN TP

sensitivity=recall=TP真實P{\rm sensitivity}={\rm recall}=\frac{TP}{真實P}\\
specificity=TN真實N{\rm specificity}=\frac{TN}{真實N}\\
precision=TPP{\rm precision}=\frac{TP}{P}
Fscore=2recallprecisionrecall+precision{\rm F-score}=\frac{2 {\rm recall}\cdot {\rm precision}}{{\rm recall+precision}}

勝算比

odds=成功機率失敗機率{\rm odds}=\frac{成功機率}{失敗機率}

先驗勝算

篩檢前宣稱所有人都病,成功率為有病人數

oddsbefore=有病機率沒病機率=有病人數沒病人數{\rm odds_{before}}=\frac{有病機率}{沒病機率}=\frac{有病人數}{沒病人數}

後驗勝算

宣稱篩檢陽性的有病,成功率即精確度(precision)

oddsbefore=precision1precision真陽性人數偽陽性人數{\rm odds_{before}}=\frac{precision}{1-precision}=\frac{真陽性人數}{偽陽性人數}

Likelihood ratio

定義:
oddsafter=oddsbefore×Likelihood ratio{\rm odds_{after}}={\rm odds_{before}}\times {\rm Likelihood\ ratio}

=oddsbefore×有病裏面被篩出陽性的比例沒病裏面被篩出陽性的比例={\rm odds_{before}}\times\frac{\rm 有病裏面被篩出陽性的比例}{\rm 沒病裏面被篩出陽性的比例}\\
所以
Likelihood ratio=有病裏面被篩出陽性的比例沒病裏面被篩出陽性的比例{\rm Likelihood\ ratio}=\frac{有病裏面被篩出陽性的比例}{沒病裏面被篩出陽性的比例}

RoC Curve 上一點斜率

二項分布

n次中k次
f(k,n,p)=Pr(X=k)=(nk)pk(1p)nkE[X]=npVar[X]=np(1p).f(k,n,p)=\Pr(X=k)={n \choose k}p^{k}(1-p)^{n-k}\\ \operatorname {E} [X]=np\\ \operatorname {Var} [X]=np(1-p).

Beta distribution

定義在(0,1)區間的連續機率分布,有兩個母數α,β>0\alpha ,\beta >0,即為先驗成功與失敗。把發生率p當作變數(x),在現有數據下去預測p值是多少(即再做一次實驗),所以維護E[X]=αα+β\operatorname {E} [X]=\frac{\alpha}{\alpha +\beta}, 變異數是二項分佈下的E[Yn]\operatorname{E}[\frac{Y}{n}],所以Var(X)=E(Xμ)2=αβ(α+β)2(α+β+1)\operatorname {Var}(X)=\operatorname {E}(X-\mu )^{2}={\frac {\alpha \beta }{(\alpha +\beta )^{2}(\alpha +\beta +1)}}
f(x;α,β)=xα1(1x)β101uα1(1u)β1du=Γ(α+β)Γ(α)Γ(β)xα1(1x)β1=1B(α,β)xα1(1x)β1{\begin{aligned}f(x;\alpha ,\beta )&={\frac {x^{{\alpha -1}}(1-x)^{{\beta -1}}}{\int _{0}^{1}u^{{\alpha -1}}(1-u)^{{\beta -1}}\,du}}\\[6pt]&={\frac {\Gamma (\alpha +\beta )}{\Gamma (\alpha )\Gamma (\beta )}}\,x^{{\alpha -1}}(1-x)^{{\beta -1}}\\[6pt]&={\frac {1}{{\mathrm {B}}(\alpha ,\beta )}}\,x^{{\alpha -1}}(1-x)^{{\beta -1}}\end{aligned}}

Note

Beta distribution 和二項分佈共軛

Poisson distribution

即做很多次(nn\rightarrow \infty)成功率p的白努力試驗,成功次數λ=np\lambda=np。卜瓦松分布適合於描述單位時間內隨機事件發生的次數的機率分布。

存活率 P(X=0)

P(X=0)=expλ=exphazard×time\operatorname{P(X=0)}=\exp^{-\lambda}=\exp^{-hazard\times time}

Gamma distribution

Poisson 的共軛,描述單位時間發生率分佈
f(x)=βαΓ(α)xα1eβx{\displaystyle f(x)={\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}x^{\alpha -1}e^{-\beta x}}

E[X]=αβ, Var[X]=αβ2\operatorname{E}[X]=\frac{\alpha}{\beta},\ \operatorname{Var}[X]=\frac{\alpha}{\beta^2}

常態分佈

連續分佈,母數 μ,σ2\mu, \sigma^2
f(x)=12πσexp(12(xμσ)2)f(x)=\frac{1}{\sqrt{2\pi\sigma}}\exp(-\frac{1}{2}(\frac{x-\mu}{\sigma})^2)

ϕ(z)=12πexp(z22)Φ(z)=zϕ(x)dx  (查表用)\phi(z)=\frac{1}{\sqrt{2\pi}}\exp(-\frac{z^2}{2})\\ \Phi(z)=\int_{-\infty}^{z} \phi(x)dx \rm\ \ (查表用)

連續性校正

離散化要把離中間的密度分給兩邊。
Example: 逼近Bin Dist

xBin, xN(μ,σ2)P(xn)=P(xn+12)x \sim Bin,\ x'\sim N(\mu, \sigma^2)\\ P(x≤n)=P(x'\leq n+\frac{1}{2})

抽樣分佈

每次抽 n 個sample x1…xn取平均
E(Xˉ)=μVar(Xˉ)= 1n2Var(xi)= σ2nE(\bar{X})=\mu \\ Var(\bar{X})=\ \frac{1}{n^2}\sum Var(x_i) = \ \frac{\sigma^2}{n}

Standard error
Var(Xˉ)Var(\bar{X})

Hoeffding’s inequality
xi[a,b]P(Xˉμt)  exp(2t2n2n(ab)2)x_i \in [a,b]\\ \mathbb{P}(\bar{X}-\mu \geq t)\ \leq\ \exp(-\frac{2t^2n^2}{n(a-b)^2})

中央極限定理
自任何母體中隨機抽取的樣本,其樣本平均數的抽樣分配,在樣本大小足夠大時,會趨近於常態分配。

Example

每次試驗為n次伯努力( x~Bin(1,π) ),成功率μ

Var(xˉ)=π(1π)nVar(\bar{x})=\frac{\pi(1-\pi)}{n}

成功率 (95%區間)
μ+1.96π(1π)n\mu + 1.96 \sqrt{\frac{\pi(1-\pi)}{n}}

假說檢定

假設H0為真,計算實驗結果出現率

Type1 error : H0 對的但被拒絕 (95%以外的情況)

Type2 error : H0 錯的但沒被拒絕

統計檢定力

假設 H1正確,H1中真的拒絕H0的比例 (1-β,紅色)

樣本數估計

C=μ0+Zασn(Critical value)C=\mu_0+Z_\alpha\frac{\sigma}{\sqrt{n}}\qquad({\rm Critical\ value})

Z1β=(Cμ1)/(σn)(統計檢定力)Z_{1-\beta}=(C-\mu_1)/(\frac{\sigma}{\sqrt{n}})\qquad (統計檢定力)

n=[Z1α+Z1βσ1(μ0μ1)]2=[Z1α+Z1βEffect size]2\Rightarrow n=[\frac{Z_{1-\alpha}+Z_{1-\beta}}{\sigma^{-1}(\mu_0-\mu_1)}]^2=[\frac{Z_{1-\alpha}+Z_{1-\beta}}{\rm Effect\ size}]^2

Z test

已知變異數 σ2,欲驗證差異 d。問達到檢定力 1-β,顯著水準 α需多少樣本 n?
n=[Z1α+Z1βσ1d]2n=[\frac{Z_{1-\alpha}+Z_{1-\beta}}{\sigma^{-1}d}]^2

Z test

假說檢定

H0: xN(μ,σ2)H_0:\ x\sim N(\mu,\sigma^2)
對於n個次試驗 xix_{i}

Var(xˉ)=nσ2n2 Zvalue=xˉμσxˉ=xˉμσ/nN(1,0)\begin{aligned} &Var(\bar{x})=\frac{n\sigma^2}{n^2}\\ \Rightarrow\ & {\rm Z-value}\\ &=\frac{\bar{x}-\mu}{\sigma_{\bar{x}}}=\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\sim N(1,0) \end{aligned}

T test

t-distribution

n 個 sample xi(自由度為n-1,因為用平均值正規化)

S2=(xixˉ)2n1S^2=\frac{\sum(x_i-\bar{x})^2}{n-1}

假說檢定

H0: xN(μ,σ2)H_0:\ x\sim N(\mu,\sigma^2)
對於n個次試驗 xix_{i}

Var(xˉ)=nσ2n2 xˉμσxˉ=xˉμσ/nN(1,0)\begin{aligned} &Var(\bar{x})=\frac{n\sigma^2}{n^2}\\ \Rightarrow\ &\frac{\bar{x}-\mu}{\sigma_{\bar{x}}}=\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\sim N(1,0) \end{aligned}

母群σ2未知 → 用樣本變異數 S2
sample t-value= xˉμS/自由度T(自由度)\frac{\bar{x} - \mu}{S/\sqrt{自由度}} \sim T(自由度)

Tip

二項、Poisson 變異數不是母數,只需要Z test

χ test

χ²-distribution

Define

k個隨機變數 Zi 是相互獨立、且
ZiN(0,1)Z_i \sim N(0,1)

X=Zi2X=\sum Z_i^2

Xχ2(k)X \sim \chi^2(k)

Property

E(X)=kVar(X)=2kE(X)=k\\ Var(X)=2k

假說檢定

對於變數 x,n個樣本 xi,H0: σ2 = S2

xixˉσN(0,1)\frac{x_i-\bar{x}}{\sigma} \sim N(0,1)
所以

(n1)S2σ2=i=1k(xixˉσ)2χ2(n1)\frac{(n-1)S^2}{\sigma^2}=\sum_{i=1}^k (\frac{x_i-\bar{x}}{\sigma})^2 \sim \chi^2(n-1)

根據 (n1)S2σ2\frac{(n-1)S^2}{\sigma^2} 對應到的累積機率就有p值 (H0成立機率)

Two sample independent T-test

Y1,Y2平均μ12,且independent ,cov(Y1,Y2)=0cov(Y_1, Y_2)=0
H0: μ12

假設Y1,Y2都來自變異數為σ的母體

把 Y1,Y2 放在一池 Yp

σ2=sp2=Var((n11)S12+(n21)S22n1+n22)\sigma^2=s_p^2=Var(\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2})\\

=(n11)S12n1+n22+(n21)S22n1+n22=\frac{(n_1-1)S_1^2}{n_1+n_2-2}+\frac{(n_2-1)S_2^2}{n_1+n_2-2}

考慮隨機變數μ12 服從常態分佈

E[μ1μ2]=0E[\mu_1-\mu_2]=0

σμ1μ22=σμ12+σμ22=σ12n11+σ22n21=sp2(n11+n21)\begin{aligned} \sigma_{\mu{1}-\mu{2}}^2&=\sigma_{\mu_{1}}^2+\sigma_{\mu{2}}^2\\ &=\sigma_1^2n_{1}^{-1}+\sigma_2^2n_{2}^{-1}\\ &= s_p^2(n_1^{-1}+n_2^{-1}) \end{aligned}

所以

T value=μ1μ2Spn11+n21{\rm T\ value}=\frac{\mu_1-\mu_2}{S_p\sqrt{n_1^{-1}+n_2^{-1}}}

F 分佈

比較亮個樣本的S
S12卡方分佈自由度S_1^2\sim\frac{卡方分佈}{自由度}

fvalue=S1S2{\rm f-value}=\frac{S_1}{S_2}

ANOVA

處理多重比較Type I error

k 組 定義 yi,j 第i組第j個值

SST=i,j(yijyˉˉ)2=i,j(yijyiˉ+yiˉyˉˉ)2=i,j(yijyiˉ)2+i,j(yiˉyiˉˉ)2+i(yiˉyˉˉ)(jyijyiˉ)=i,j(yijyiˉ)2+i,j(yiˉyiˉˉ)2=SSW+SSB\begin{aligned} {\rm SST} =&\sum_{i,j}{(y_{ij}-\bar{\bar{y}})^2}\\ =&\sum_{i,j}{(y_{ij}-\bar{y_i}+\bar{y_i}-\bar{\bar{y}})^2}\\ =&\sum_{i,j}{(y_{ij}-\bar{y_i})^2}+\sum_{i,j}{(\bar{y_{i}}-\bar{\bar{y_i}})^2}+\sum_i (\bar{y_i}-\bar{\bar{y}})(\sum_j y_{ij}-\bar{y_i})\\ =&\sum_{i,j}{(y_{ij}-\bar{y_i})^2}+\sum_{i,j}{(\bar{y_{i}}-\bar{\bar{y_i}})^2}\\ =&{\rm SSW + SSB} \end{aligned}

檢定 SSB(df=k-1) , SSW(df=n-k) (單尾)

MSB=SSB/k1MSW=SSW/nkMSB=SSB/k-1\\ MSW=SSW/n-k

F=MSBMSWF值 = \frac{MSB}{MSW}

t2=F1,n

RCT

隨機分派
單變因,A組, B組則
H0: PA=PB=PA+B

A B
yA yB
nA-yA nB-yB

yABin(nA,PA)y_A\sim Bin(n_A,P_A)

Pearson’s chi-squared test

當nA夠大,A,B獨立

Z(yA)=yAnAPAnAPA(1PA)Z(y_A)=\frac{y_A-n_AP_A}{\sqrt {n_AP_A(1-P_A)}}

PA+QA=1,wA=(nAyA)P_A+Q_A=1, w_A=(n_A-y_A)

Z(yA)2=(yAnAPA)2nAPA+(yAnAPA)2nAQA=(yAnAPA)2nAPA+(wAnAQA)2nAQA\begin{aligned} Z(y_A)^2&=\frac{(y_A-n_AP_A)^2}{n_AP_A} + \frac{(y_A-n_AP_A)^2}{n_AQ_A}\\ &=\frac{(y_A-n_AP_A)^2}{n_AP_A} + \frac{(w_A-n_AQ_A)^2}{n_AQ_A}\\ \end{aligned}

Z(yA)NZ(yA)2χ(1)2\begin{aligned} Z(y_A)\sim N &\Rightarrow Z(y_A)^2 \sim \chi^2_{(1)}\\ \end{aligned}

若R × C表格 ,自由度 df=(R-1)× (C-1)

(Oi,jEi,j)2Ei,jdfZ(yi)2χ(df)2\sum \frac{(O_{i,j}-E_{i,j})^2}{E_{i,j}}\sum_{df}Z(y_i)^2\sim \chi^2_{(df)}

H0為真,Pi=PjP_i=P_j

Fisher exact test

A,B獨立,有一格小於5,視為無母數,從樣本空間中抽出n相異成員
H0: PA=PB
已知樣本空間 n=nA+nB人中y=yA+yB個✓,那麼隨機抽nA人,yA個✓機率

P(yA)=(yyA)(nynAyA)(nyA)=y!(ny)!nA!nB!n!yA!yB!(nAyA)!(nByB)!P(y_A)=\frac{ {y \choose y_A}{n-y \choose {n_A-y_A}} }{n\choose {y_A}}=\frac{y!(n-y)!n_A!n_B!}{n!y_A!y_B!(n_A-y_A)!(n_B-y_B)!}

pvalue=P(y)P(yA)P(y)p-value=\sum_{P(y)\leq P(y_A)} P(y)

McNemar

A,B樣本相依,無母數,檢驗A,B一致?

A -
小計
B a b TB
c d FB
小計 TA FA total

H0: PA=PB ⇒ a+c=a+b, b=c

Let b+c=nDb+c=n_D, by H0,P(BnD)=1/2H_0, P(B|n_D)=1/2

thus, bBin(nD,1/2)b \sim Bin(n_D,1/2)

z2=(bnD2)2nD4χ(1)2Pvalue=b不比b正常Bin(nD,0.5)(x=b)\begin{aligned} &\Rightarrow z^2=\frac{(b-\frac{n_D}{2})^2}{\frac{n_D}{4}}\sim \chi^2_{(1)}\\ &P-value=\sum_{b'不比b正常} Bin_{(n_D, 0.5)}(x=b') \end{aligned}

Kappa

A,B樣本相依,檢驗A,B一致?
n 個樣本

PE=(TATB+FAFB)n2,P(A=B)=a+dnP_E=(T_AT_B+F_AF_B)n^{-2}, P(A=B)=\frac{a+d}{n}

κ=P(A=B)PE1PE\kappa=\frac{P(A=B)-P_E}{1-P_E}

Survival Analysis

觀測生存時間 T ,存活率函數
S(t)=P(T>t)S(t)=P(T>t)

pdf:
f(t)=limδ0P(T[t,t+δ))δ=ddtS(t)f(t)=\lim_{\delta\rarr0}\frac{P(T\in [t,t+\delta))}{\delta}=-\frac{d}{dt}S(t)

風險(活著的人出事機率)
h(t)=limδ0P(T[t,t+δ)T>t)δ=f(t)S(t)=ddtlog[S(t)]\begin{aligned} h(t)&=\lim_{\delta\rarr0}\frac{P(T\in [t,t+\delta) | T>t)}{\delta}\\ &=\frac{f(t)}{S(t)}=-\frac{d}{dt}log[S(t)] \end{aligned}

Log-rank test

無母數檢定統計量 χ2(k-1)
S(t)=iti月存活率S(t)=\prod_{i\leq t} 第i月存活率

每一個出事的存活死亡算Pearson’s chi-squared test

Exponential function

假設 T~Exp(λ), h(t)=λ
S(t)=exp(λt)S(t)=\exp(-\lambda t)
f(t)=λexp(λt)f(t)=\lambda \exp(-\lambda t)

回歸

無法RCT的情況

線性回歸

Out come y is cont.
對於數據 xi,yix_i,y_i
假設∀ x, y~N (μ(x),σ(x)2 )

y^=E(yx)=α^+β^x\hat{y}=E(y|x)=\hat{\alpha}+\hat{\beta}x

α^,β^\hat{\alpha},\hat{\beta}使得 d=i(yiy^)2d=\sum_i (y_i-\hat{y})^2最小


{0=δdδα^i(yiα^β^xi)2=i2(α^+β^xiyi)=2n(α^(yˉβ^xˉ))0=δdδβ^i(yiα^β^xi)2=i2(xi2β^(yiα^)xi)=2(β^ixi2iyixi+α^ixi)\begin{equation} \nonumber \left\{ \begin{aligned} 0&=\frac{\delta d}{\delta\hat{\alpha}}\sum_{i}(y_i-\hat{\alpha}-\hat{\beta}x_i)^2\\ &=\sum_i 2(\hat{\alpha}+\hat{\beta}x_i-y_i)\\ &=2n(\hat{\alpha}-(\bar{y}-\hat{\beta}\bar{x}))\\ 0&=\frac{\delta d}{\delta\hat{\beta}}\sum_{i}(y_i-\hat{\alpha}-\hat{\beta}x_i)^2\\ &=\sum_i 2(x_i^2\hat{\beta}-(y_i-\hat{\alpha})x_i)\\ &=2(\hat{\beta}\sum_i x_i^2-\sum_i y_ix_i+\hat{\alpha}\sum_i x_i) \end{aligned} \right. \end{equation}

{α^=yˉβ^xˉβ^=ixiyiα^ixiixi2\Rarr \begin{equation*} \left\{ \begin{aligned} \hat{\alpha}&=\bar{y}-\hat{\beta}\bar{x}\\ \hat{\beta}&=\frac{\sum_i x_iy_i -\hat{\alpha}\sum_i x_i}{\sum_i x_i^2}\\ \end{aligned} \right. \end{equation*}

{α^=yˉβ^xˉβ^=xˉyˉxyˉxˉ2x2ˉ=(xixˉ)(yiyˉ)(xixˉ)2\Rarr \begin{equation*} \left\{ \begin{aligned} \hat{\alpha}&=\bar{y}-\hat{\beta}\bar{x}\\ \hat{\beta}&=\frac{\bar{x}\bar{y}-\bar{xy}}{\bar{x}^2-\bar{x^2}}=\frac{\sum(x_i-\bar{x})(y_i-\bar{y})}{\sum(x_i-\bar{x})^2} \end{aligned} \right. \end{equation*}

所以

yi^=α^+β^xi=yˉ+β^(xixˉ)\hat{y_i}=\hat{\alpha}+\hat{\beta} x_i= \bar{y} + \hat{\beta}(x_i-\bar{x})

誤差

對於所有yiy_i與零假設模型(yi=yˉy_i=\bar{y})誤差SSTSS_{T}能被拆成:

  1. 所有yiy_i和回歸模型的誤差,即yiy_iyi^\hat{y_i}的誤差 SSESS_{E}
  2. 線性回歸和零假設模型的誤差,即yi^\hat{y_i}yˉ\bar{y}的誤差 SSRSS_{R}

因為

SST=(yiyˉ)2=[(yiyi^)+(yi^yˉ)]2=SSE+SSR+(yiyi^)(yi^yˉ)\begin{aligned} SS_{T}&=\sum (y_i-\bar{y})^2\\ &=\sum[(y_i-\hat{y_i})+(\hat{y_i}-\bar{y})]^2\\ &=SS_{E}+SS_{R}+\sum (y_i-\hat{y_i})(\hat{y_i}-\bar{y})\\ \end{aligned}

其中

(y^iyˉ)(yiy^)=(yˉ+β^(xixˉ)yˉ)(yiyˉβ^(xixˉ))=β^(xixˉ)[yiyˉβ^(xixˉ)]=β^[(xixˉ)(yiyˉ)β^(xixˉ)2]=0SST=SSE+SSR\begin{aligned} \sum (\hat{y}_i-\bar{y})(y_i-\hat{y}) &= \sum (\bar{y}+\hat\beta(x_i-\bar{x})-\bar{y})(y_i-\bar{y}-\hat\beta(x_i-\bar{x})) \\ &= \sum \hat\beta(x_i-\bar{x})[y_i-\bar{y}-\hat\beta(x_i-\bar{x})] \\ &= \hat\beta [\sum (x_i-\bar{x})(y_i-\bar{y}) - \hat{\beta} \sum (x_i-\bar{x})^2 ]\\ &= 0 \\ \Rightarrow SS_{T} &= SS_{E} + SS_{R} \end{aligned}

ANOVA table

比較兩個假說
H0:y=yˉ, H1:y=yˉ+β^(xixˉ)H_0: y=\bar{y},\ H_1: y=\bar{y} + \hat{\beta}(x_i-\bar{x})
所以組間是 SSR,組內 SSE

因為

SSR=(yi^yˉ)2=β^2(xixˉ)2已知SS_{R}=\sum(\hat{y_i}-\bar{y})^2=\hat{\beta} ^2\underbrace{\sum(x_i-\bar{x})^2}_{已知}
β^N(0,σ2)\hat\beta \sim N(0,\sigma^2),所以 SSR常數χ12\frac{SS_R}{常數}\sim \chi^2_1

F值對到的 p-value 就是H0與H1沒差的機率

相關係數

|r|越大越相關
r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r=\frac{\sum (x_i-\bar x )(y_i-\bar y )}{\sqrt{\sum(x_i-\bar x )^2 \cdot \sum (y_i-\bar y)^2}}

Two sample t-test?

Since r2=SSRSSTF=SSR/1SSE/(n2)=(n2)β^2SSxSSy=β^(n2)S\begin{aligned} &\text{Since } r^2 = \frac{SS_{R}}{SS_{T}} \\ F&=\frac{SS_{R}/1}{SS_{E}/(n-2)} = (n-2)\frac{\hat{\beta} ^2 SS_x}{SS_y}\\ &=\frac{\hat{\beta}}{(n-2)S} \end{aligned}

Logistic Regression

對於二元變量 y
logit(P(y=1))=log(odds)logit(P(y=1))=log(odds)
回歸:

logit(P)=α^+β^xlogit(P)=\hat{\alpha}+\hat{\beta}x

當 x 為二元變數

log(OR)=log(odds(x=1)odds(x=0))=β^log(OR)=log(\frac{odds(x=1)}{odds(x=0)})=\hat{\beta}

β^\hat{\beta} 會常態分布,所以給定 Se(β^)Se(\hat{\beta}) ,就能算 β^\hat{\beta} 信賴區間

假說檢定

檢定 OR 跟 1的差別

所以
tvalue=log(OR)log(1)Se(OR)=β^Se(β^)tvalue=\frac{log(OR)-log(1)}{Se(OR)}=\frac{\hat{\beta}}{Se(\hat{\beta})}

當 x 為連續變數

危險性

OR=odds(x=n+1)odds(x=n)=exp(β^)OR=\frac{odds(x=n+1)}{odds(x=n)}=\exp(\hat{\beta})

Poisson regresion

link function: g(μ)=log(λ)