Zadanie 1

Należało napisać wzór Bayesa. W najprostszej formie ma ono postać \[P(A|B) = \frac{P(A) \cdot P(B|A)}{P(B)}\] Wzór ten jest ważny ze względów bardzo praktycznych. Interesuje nas P(A|B) np. szansa, że mail zaklasyfikowany jako SPAM rzeczywiście nim jest czy szansa, że mając pozytywny wynik testu na chorobę rzeczywiście jesteśmy chorzy. To wartości, które nie jest łatwo nam mierzyć. Natomiast stosunek liczby wiadmości do SPAM czy szansa rozpoznania SPAMu jest informacją osiągalną, podstawową.

Uwaga

Warto zapamietać, że to jak interpretować wynik testu medycznego, nie zależy jedynie od tego jak jest on skuteczny w przypadku osoby chorej. Równie istotne jest jak często nasz test fałszywie wskazuje wynik pozytywny, a także jak wygląda populacja.

Zadanie 2

Można liczyć takie zadanie z ,,drzewek“, ale w takim wypadku warto jest zadbać o klarowne etykiety w węzłach i liściach teggo drzewa. Na przykład nie należy mieć zarówno węzłów oznaczonych jako ,,SPAM” i ,,NSPAM“. Bardzo łatwo się wtedy pomylić co jest czym.

Bez drzewek rozwiązanie wygląda następująco. Niech zdarzenie A oznacza, że mail został zaklasyfikowany jako SPAM, a B oznacza, że mail faktycznie jest SPAMem.

Chcemy policzyć prawdopodobieńsywo warunkowe \(P(B|A)\). Ze wzoru Bayesa mamy \[P(B|A) = \frac{P(B) \cdot P(A|B)}{P(A)} = \frac{0.2 \cdot 0.95}{P(A)}\] Z kolei, \[P(A) = P(A, B) + P(A, B^T) = P(A|B) \cdot P(B) + P(A|B^T) \cdot P(B^T) = 0.2 \cdot 0.95 + 0.8 \cdot 0.01 = 0.198\]

Czyli ostatecznie nasz wyniki to

0.19/0.198
## [1] 0.959596