Bayesove mreže: definicija, primjeri i kako rade

2026 Autor: Angel Austin | [email protected]. Zadnja izmjena: 2025-01-23 12:20:58

Uvjerenje, mreža odluka, Bayesian (ian) model ili vjerovatno vođen model acikličkog grafa je varijantna shema (vrsta statističkog modela) koja predstavlja skup varijabli i njihovih uvjetnih ovisnosti kroz usmjereni aciklički graf (DAG).

Na primjer, Bayesova mreža može predstavljati vjerovatnoće veze između bolesti i simptoma. S obzirom na potonje, mreža se može koristiti za izračunavanje mogućnosti različitih bolesti. U videu ispod možete vidjeti primjer Bayesove mreže vjerovanja sa proračunima.

efikasnost

Efikasni algoritmi mogu izvesti zaključivanje i učenje na Bayesovim mrežama. Mreže koje modeliraju varijable (kao što su govorni signali ili sekvence proteina) nazivaju se dinamičkim mrežama. Generalizacije Bayesovih mreža koje mogu predstavljati i rješavati probleme pod neizvjesnošću nazivaju se dijagrami utjecaja.

Essence

FormalnoBayesove mreže su DAG-ovi čiji čvorovi predstavljaju varijable u Bayesovom smislu: mogu biti promatrane vrijednosti, skrivene varijable, nepoznati parametri ili hipoteze. Jer je veoma zanimljivo.

primjer Bayesian mreže

Dva događaja mogu uzrokovati kvašenje trave: aktivna prskalica ili kiša. Kiša direktno utiče na upotrebu prskalice (naime, kada pada kiša, prskalica je obično neaktivna). Ova situacija se može modelirati korištenjem Bayesove mreže.

Simulacija

Budući da je Bayesova mreža potpuni model za svoje varijable i njihove odnose, može se koristiti za odgovor na probabilistička pitanja o njima. Na primjer, može se koristiti za ažuriranje znanja o stanju podskupa varijabli kada se promatraju drugi podaci (varijable dokaza). Ovaj interesantan proces se zove probabilistički zaključak.

A posteriori daje univerzalno dovoljnu statistiku za aplikacije za otkrivanje kada se biraju vrijednosti za podskup varijabli. Stoga se ovaj algoritam može smatrati mehanizmom za automatsku primjenu Bayesove teoreme na složene probleme. Na slikama u članku možete vidjeti primjere Bayesovih mreža vjerovanja.

Izlazne metode

Najčešće metode egzaktnog zaključivanja su: eliminacija varijabli, koja eliminiše (integracijom ili zbrajanjem) neuočljivoparametri bez upita jedan po jedan dodjeljivanjem iznosa proizvodu.

Kliknite na propagaciju "stabla" koje kešira proračune tako da se mnoge varijable mogu ispitivati odjednom i novi dokazi mogu brzo propagirati; i rekurzivno uparivanje i/ili pretraživanje, koji omogućavaju kompromise između prostora i vremena i odgovaraju efikasnosti eliminacije varijabli kada se koristi dovoljno prostora.

Sve ove metode imaju posebnu složenost koja eksponencijalno zavisi od dužine mreže. Najčešći aproksimativni algoritmi zaključivanja su eliminacija mini-segmenata, ciklično širenje uvjerenja, generalizirano širenje uvjerenja i varijacione metode.

Umrežavanje

Da bi se u potpunosti specificirala Bayesova mreža i tako u potpunosti predstavila zajedničku distribuciju vjerovatnoće, potrebno je za svaki čvor X specificirati distribuciju vjerovatnoće za X prema roditeljima X.

Distribucija X uslovno od strane njegovih roditelja može imati bilo koji oblik. Uobičajeno je raditi sa diskretnim ili Gausovim distribucijama jer to pojednostavljuje proračune. Ponekad su poznata samo ograničenja distribucije. Zatim možete koristiti entropiju da odredite pojedinačnu distribuciju koja ima najveću entropiju s obzirom na ograničenja.

Slično, u specifičnom kontekstu dinamičke Bayesove mreže, uslovna distribucija za vremensku evoluciju latentnogstanje je obično postavljeno da maksimizira stopu entropije implicitnog slučajnog procesa.

Direktno maksimiziranje vjerovatnoće (ili posteriorne vjerovatnoće) često je teško s obzirom na prisustvo neopaženih varijabli. Ovo posebno vrijedi za Bayesovu mrežu odlučivanja.

Klasični pristup

Klasični pristup ovom problemu je algoritam maksimizacije očekivanja, koji naizmenično izračunava očekivane vrijednosti neopaženih varijabli zavisnih od posmatranih podataka s maksimiziranjem ukupne vjerovatnoće (ili posteriorne vrijednosti), pod pretpostavkom da je prethodno izračunata očekivana vrijednost vrijednosti su tačne. U uslovima umerene pravilnosti, ovaj proces konvergira u maksimalnim (ili maksimalnim a posteriori) vrednostima parametara.

Kompletniji Bayesov pristup parametrima je da ih tretiramo kao dodatne neopažene varijable i izračunamo punu posteriornu distribuciju po svim čvorovima s obzirom na posmatrane podatke, a zatim integrišemo parametre. Ovaj pristup može biti skup i rezultirati velikim modelima, čineći klasične pristupe podešavanju parametara pristupačnijim.

U najjednostavnijem slučaju, Bayesovu mrežu definira stručnjak, a zatim se koristi za izvođenje zaključivanja. U drugim aplikacijama, zadatak određivanja je pretežak za čovjeka. U ovom slučaju, struktura Bayesove neuronske mreže i parametri lokalnih distribucija moraju se naučiti među podacima.

Alternativni metod

Alternativni metod strukturiranog učenja koristi pretragu optimizacije. Ovo zahtijeva primjenu funkcije evaluacije i strategije pretraživanja. Uobičajeni algoritam za bodovanje je posteriorna vjerovatnoća strukture date podatke o obuci kao što su BIC ili BDeu.

Vrijeme potrebno za iscrpnu pretragu koja vraća strukturu koja maksimizira rezultat je supereksponencijalno u broju varijabli. Strategija lokalnog pretraživanja pravi inkrementalne promjene kako bi poboljšala procjenu strukture. Friedman i njegove kolege razmatrali su korištenje uzajamnih informacija između varijabli kako bi pronašli željenu strukturu. Oni ograničavaju skup roditelja kandidata na k čvorova i detaljno ih pretražuju.

Naročito brza metoda za tačno proučavanje BN je zamisliti problem kao problem optimizacije i riješiti ga korištenjem cjelobrojnog programiranja. Ograničenja acikličnosti se dodaju celobrojnom programu (IP) tokom rešavanja u obliku reznih ravni. Takva metoda može riješiti probleme do 100 varijabli.

Rješavanje problema

Za rješavanje problema s hiljadama varijabli potreban je drugačiji pristup. Jedan je prvo odabrati jedan red, a zatim pronaći optimalnu BN strukturu s obzirom na taj red. To podrazumijeva rad u prostoru pretraživanja mogućeg uređenja, što je zgodno jer je manji od prostora mrežnih struktura. Zatim se bira i procjenjuje nekoliko narudžbi. Ova metoda se pokazalanajbolje dostupno u literaturi kada je broj varijabli ogroman.

Druga metoda je fokusiranje na podklasu dekompobilnih modela za koje su MLE-ovi zatvoreni. Tada možete pronaći konzistentnu strukturu za stotine varijabli.

Proučavanje Bayesovih mreža sa ograničenom širinom od tri linije je neophodno da bi se obezbedio tačan, interpretabilan zaključak, budući da je najgori slučaj složenosti potonjeg eksponencijalan u dužini stabla k (prema hipotezi eksponencijalnog vremena). Međutim, kao globalno svojstvo grafa, on uvelike povećava složenost procesa učenja. U ovom kontekstu, K-stablo se može koristiti za efikasno učenje.

Razvoj

Razvoj Bayesove mreže povjerenja često počinje stvaranjem DAG-a G tako da X zadovoljava lokalno Markovljevo svojstvo u odnosu na G. Ponekad je ovo kauzalni DAG. Procjenjuju se distribucije uslovne vjerovatnoće svake varijable preko njenih roditelja u G. U mnogim slučajevima, posebno kada su varijable diskretne, ako je zajednička distribucija X proizvod ovih uslovnih distribucija, tada X postaje Bayesova mreža u odnosu na G.

Markovljev "knot blanket" je skup čvorova. Markov jorgan čini čvor nezavisnim od ostatka praznog dela čvora sa istim imenom i dovoljno je znanja za izračunavanje njegove distribucije. X je Bayesova mreža u odnosu na G ako je svaki čvor uslovno nezavisan od svih ostalih čvorova, s obzirom na njegov Markovianćebe.