Modèle beta-binomial

N`oubliez pas que ce changement dans les postérieurs n`affectera pas seulement les estimations rétrécis. Cela affectera toutes les façons dont nous avons utilisé les distributions postérieures dans cette série: des intervalles crédibles, des probabilités d`erreurs postérieures et des comparaisons A/B. L`amélioration du modèle en tenant compte de l`AB aidera tous ces résultats à refléter plus fidèlement la réalité. Les estimations de vraisemblance maximales peuvent être trouvées numériquement les auteurs décrivent comment utiliser une régression bêta-binomiale pour modéliser le choix des médecins VA du vétéran de Medicare-eligilbe chez les médecins non-VA. Plus précisément, les auteurs utilisent une approche binomiale à effet fixe négative (xtnbreg), développée par Guimaraes (Guimaraes 2005) dans Stata. où ρ = 1 α + β + 1 {displaystyle rho = {tfrac {1} {alpha + beta + 1}} !}. Le paramètre ρ {displaystyle rho !} est connu sous le nom de corrélation “intra-classe” ou “intra-cluster”. C`est cette corrélation positive qui donne lieu à une surdispersion. Nous pouvons également utiliser la méthode des attentes itéré pour trouver la valeur attendue des moments marginaux. Écrivons notre modèle en tant que modèle d`échantillonnage composé en deux étapes. Let Ki être le nombre de succès de ni essais pour l`événement i: on peut estimer la valeur des paramètres de forme a et b et la moyenne μ comme suit: Si vous avez une certaine expérience avec régressions, vous remarquerez peut-être un problème avec ce modèle : $ mu $ peut théoriquement aller en dessous de 0 ou au-dessus de 1, ce qui est impossible pour une distribution $ beta $ (et conduira à des paramètres illégaux $ alpha $ et $ beta $). Ainsi, dans un modèle réel, nous utiliseraient une fonction de liaison, telle que la fonction logistique, pour garder $ mu $ entre 0 et 1.

J`ai utilisé un modèle linéaire (et MU. Link = “identité” dans l`appel gamlss) pour rendre les mathématiques dans cette introduction plus simple, et parce que pour ces données particulières, il conduit à presque exactement la même réponse (essayez-le). Dans notre prochain post, nous inclurons le lien logistique. ↩ Souvent, on va observer le cluster de données autour de deux points différents. Cette distribution est connue sous le nom de distribution bimodale. Une distribution bimodale pourrait se produire, par exemple, lorsque les patients ont deux choix de prestataires de soins de santé, et les données mesurent la part de temps que les patients utilisent l`un des fournisseurs. Ce modèle particulier est appelé régression bêta-binomiale. Nous avons déjà eu chaque joueur représenté avec un binôme dont le paramètre a été tiré d`une version bêta, mais maintenant nous permetons à la valeur attendue de la bêta d`être influencé. Ensuite, nous définissons la moyenne des ouate et les observées comme avant: ici, tout ce que nous devons calculer sont les paramètres MU (c`est-à-dire,) et Sigma () pour chaque personne. (Ici, Sigma sera le même pour tout le monde, mais cela peut ne pas être vrai dans les modèles plus complexes). Cela peut être fait en utilisant la méthode ajustée sur l`objet gamlss (voir ici): puisque nous avons maintenant des estimations de point de paramètre, μ ^ {displaystyle {hat {mu}}} et M ^ {displaystyle {widehat {M}}}, pour la distribution sous-jacente, nous aimerions trouver une estimation de point θ ~ DisplayStyle {tilde {Theta}} _ {i}} pour la probabilité de succès pour l`événement i.