Modèle de cloison

R-package: R-package PPMx contenant du code pour effectuer l`inférence pour le modèle décrit dans l`article. La fonction ppmx implémente le modèle de partition aléatoire dépendant du covariable proposé pour une combinaison arbitraire de covariables continues, catégorielles, binaires et de comptage, à l`aide d`un mélange de modèle d`échantillonnage normal pour Yi. Le package est également disponible en téléchargement à partir de http://www.math.utexas.edu/users/pmueller/prog.html. La limite du $ alpha $-permanent comme $ alphato $0 donne la somme des produits cycliques [cyp (K) = lim_{alphaà 0} alpha ^ {-1} per_alpha (K) = sum_{sigma: # sigma = 1} prod_{j = 1} ^ n K_ {sigma (j), j}, ] donnant une expression alternative pour $ alpha $- permanent [per_alpha (K) = sum_{Bin E_n} alpha ^ { #B} prod_{bin B} cyp (K [B]) ] comme somme sur les partitions. La distribution marginale induite (11) sur les partitions est du type de partition de produit recommandé par Hartigan (1990), et est également équivariante. Notez que la matrice $ Theta $ et sa transposition déterminent la même distribution sur les partitions, mais elles ne déterminent généralement pas la même distribution sur les permutations. Le $ alpha $-permanent a une propriété convolution moins évidente qui aide à expliquer pourquoi cette fonction peut être attendue dans les modèles de partition: $ $ label{convolution} sum_{bsous-ensemble [n]} per_alpha (K [b]) per_{alpha`} (K [bar b]) = per_{alpha + Alpha`} (K). tag{9} $ $ nous développons un modèle de probabilité pour le regroupement avec des covariables, c`est-à-dire un modèle de probabilité pour le partitionnement d`un ensemble d`unités expérimentales, où la probabilité d`une partition particulière est autorisée à dépendre de covariables. L`application motivante est l`inférence dans un essai clinique. Le résultat est le temps de progression pour les patients atteints de cancer du sein. Les covariables comprennent la dose de traitement, la charge tumorale initiale, un indicateur de la ménopause, et plus encore. Nous souhaitons définir un modèle de probabilité pour le regroupement des patients avec la caractéristique spécifique que les patients avec des covariables égales ou similaires devraient être a priori plus susceptibles de cogrouper que d`autres.

Dans cet article, nous construisons sur le PPM (1,1) pour définir un modèle de partition aléatoire dépendant de covariables en augmentant le PPM avec un facteur supplémentaire qui induit la dépendance souhaitée sur les covariables. Nous nous référons au facteur additionnel comme fonction de similarité. Des approches similaires sont examinées par Shahbaba et Neal (2009) et Park et Dunson (2010). Les deux ont inclus efficacement les covariables dans le cadre d`un vecteur de réponse augmentée. Nous discutons plus en détail de ces deux approches alternatives et d`autres dans la section 5 où nous effectuons également une petite étude de Monte Carlo pour une comparaison empirique. Cependant, nous ne considérons pas la manière raisonnée d`introduire les covariables dans la PPM comme la principale caractéristique du PPMx. nous soutenons plutôt que le modèle proposé simplifie grandement l`inclusion des covariables, y compris une variété de formats de données. Il serait inutilement difficile de tenter la construction d`un modèle commun pour les réponses continues et les covariables catégorielles, binaires et continues. Nous soutenons qu`il est beaucoup plus facile de se concentrer sur une modification de la fonction de cohésion. Ceci est illustré dans l`exemple d`analyse de données de la section 6. D`un point de vue de modélisation, il est souhaitable de séparer le choix de la précédente sur la partition par rapport au modèle d`échantillonnage conditionnel sur une partition supposée.

Ensuite, nous avons étendu le vecteur covariable pour inclure les six covariables. Dénoter par XI = (XI1,…, xi6) le vecteur covariable à six dimensions.