Header

UZH-Logo

Maintenance Infos

Generalised linear mixed models : likelihood and Bayesian computations with applications in epidemiology


Sauter, Rafael. Generalised linear mixed models : likelihood and Bayesian computations with applications in epidemiology. 2015, University of Zurich, Faculty of Science.

Abstract

Wiederholtes messen desselben Patienten impliziert, dass die erhobenen Beobachtungen nicht unabh¨ ngig sind, da diese von denselben patientenspezifischen Eigenschaften beeinflusst wer- a ¨ den. Ein generalisiertes lineares gemischtes Modell (GLMM) berucksichtigt diese Abh¨ ngig- a ¨ keiten, indem patientenspezifische Modellparameter eingefuhrt werden, die als zuf¨ llige Ef-a fekte bezeichnet werden. Die Struktur der Abh¨ ngigkeiten in den Daten kann Formen anneh- a men, die verschieden sind von der, welche durch wiederholtes beobachten derselben Patien- ten auftritt. Es kann eine zeitliche, r¨ umliche oder zeit-r¨ umliche Abh¨ ngigkeit, im zugrunde a a a liegenden Prozess, vorhanden sein. Auch ein Netzwerk aus verschiedenen Einheiten, die ver- bunden sind und wiederholt beobachtet werden, kann den Einschluss von zuf¨ lligen Effekten a in einem GLMM motivieren. Ein GLMM sch¨ tzt, bei gegebener Struktur der zuf¨ lligen Effekte, den bedingten Erwartungs- a a wert der interessierenden Parameter, die als fixe Effekte bezeichnet werden. Die Likelihood In- a ¨ ferenz bestimmt die bedingten Sch¨ tzwerte durch numerische Integration uber die zuf¨ lligen a ¨ Effekte, da dieses Problem generell nicht analytisch losbar ist. Die numerische Integration ¨ kann rechnerisch schwer losbar sein, je nach Komplexit¨ t der Struktur der zuf¨ lligen Effekte a a ¨ und der verfugbaren Daten. Ein Bayesianischer Inferenz Ansatz bildet die Struktur der zuf¨ lligen Effekt, unter Einschluss a ¨ von Priori-Verteilungen fur diese Parameter, ab. Der Einschluss von Priori-Verteilungen ist ¨ flexibel und kann die unterschiedliche, verfugbare Information auf verschiedenen Ebenen des ¨ Modells abbilden. Bayesianische Inferenz wird ublicherweise mit einer Markov chain Monte ¨ Carlo (MCMC) Simulation durchgefuhrt, die eine grosse Rechenleistung verlangt. Falls der Struktur der zuf¨ lligen Effekte ausschliesslich Gaussche Priori-Verteilungen zugewiesen wer- a den, nur eine zus¨ tzliche Ebene von Hyperparametern und eine beschr¨ nkte Ordnung der a a Abh¨ ngigkeiten zwischen den Einheiten angenommen wird – so dass ein Gaussches Markov a Zufallsfeld resultiert – kann die Methode der integrated nested Laplace approximations (INLA) als Alternative zu MCMC verwendet werden. INLA verlangt weniger Rechenleistung, was ¨ insbesondere fur komplexe Modelle ein Vorteil ist. ¨ Diese Dissertation untersucht beide Inferenz Methoden fur GLMMs, diskutiert damit ver- bundene rechen-technische Aspekte und erl¨ utert diese anhand mehrerer epidemiologischen a ¨ Anwendungen. Als Erstes wird die Likelihood Inferenz fur ein linear gemischtes Modell, ba- sierend auf longitudinale Daten aus der Schweizerischen HIV Kohortenstudie durchgefuhrt. ¨ Das Modell untersucht, ob vorherig beobachtete Lymphozyt-Subtypen relevante Pr¨ diktoren a ¨ fur den Krankheitsverlauf von unbehandelten und behandelten HIV infizierte Patienten sind. Im darauf folgenden Teil wird diskutiert wie die spezielle Situation, bei welcher patienten- ¨ spezifische longitudinale Profile keine Variation in der Ausgangsgrosse haben, die Likelihood und Bayesianische Inferenz mit INLA beeinflussen. Wir zeigen, dass mit einem zunehmenden ¨ Anteil an Patienten, welche keine Variation in der Ausgangsgrosse haben, die Maximum like- lihood (ML) Sch¨ tzung der Parameter, in einem Modell mit einer bin¨ ren Ausgangsgrosse, a a ¨ numerische Probleme verursacht. Weiterhin zeigen wir, dass in einem solchen Fall INLA a a ¨ Sch¨ tzungen generiert, die weder mit ML noch mit MCMC Sch¨ tzungen ubereinstimmen. Im dritten Teil diskutieren wir wie die besondere Abh¨ ngigkeitsstruktur einer Netzwerk Meta- a ¨ Analyse, unter Berucksichtigung der versuchsspezifischen Heterogenit¨ t und moglicher In- a ¨ konsistenzen im Netzwerk, mit INLA implementiert wird. Der letzte Teil der Dissertation untersucht die Verwendung von informativen Priori-Verteilungen, welche adaptive Gewich- ¨ te verwenden, die anhand der beobachteten Daten bestimmt werden. Ublicherweise werden ¨ nicht informative und unkorrelierte Priori-Verteilung fur die fixen Effekte in einem GLMM angenommen. In manchen Situationen kann diese Annahme zu unrealistischen Parameter ¨ Sch¨ tzungen fuhren. Adaptives gewichten der Priori-Verteilungen, basierend auf den beob- a achteten Daten und unter Einschluss von Korrelationen, kann dazu dienen dieses Problem zu beheben. Repeatedly observing the same patient implies that these samples will not be independent, as they are affected by the same common patient-specific characteristics. A generalized linear mixed model (GLMM) takes this dependency structure into account by introducing patient- specific model parameters which are called random effects. The dependency structure in the collected data could have various forms, though other than the one which arises from repeat- edly observing patients in a study population. A temporal, spatial or even spatio-temporal pattern may be present in the underlying sampling process. Or a network of different clusters which are connected and repeatedly observed may motivate the inclusion of random effects in a GLMM. Given the random effect structure, a GLMM investigates the conditional expectation for the parameters of interest, which are called fixed effects. In likelihood inference, the conditional estimates are determined by numerically integrating over the random effects, as in general this problem is not analytically solvable. The numerical integration may be computationally difficult to solve, depending on the complexity of the random effect structure and the data at hand. A Bayesian inference approach maps the random effect structure by including prior distri- butions for these parameters. The inclusion of prior distributions is flexible and may reflect different stages of information at different levels of the model. Bayesian inference is commonly carried out using computationally intensive Markov chain Monte Carlo (MCMC) sampling. If exclusively Gaussian priors are assigned to the random effect structure, with only one addi- tional level of hyperparameters and a limited order of dependencies between clusters – such that a Gaussian Markov random field results – one can apply integrated nested Laplace ap- proximations (INLA). INLA is an alternative to MCMC and requires less computational effort, which especially for complex models is an huge advantage. This thesis investigates both inference approaches for GLMMs, discusses related computa- tional issues and illustrates these with several epidemiological applications. First, likelihood inference is carried out for a model based on longitudinal data from the Swiss HIV cohort study. This model investigates if past lymphocyte subtypes are relevant predictors for the dis- ease progression among untreated and treated HIV infected patients. In the second part we discuss how the special situation, in which patient-specific longitudinal profiles show no vari- ation in the response, influences the likelihood and Bayesian inference with INLA. We show that, with an increasing proportion of patients who have no variation in the response, nu- merical issues arise in the Maximum likelihood (ML) estimation of a binary response GLMM. Furthermore, we show that in this case INLA produces estimates that are inconsistent with ML or MCMC inference. In the third part we discuss how the particular dependency structure of a network meta-analysis is implemented with INLA, taking into account trial specific het- erogeneity and possible network inconsistencies. The last part of the thesis examines the use of informative priors which use adaptive weights that are based on the observed data. Usually the prior distributions for the fixed effects in a GLMM are assumed to be uninformative and uncorrelated. In some situations this assumption may lead to unrealistic parameter estimates. An adaptively weighted informative prior distribution may help to resolve this problem.

Abstract

Wiederholtes messen desselben Patienten impliziert, dass die erhobenen Beobachtungen nicht unabh¨ ngig sind, da diese von denselben patientenspezifischen Eigenschaften beeinflusst wer- a ¨ den. Ein generalisiertes lineares gemischtes Modell (GLMM) berucksichtigt diese Abh¨ ngig- a ¨ keiten, indem patientenspezifische Modellparameter eingefuhrt werden, die als zuf¨ llige Ef-a fekte bezeichnet werden. Die Struktur der Abh¨ ngigkeiten in den Daten kann Formen anneh- a men, die verschieden sind von der, welche durch wiederholtes beobachten derselben Patien- ten auftritt. Es kann eine zeitliche, r¨ umliche oder zeit-r¨ umliche Abh¨ ngigkeit, im zugrunde a a a liegenden Prozess, vorhanden sein. Auch ein Netzwerk aus verschiedenen Einheiten, die ver- bunden sind und wiederholt beobachtet werden, kann den Einschluss von zuf¨ lligen Effekten a in einem GLMM motivieren. Ein GLMM sch¨ tzt, bei gegebener Struktur der zuf¨ lligen Effekte, den bedingten Erwartungs- a a wert der interessierenden Parameter, die als fixe Effekte bezeichnet werden. Die Likelihood In- a ¨ ferenz bestimmt die bedingten Sch¨ tzwerte durch numerische Integration uber die zuf¨ lligen a ¨ Effekte, da dieses Problem generell nicht analytisch losbar ist. Die numerische Integration ¨ kann rechnerisch schwer losbar sein, je nach Komplexit¨ t der Struktur der zuf¨ lligen Effekte a a ¨ und der verfugbaren Daten. Ein Bayesianischer Inferenz Ansatz bildet die Struktur der zuf¨ lligen Effekt, unter Einschluss a ¨ von Priori-Verteilungen fur diese Parameter, ab. Der Einschluss von Priori-Verteilungen ist ¨ flexibel und kann die unterschiedliche, verfugbare Information auf verschiedenen Ebenen des ¨ Modells abbilden. Bayesianische Inferenz wird ublicherweise mit einer Markov chain Monte ¨ Carlo (MCMC) Simulation durchgefuhrt, die eine grosse Rechenleistung verlangt. Falls der Struktur der zuf¨ lligen Effekte ausschliesslich Gaussche Priori-Verteilungen zugewiesen wer- a den, nur eine zus¨ tzliche Ebene von Hyperparametern und eine beschr¨ nkte Ordnung der a a Abh¨ ngigkeiten zwischen den Einheiten angenommen wird – so dass ein Gaussches Markov a Zufallsfeld resultiert – kann die Methode der integrated nested Laplace approximations (INLA) als Alternative zu MCMC verwendet werden. INLA verlangt weniger Rechenleistung, was ¨ insbesondere fur komplexe Modelle ein Vorteil ist. ¨ Diese Dissertation untersucht beide Inferenz Methoden fur GLMMs, diskutiert damit ver- bundene rechen-technische Aspekte und erl¨ utert diese anhand mehrerer epidemiologischen a ¨ Anwendungen. Als Erstes wird die Likelihood Inferenz fur ein linear gemischtes Modell, ba- sierend auf longitudinale Daten aus der Schweizerischen HIV Kohortenstudie durchgefuhrt. ¨ Das Modell untersucht, ob vorherig beobachtete Lymphozyt-Subtypen relevante Pr¨ diktoren a ¨ fur den Krankheitsverlauf von unbehandelten und behandelten HIV infizierte Patienten sind. Im darauf folgenden Teil wird diskutiert wie die spezielle Situation, bei welcher patienten- ¨ spezifische longitudinale Profile keine Variation in der Ausgangsgrosse haben, die Likelihood und Bayesianische Inferenz mit INLA beeinflussen. Wir zeigen, dass mit einem zunehmenden ¨ Anteil an Patienten, welche keine Variation in der Ausgangsgrosse haben, die Maximum like- lihood (ML) Sch¨ tzung der Parameter, in einem Modell mit einer bin¨ ren Ausgangsgrosse, a a ¨ numerische Probleme verursacht. Weiterhin zeigen wir, dass in einem solchen Fall INLA a a ¨ Sch¨ tzungen generiert, die weder mit ML noch mit MCMC Sch¨ tzungen ubereinstimmen. Im dritten Teil diskutieren wir wie die besondere Abh¨ ngigkeitsstruktur einer Netzwerk Meta- a ¨ Analyse, unter Berucksichtigung der versuchsspezifischen Heterogenit¨ t und moglicher In- a ¨ konsistenzen im Netzwerk, mit INLA implementiert wird. Der letzte Teil der Dissertation untersucht die Verwendung von informativen Priori-Verteilungen, welche adaptive Gewich- ¨ te verwenden, die anhand der beobachteten Daten bestimmt werden. Ublicherweise werden ¨ nicht informative und unkorrelierte Priori-Verteilung fur die fixen Effekte in einem GLMM angenommen. In manchen Situationen kann diese Annahme zu unrealistischen Parameter ¨ Sch¨ tzungen fuhren. Adaptives gewichten der Priori-Verteilungen, basierend auf den beob- a achteten Daten und unter Einschluss von Korrelationen, kann dazu dienen dieses Problem zu beheben. Repeatedly observing the same patient implies that these samples will not be independent, as they are affected by the same common patient-specific characteristics. A generalized linear mixed model (GLMM) takes this dependency structure into account by introducing patient- specific model parameters which are called random effects. The dependency structure in the collected data could have various forms, though other than the one which arises from repeat- edly observing patients in a study population. A temporal, spatial or even spatio-temporal pattern may be present in the underlying sampling process. Or a network of different clusters which are connected and repeatedly observed may motivate the inclusion of random effects in a GLMM. Given the random effect structure, a GLMM investigates the conditional expectation for the parameters of interest, which are called fixed effects. In likelihood inference, the conditional estimates are determined by numerically integrating over the random effects, as in general this problem is not analytically solvable. The numerical integration may be computationally difficult to solve, depending on the complexity of the random effect structure and the data at hand. A Bayesian inference approach maps the random effect structure by including prior distri- butions for these parameters. The inclusion of prior distributions is flexible and may reflect different stages of information at different levels of the model. Bayesian inference is commonly carried out using computationally intensive Markov chain Monte Carlo (MCMC) sampling. If exclusively Gaussian priors are assigned to the random effect structure, with only one addi- tional level of hyperparameters and a limited order of dependencies between clusters – such that a Gaussian Markov random field results – one can apply integrated nested Laplace ap- proximations (INLA). INLA is an alternative to MCMC and requires less computational effort, which especially for complex models is an huge advantage. This thesis investigates both inference approaches for GLMMs, discusses related computa- tional issues and illustrates these with several epidemiological applications. First, likelihood inference is carried out for a model based on longitudinal data from the Swiss HIV cohort study. This model investigates if past lymphocyte subtypes are relevant predictors for the dis- ease progression among untreated and treated HIV infected patients. In the second part we discuss how the special situation, in which patient-specific longitudinal profiles show no vari- ation in the response, influences the likelihood and Bayesian inference with INLA. We show that, with an increasing proportion of patients who have no variation in the response, nu- merical issues arise in the Maximum likelihood (ML) estimation of a binary response GLMM. Furthermore, we show that in this case INLA produces estimates that are inconsistent with ML or MCMC inference. In the third part we discuss how the particular dependency structure of a network meta-analysis is implemented with INLA, taking into account trial specific het- erogeneity and possible network inconsistencies. The last part of the thesis examines the use of informative priors which use adaptive weights that are based on the observed data. Usually the prior distributions for the fixed effects in a GLMM are assumed to be uninformative and uncorrelated. In some situations this assumption may lead to unrealistic parameter estimates. An adaptively weighted informative prior distribution may help to resolve this problem.

Statistics

Downloads

282 downloads since deposited on 03 Jul 2018
260 downloads since 12 months
Detailed statistics

Additional indexing

Item Type:Dissertation (monographical)
Referees:Held Leonhard
Communities & Collections:UZH Dissertations
Dewey Decimal Classification:570 Life sciences; biology
Language:English
Place of Publication:Zürich
Date:2015
Deposited On:03 Jul 2018 08:52
Last Modified:24 Sep 2019 23:31
Number of Pages:184
OA Status:Green
Free access at:Official URL. An embargo period may apply.
Official URL:https://opac.nebis.ch/ediss/20162684.pdf
Related URLs:https://www.recherche-portal.ch/primo-explore/fulldisplay?docid=ebi01_prod010638167&context=L&vid=ZAD&search_scope=default_scope&tab=default_tab&lang=de_DE (Library Catalogue)

Download

Download PDF  'Generalised linear mixed models : likelihood and Bayesian computations with applications in epidemiology'.
Preview
Content: Published Version
Filetype: PDF
Size: 3MB