Detail

Forschungsseminar am Institut für Angewandte Statistik

20. Oktober, 15:30 -Dr. Alejandra Avalos Pacheco: “Multi-study Factor Regression Models for Large Complex Data with Applications to Nutritional Epidemiology and Cancer Genomics”

zoom link, öffnet eine externe URL in einem neuen Fenster

meeting ID: 937 6054 7545

password: 946296

Abstract:

Data-integration of multiple studies can be key to understand and gain knowledge in statistical research. However, such data present both biological and artifactual sources of variation, also known as covariate effects. Covariate effects can be complex, leading to systematic biases. In this talk I will present novel sparse latent factor regression (FR) and multi-study factor regression (MSFR) models to integrate such heterogeneous data. The FR model provides a tool for data exploration via dimensionality reduction and sparse low-rank covariance estimation while correcting for a range of covariate effects. MSFR are extensions of FR that enable us to jointly obtain a covariance structure that models the group-specific covariances in addition to the common component, learning covariate effects from the observed variables, such as the demographic information. I will discuss the use of several sparse priors (local and non-local) to learn the dimension of the latent factors. Our approach provides a flexible methodology for sparse factor regression which is not limited to data with covariate effects. I will present several examples, with a focus on bioinformatics applications. We show the usefulness of our methods in two main tasks: (1) to give a visual representation of the latent factors of the data, i.e. an unsupervised dimension reduction task and (2) to provide a (i) supervised survival analysis, using the factors obtained in our method as predictions for the cancer genomic data; and (ii) dietary pattern analysis, associating each factor with a measure of overall diet quality related to cardiometabolic disease risk for a hispanic community health nutritional-data study.
Our results show an increase in the accuracy of the dimensionality reduction, with non-local priors substantially improving the reconstruction of factor cardinality. The results of our analyses illustrate how failing to properly account for covariate effects can result in unreliable inference.

Event

Datum & Uhrzeit

20.10.2022

15:30 - 17:00 Uhr

Meinem Kalender hinzufügen

Ort

S2 Z74, Science Park 2

Kontakt

milan.stehlik@jku.at

Dieses Event teilen

Zurück zur Übersicht

Name	Zweck	Ablauf	Anbieter
CookieConsent	Speichert Ihre Einstellungen zur Verwendung von Cookies auf dieser Website.	1 Jahr	JKU
se_mode	Cookie für Einstellungen der Site Search	1 Jahr	JKU

Name	Zweck	Ablauf	Anbieter
_gcl_au	Wird verwendet, um zwischen User und Userverhalten zu unterscheiden.	3 Monate	Google
_ga	Wird verwendet, um Benutzer zu unterscheiden.	2 Jahre	Google
_gid	Wird verwendet, um Benutzer zu unterscheiden und die Nutzung der Website zu analysieren. Es werden anonyme Daten zur Anzahl von Besuchern, die besuchten Seiten und die Quelle des Zugriffes erfasst.	1 Tag	Google
_gat_UA-112203476-1	Wird zum Drosseln der Anfragerate bei Google Analytics für Websites mit hohen Nutzerzahlen verwendet.	1 Minute	Google
_pk_id	Wird verwendet, um einige Details über den Benutzer zu speichern wie z.B. die eindeutige Besucher-ID.	13 Monate	JKU
_pk_ses	Kurzlebiges Cookie, welches verwendet wird, um Daten für den Besuch vorübergehend zu speichern.	30 Minuten	JKU
_pk_ref	Wird benutzt, um die Informationen der Herkunftswebsite des Benutzers zu speichern.	6 Monate	JKU

Name	Zweck	Ablauf	Anbieter
_gcl_au	Wird verwendet, um zwischen User und Userverhalten zu unterscheiden.	3 Monate	Google
_ga	Wird verwendet, um Benutzer zu unterscheiden.	2 Jahre	Google
_gid	Wird verwendet, um Benutzer zu unterscheiden und die Nutzung der Website zu analysieren. Es werden anonyme Daten zur Anzahl von Besuchern, die besuchten Seiten und die Quelle des Zugriffes erfasst.	1 Tag	Google
_gac_UA-112203476-1	Enthält Kampagneninformationen und dient der Messung des Kampagnenerfolges von Google AdWords Kampagnen.	90 Tage	Google
test_cookie	Wird testweise gesetzt, um zu prüfen, ob der Browser das Setzen von Cookies erlaubt. Enthält keine Identifikationsmerkmale.	15 Minuten	Google
IDE	Enthält eine zufallsgenerierte User-ID. Anhand dieser ID kann Google den User über verschiedene Websites domainübergreifend wiedererkennen und personalisierte Werbung ausspielen.	1 Jahr	Google
_gcl_aw	Dieses Cookie wird gesetzt, wenn ein User über einen Klick auf eine Google Werbeanzeige auf die Website gelangt. Es enthält Informationen darüber, welche Werbeanzeige geklickt wurde, sodass erzielte Erfolge wie z.B. Bestellungen oder Kontaktanfragen der Anzeige zugewiesen werden können.	3 Monate	Google
AMCV_xx	Enthält eine zufallsgenerierte User-ID. Anhand dieser ID kann die Adobe Marketing Cloud den User über verschiedene Websites domainübergreifend wiedererkennen und personalisierte Werbung ausspielen.	3 Jahre	LinkedIn
bcookie	Enthält eine ID des Browsers.	2 Jahre	LinkedIn
bscookie	Enthält eine ID des Browsers bei einer sicheren Verbindung.	2 Jahre	LinkedIn
lang	Wird verwendet, um die Spracheinstellung des Besuchers zu speichern.	Session	LinkedIn
lidc	Wird verwendet, um Benutzer zu unterscheiden und die Nutzung der Website zu analysieren. Es werden anonyme Daten zur Anzahl von Besuchern, die besuchten Seiten und die Quelle des Zugriffes erfasst.	1 Tag	LinkedIn
lissc	Wird für die Analyse der Nutzung von eingebetteten Dienstleistungen verwendet.	1 Jahr	LinkedIn
UserMatchHistory	Enthält Kampagneninformationen und dient der Messung des Kampagnenerfolges.	30 Tage	LinkedIn
fr	Enthält Kampagneninformationen und dient der Messung des Kampagnenerfolges.	90 Tage	Facebook
fbp	Wird von Facebook genutzt, um eine Reihe von Werbeprodukten anzuzeigen, zum Beispiel Echtzeitangebote dritter Werbetreibender.	90 Tage	Facebook
sc_at	Wird verwendet, um Benutzer über mehrere Domains hinweg zu unterscheiden.	1 Jahr	Snap
sc-country	Dieses Cookie unterscheidet das Land des Benutzers.	1 Tag	Snap
uid	Dieses Cookie enthält eine zufallsgenerierte User-ID und wird für das Ausspielen und die Echtzeitermittlung der Preise für Anzeigen für differenzierte Zielgruppen verwendet.	60 Tage	Adform
C	Identifiziert und speichert ob Nutzer Cookies akzeptieren. Wert 1: Cookies sind erlaubt, Wert 3: Cookies sind nicht erlaubt.	30 Tage	Adform