Farouk Nathoo



Chaire de recherche du Canada en biostatistique des données spatiales et de grande dimension

Niveau 2 - 2017-11-01
University of Victoria
Sciences naturelles et génie

250-472-4693
nathoo@uvic.ca

Objet de la recherche


Développer des méthodes statistiques et des algorithmes computationnels pour l’analyse de données génomiques et de données spatiales de grande dimension.

Importance de la recherche


Développer des meilleures techniques d’analyse des données spatiales de grande dimension et des nouveaux modèles pour comprendre l’influence de la génétique sur le fonctionnement du cerveau.

Créer des nouveaux outils pour comprendre les données biomédicales complexes


Grâce aux nouvelles méthodes en biotechnologie, notre monde connaît une explosion du nombre de données disponibles. Le scientifique a donc à sa portée un outil précieux pour aborder de nombreuses questions essentielles sur le cerveau humain ; comment il fonctionne ou comment les variations génétiques peuvent l’affecter.

Cependant, le volume et la complexité de ces ensembles de données pose un défi de taille pour les scientifiques. Titulaire de la chaire de recherche du Canada en biostatistique des données spatiales et de grande dimension, Farouk Nathoo veut mettre au point de nouvelles approches pour aider les scientifiques à comprendre ces données.

Les études portant sur l’imagerie cérébrale peuvent impliquer des ensembles de données volumineux pour décrire l’anatomie du cerveau, ses fonctions et sa connectivité. Les études en imagerie génomique, où le but est de découvrir les variantes génétiques associés avec la structure et le fonctionnement du cerveau, impliquent une analyse des images du cerveau ainsi que des données additionnelles provenant de génotypage à haut débit (génotypage de centaines ou milliers d’individus en fonction d’un grand nombre de marqueurs dans le génome). Avec le génotypage à haut débit, il n’est pas rare d’effectuer plus d’un milliard de tests statistiques.

M. Nathoo et son équipe développent des nouvelles méthodes d’analyse statistique où le nombre de variables dépassent la taille de l’échantillon, ce qu’on appelle « données spatiales de grande dimension ». Ils utilisent des modèles à grande échelle en combinaison avec l’approximation mathématique et l’informatique à haut rendement pour intégrer des grands ensembles de données en provenance de différentes sources afin de mieux comprendre des systèmes complexes.

À la fin, l’objectif de la recherche menée par M. Nathoo est de produire des nouveaux outils qui aideront les chercheurs à mieux comprendre les données biomédicales et leurs processus sous-jacents.