Paul McNicholas


Chaire de recherche du Canada en statistiques computationnelles

Niveau 1 - 2015-01-10
McMaster University
Sciences naturelles et génie

(905) 525-9140, x 23419
mcnicholas@math.mcmaster.ca

Objet de la recherche


Développer des méthodes statistiques à forte intensité de calcul pour les ensembles de données modernes

Importance de la recherche


Cette recherche permettra d’élaborer des approches pour l’analyse d’ensembles de données volumineux et complexes dans des domaines tels que la bioinformatique, les finances, la santé, le marketing et la nutrigénomique

Examen plus approfondi des mégadonnées


Le vieil adage voulant que « plus c’est gros, mieux c’est » peut être ou ne pas être vrai en ce qui concerne les données. Néanmoins, les mégadonnées sont devenues une réalité qui a une incidence sur tous les domaines de la société, y compris la recherche scientifique. Paul McNicholas, titulaire de la Chaire de recherche du Canada en statistiques computationnelles, développe de nouvelles méthodes statistiques à forte intensité de calcul afin de mieux connaître les mégadonnées complexes.

Certains ensembles de données font l’objet de nombreuses mesures pour chaque observation. Bien que les statisticiens et les informaticiens traitent régulièrement des données qui peuvent contenir des centaines ou des milliers de variables, les ensembles de données modernes contiennent souvent plus de dix mille variables. Malheureusement, il n’existe aucune méthode efficace pour ces données soi-disant « de très grande dimension ».

M. McNicholas combine l’expertise en informatique et en statistique afin d’élaborer des approches statistiques computationnelles pour ce type de données. Il se concentrera sur les méthodes qui trouvent des sous-groupes d’observations similaires et qui sont applicables dans n’importe quel contexte lorsqu’il s’agit de données de très grande dimension—de la gestion scientifique aux diagnostics de maladies à la bio-informatique.

M. McNicholas élabore aussi des méthodes statistiques computationnelles qui permettront aux utilisateurs de comprendre d’immenses ensembles de données grâce à différents types de mesures. Tout comme son travail sur les données de très grande dimension, ce travail promet de simplifier et de faciliter l’analyse de données dans de nombreux domaines d’activité sociale, économique et scientifique.

La recherche de M. McNicholas aidera à créer des approches statistiques des données qui peuvent : chercher des sous-types de certains cancers; aider à identifier les gènes candidats à modifier afin de permettre aux cultures vivrières de croître dans les pays en développement; combiner les données génétiques, les données sur la condition physique et les autres données sur la santé afin d’étudier la relation entre l’obésité, les gènes, la nutrition et l’exercice.