Science des données 2
Licence 3 MIASHS
Université de Lille
Semestre 1, 2025-2026

Objectifs de ce module

Ce module a pour objectif de compléter le cours science des données 1. Il sera lui-même complété dans le module de science des données 3 au semestre suivant.
Outre la maîtrise d'un certain nombre de notions, l'étude de la science des données nécessite la mise en pratique via la confrontation avec des études de cas. Aussi, une grande partie du module sera tournée vers la mise en pratique.
R et python sont deux environnements extrêmement puissants utilisés en science des données. Ils ont chacun leurs avantages et leurs inconvénients. Par cohérence avec le reste de la formation de licence MIASHS, la mise en pratique sera réalisée en python.
Une connaissance minimale de python est indispensable pour suivre ce cours. En aucun cas ce cours n'est un cours de python. En cas de besoin, lire cet ouvrage pour une présentation du langage.

Calendrier

Les séances se déroulent les mardis de 8h à 10h, à partir du 2 septembre 2025.
La dernière séance aura lieu le 9 décembre.

Mise en pratique

  1. TP 1 : Les tableaux de données.Éléments de correction.
  2. TP 2 : Les graphiques.
  3. TP 3 : Classification supervisée : introduction : à m'envoyer avant le 30 septembre.
  4. TP 4 : Classification supervisée : estimation du taux de succès : à m'envoyer avant le 30 septembre.
  5. TP 5 : Graphiques, le retour.
  6. TP 6 : Exploration visuelle pour la classification supervisée : à m'envoyer avant le 10 octobre.
  7. TP 7 : Les hyper-paramètres : à m'envoyer de préférence avant le 17 octobre.
  8. TP 8 : Les attributs catégoriques : à m'envoyer avant le 31 octobre.
  9. TP 9 : Brad's sweet home : de nouveaux sujets : à m'envoyer d'ici le 20 novembre.
  10. TP 10 :  : à m'envoyer d'ici le 9 décembre.

Quelques règles à respecter :

Contrôle de connaissances

Le contrôle de connaissances est continu. Il y aura 2 épreuves durant le semestre :

Pré-requis