Chargement...
 

Module Apprentissage, Michele Sebag and Alexandre Allauzen. TP: Thomas Schmitt

Contents / Contenu

  1. Introduction, decision tree / arbres de décision.
    1. Slides: main_2016.pdf
  2. Validation
    1. Slides main_Validation.pdf
  3. Linear discrimination & Support Vector Machines
    1. Slides main_2016_SVM.pdf
  4. Big Data and stats / Grandes données: rappels de stats
  5. Classification, Naive Bayes / Classification et Bayesien naif
  6. Unsupervised learning and Expectation Maximization methods / Apprentissage non-supervisé, méthodes EM
  7. Projects: presentations.

TP Python

  1. TP1 : Introduction Python : TD1-exo Introduction Python (sept 2016).ipynb
    1. Correction : TD1-solutions Introduction Python (sept 2016).ipynb
  2. TP2 : Decision Tree + entropie TP Entropie.zip
    1. correction : Decision Tree, entropie, titanic Solutions (oct. 2016).ipynb
  3. TP 3 : Decision Tree + Validation DecisionTree with sklearn Exos (oct. 2016).ipynb
    1. correction : DecisionTree with sklearn Solution (oct. 2016).ipynb
  4. TP 4 : SVM TP SVM Exos (oct 2016).ipynb
    1. correction : TP SVM (solution) (oct 2016).ipynb
  5. TP 5 : Bayesien Naïf
    1. en html : TC1-tp-BN.html
    2. en ipynb : TC1-tp-BN.ipynb
(dossier google drive : https://drive.google.com/open?id=0B8suDYMJuia_a3FYMXY4RGcwYlE)

Bibliography / References

  1. Pattern Recognition and Machine Learning, Chris Bishop
  2. Nando de Freitas, https://www.youtube.com/user/ProfNandoDF


A coté des cours, un projet

Pourquoi Devenir un data scientiste, acquérir la connaissance pratique de l'apprentissage
Comment Projet en équipe de 3 ou 4 étudiants

Evaluation du projet

Ecrit code + 2 pages de présentation, méthodologie et résultat
Oral soutenance, 10 mn présentation, 10 mn questions
Quand mercredi 9 ou Jeudi 10 novembre


Liste des projets

  1. Challenge Otto Kaggle
  2. Challenges de la start-up AlixPartners. Le master remercie chaleureusement AlixPartners.
    1. Pb 1: On a un fichier texte qui représente des logs de session shell (environ 250) et on veut savoir combien il y a d'utilisateurs (10 ?).
      1. Data Problem 1 Input Data.zip
      2. Description Pb 1 documentation
    2. Pb 3: Pour apprendre il faut des données propres; nettoyer les données peut être un probleme d'apprentissage, aussi...
      1. Data Problem 3 Input Data.zip
      2. Description Pb 3 documentation
    3. Pb 4: Connaitre ses clients, tout est là.
      1. Data Problem 4 Input Data .zip
      2. Description Pb 4 documentation
  3. Unsupervised Feature Learning for image classification


Affectations et ordre de passage

13h: session Kaggle

  • Abdelhak Loukkal, Guillaume Lorre, Clément Thierry et Benzine Abdallah. (demande à passer le 1er)
  • Florence Carton, Antonin Raffin, Alvaro Correia, Gabriel Quéré
  • Bách Vũ, Mahmut Cavdar, Ngô Hồ Anh Khoa, Divya Grover
  • Yaohui WANG, Xiyu ZHANG, Forcefidele KIEN, Herilalaina RAKOTOARISON
  • Xiaoxiao CHEN, Dong FEI, Honglin Li, Yuxiang Wang
  • Amal Targhi, Mohamed Abdelkhaleq, Mihaela Sorostinean
  • Hadhami MATMATI, Asma KHOUFI, -------Younes BENHOUMICH (disparu)
  • Stephen Batifol, Abdelhadi Temmar, Sihem Abdoun, Nicolas Bougie.

16h: Unsupervised feature learning

  • Daro Ozad, Karim Kouki et Nawel Medjkoune
  • Gabriel BELLARD, Alwine Lambert
  • Ahmed Mazari, Fella Belkham, Hafed Rhouma

17h: Nettoyage de données

  • Mohamed Ali FATHALLAH et Ghazi FELHI

Connaitre ses clients

  • Aris Tritas et Laurent Cetinsoy

session logs


  • Jonathan CROUZET, Kévin PASINI, Matthieu RÉ


Collaborateur(s) de cette page: sebag , Alexandre.Allauzen et ThomasS .
Page dernièrement modifiée le Vendredi 02 décembre 2016 15:41:24 CET par sebag.