Section outline

    • Le dataset Boston Housing contient des informations sur le marché immobilier de Boston, avec 506 observations représentant des quartiers de la ville. Chaque observation inclut 13 variables explicatives, telles que le nombre moyen de pièces par logement (RM), le taux de criminalité (CRIM), ou encore le pourcentage de la population à faible statut socio-économique (LSTAT). L'objectif est de prédire la valeur médiane des logements (MEDV, en milliers de dollars) à partir de ces caractéristiques.

    • Bonjour à toutes et à tous,

      L'énoncé du Devoir 2 : Régression Linéaire et Analyse des Résidus est désormais disponible sur Moodle. Vous trouverez également le dataset Wage.csv, nécessaire pour compléter les exercices.

      Objectif du Devoir :

      Ce devoir vous permettra de vous familiariser avec les concepts fondamentaux de la régression linéaire, des tests d'hypothèses et de l'analyse des résidus. Vous serez amenés à :
      - Implémenter un modèle de régression linéaire simple et un modèle de régression linéaire multiple.
      - Réaliser un test t de significativité pour la régression linéaire simple et une analyse de la variance (ANOVA) pour le modèle multiple.
      - Analyser les résidus afin d’évaluer la qualité des modèles.
      - Comparer vos résultats avec ceux obtenus via statsmodels et scikit-learn.
      - Explorer et manipuler des données avec Pandas et NumPy.

      Du code partiellement complété vous est fourni. Vous devrez remplir certaines parties et répondre à des questions d’interprétation et d'analyse.

      Si vous aurez besoin d’aide ?
      N’hésitez pas à me poser vos questions en personne ou sur le forum du cours. Vous pouvez toujours me contacter en cas de besoin.

      Commencez le devoir dès que possible afin d’avoir le temps de poser vos questions et de le compléter sereinement.

      Bon travail à toutes et à tous !






    • Bonjour à toutes et à tous,

      J’ai mis en ligne un document de clarifications concernant :
      - L’estimation par maximum de vraisemblance dans le cas de la régression linéaire multiple.
      - Le calcul des intervalles de confiance et de prédiction (dans le cas de la régression linéaire multiple).

       Vous pouvez y retrouver :
      - Une explication détaillée de l’estimateur du maximum de vraisemblance en régression linéaire multiple.
      - La formulation mathématique des intervalles de confiance et de prédiction.
      - Des exemples illustrant leur interprétation et leur utilisation.

      Bonne lecture et bonne étude !

    • Bonjour à toutes et à tous,

      J’ai mis en ligne la version finale du document de la Leçon 2 : Régression Linéaire Multiple.

      Le contenu reste le même que celui des précédents transparents, avec des ajustements et mises au point pour une meilleure lisibilité et un affichage optimal des slides.

      Bonne lecture et bonne étude !


    • Bonjour à toutes et à tous,

      L'énoncé du Devoir 3 : "Méthodes de Régularisation" est désormais disponible sur Moodle. Vous avez 2 semaines pour le compléter et le soumettre.

      Vous trouverez :

      - L’énoncé du devoir (format PDF) avec le code Python à compléter.

      - Le jeu de données `Hitters`, disponible dans la librairie ISLP.

      Ce devoir vise à approfondir votre compréhension des méthodes de régularisation en régression linéaire. Vous serez amenés à :

      - Comprendre les formulations probabilistes des régularisations.

      - Établir les liens entre la régularisation et l'estimation Bayésienne (MAP).

      - Implémenter les méthodes Ridge, Lasso et Elastic Net par vous mêmes.

      - Étudier l’impact des hyperparamètres sur la performance du modèle et la sélection des variables.

      - Interpréter l’évolution des erreurs de prédiction et de la parcimonie des modèles.

      Modalités de remise : Un seul fichier PDF contenant toutes vos réponses y compris le code Python complété, les résultats affichés (graphiques, tableaux et autres) ainsi que vos analyses, vos réponses et justifications aux QCM.

      Instructions importantes :

      - Prenez le temps de lire l’ensemble du devoir avant de commencer. Cela vous permettra de mieux comprendre la logique des exercices et d’anticiper les connexions entre les questions.

      - Répondez aux questions avec des explications rigoureuses et, lorsque nécessaire, des arguments mathématiques.

      Remarque sur les QCM :

        - Lorsqu’il est demandé de fournir vos réponses, cela signifie qu’il peut y avoir plus d’une bonne réponse.

        - Lorsqu’il est demandé votre réponse, une seule est attendue.

      Si vous aurez besoin d’aide?

      N’hésitez pas à me poser vos questions pendant les séances du cours, par courriel, ou sur le forum du cours. Je suis disponible pour vous accompagner si vous rencontrez des difficultés.

      Commencez le devoir dès que possible pour avoir le temps de poser vos questions et le compléter sereinement.

      Bon travail à toutes et à tous et surtout, soyez curieux !