Applications
Outils open source, principalement hors connexion, que je développe pour les statistiques officielles — recensements agricoles, nettoyage des données d'enquête, estimation pour petits domaines et recherche dans les directives. Le code source, et une démonstration en ligne le cas échéant, sont accessibles sous chaque outil.
TODO: traduction — voir la version anglaise pour les descriptions complètes de chaque application.
Outils de statistique
Outils pour les statistiques agricoles et la méthodologie des enquêtes
WCA 2030 Explorer
Application web progressive hors connexion pour interroger les directives FAO WCA 2030. Les réponses sont du texte extrait verbatim avec références de section et de page — jamais généré.
Revue de métadonnées et tableaux des principaux résultats (PIPELINE_AC_MR_TMR)
Application de bureau pour les équipes de méthodologie du recensement FAO WCA 2020. Génère des Revues de métadonnées (15 sections) et des Tableaux des principaux résultats (23 sous-tableaux) à partir de documents de recensement agricoles nationaux.
Application de syntaxe de nettoyage de données
Outil open source hors connexion pour les statisticiens d'enquête. Convertit les dictionnaires de données et métadonnées en syntaxe de nettoyage, validation et imputation pour SPSS, Stata, R et Python.
Générateur de syntaxe SAE
Application web progressive hors connexion pour statisticiens. Importez un dictionnaire de données d'enquête, choisissez parmi 16 méthodes d'estimation pour petits domaines, et téléchargez des scripts R et Stata prêts à l'emploi, commentés.
Autres projets
Portfolio de science des données
Prédiction du diabète PIMA
Modèle prédictif classifiant la probabilité de diabète à partir d'attributs de santé (jeu de données PIMA Indians Diabetes). Projet de portfolio de science des données illustrant un pipeline complet d'apprentissage automatique.