Guide d'Utilisation de SamSel Web

Apprenez à utiliser l'application pour répartir vos individus en groupes d'échantillonnage.

1. Charger les Données

Cette étape est cruciale pour importer votre jeu de données source.

Champ Description Formats acceptés
Fichier de données Le fichier source contenant les individus et les valeurs à répartir. **CSV**, **Excel** (.xls, .xlsx), **JSON**.

Règle d'or de la structure du fichier :

  • La **première colonne** doit toujours contenir l'**Identifiant unique** des individus (ex: Nom, ID Client).
  • La **seconde colonne** doit contenir la **Valeur numérique** utilisée pour la répartition (ex: Revenu, Score, Poids).

Exemple de fichier : MassesHuitresExpé17.xlsx

2. Paramètres de Groupement

Définissez la structure et la méthode de sélection des individus pour vos groupes.

Nombre de groupes / Taille de chaque groupe

Définit le nombre total de groupes à créer et le nombre final d'individus qui seront **sélectionnés** (l'échantillon) dans chacun de ces groupes.

⚠️ La taille totale de l'échantillon sélectionné sera : *Nombre de groupes* x *Taille de chaque groupe*.

Stratégie de sélection

  • **Proche de la médiane par groupe** : Sélectionne les individus dont la valeur est la plus proche de la médiane de leur groupe de répartition initial.
  • **Aléatoire** : Sélectionne des individus **au hasard** dans chaque groupe.
  • **Premiers individus (après tri)** : Sélectionne les premiers individus d'une liste triée à l'intérieur de chaque groupe.
  • **Proche de la médiane Globale** : (Si présente) Similaire à la médiane par groupe, mais se base sur la médiane de **l'ensemble des données** pour la sélection.

3. Filtrage des Extrêmes

Utilisez ce filtre pour exclure les valeurs numériques considérées comme des extrêmes ou des erreurs avant la répartition et la sélection.

Quantile bas et Quantile haut

Les valeurs entrées (entre 0 et 1) définissent les bornes du filtre. Par défaut, SamSel exclut les 5% des valeurs les plus basses (0.05) et les 5% des valeurs les plus hautes (0.95).

Exemple: Si vous mettez **0.1** (10%) et **0.9** (90%), SamSel ignorera les 10% des données les plus faibles et les 10% les plus fortes pour le processus de groupement.

4. Visualisation et Exportation

Une fois la génération terminée, les résultats s'affichent en trois parties :

  • **Résultats du traitement** : Liste des identifiants d'individus sélectionnés dans chaque groupe et les statistiques descriptives clés (Moyenne, Médiane, Min, Max, etc.).
  • **Visualisations Graphiques** : Affichage d'un **Histogramme** (distribution globale) et d'un **Boxplot** (répartition des valeurs par groupe) pour un aperçu rapide.
  • **Exportation** : Utilisez le bouton **Exporter les résultats en CSV** pour télécharger le fichier des individus sélectionnés.