Statistiques descriptives

Principe

Cette section regroupe les opérateurs destinés à calculer des indicateurs ou/et des résumés statistiques sur les données.

Statut des variables

Il n'y a pas de règles communes aux opérateurs de cette famille, la définition du rôle des variables dépend de l'opérateur utilisé.

Opérateurs de statistiques descriptives

Opérateur Description Paramétrage Remarques

Cross tabulation
Calcul du tableau de contingence d'une série de variables prises deux à deux.

A. Agresti,"Categorical data analysis", John Wiley, 1990.

- Tri des résultats par nom de variable ou par l'importance du lien.
- Mode de sélection des variables : (1) "target" = ligne, "input" = colonne, ou (2) croisement des séries de variables en "input".
- Seuil, en multiple de la contribution au chi-2, à partir de laquelle une cellule du tableau est mise en évidence.
- Seules les variables discrètes peuvent Ítre utilisées.

Linear correlation
Calcul du coefficient de corrélation linéaire d'une série de variables prises deux à deux.

S. AÔvazian, "Etudes statistiques des dépendances", Edition MIR, 1978.

- Tri des résultats par nom de variable ou par l'importance du coefficient de corrélation.
- Mode de sélection des variables : (1) "target" = ligne, "input" = colonne, ou (2) croisement des séries de variables en "input".
- Seules les variables continues peuvent Ítre utilisées.

One-way ANOVA
Analyse de variance à 1 facteur.

- W.C. Guenther, "Analysis of Variance", Prentice-Hall, 1966.
- J.C. Bergonzini, "Analyse et planification des expériences", Masson, pp.43-51, 1995.

- Avec un opérateur de définition des variables, en "Target" : les variables mesurées, en "input": les facteurs.
- Tri des résultats par nom de variable ou par importance du lien.
- Statistiques descriptives supplémentaires à afficher.
- Les "target" sont nécessairement continues.
- Les "input" sont nécessairement discretes.

Univariate discrete stat
Statistiques descriptives univariées pour les variables discrètes, essentiellement la distribution de fréquence.

- Avec un opérateur de définition des variables, en "Input" : les variables à décrire.
- Tri des résultats par nom de variable ou selon l'indice de concentration de GINI.
- Les "input" sont nécessairement discretes.

Univariate continuous stat
Statistiques descriptives univariées pour les variables continues.

- Avec un opérateur de définition des variables, en "Input" : les variables à décrire.
- Tri des résultats par nom de variable ou selon un des indicateurs calculés.
- Les "input" sont nécessairement continues.

Non-parametrical test (KW)
Méthode non-paramétrique de comparaison de populations : le test de KRUSKAL et WALLIS. On peut le voir comme une version robuste de l'ANOVA paramétrique.

- S. Siegel, "Nonparametric statistics for the behavioral science", McGraw-Hill, 1956. - J.C. Bergonzini, "Analyse et planification des expériences", Masson, pp.62-63, 1995.

- Avec un opérateur de définition des variables, en "Target" : les variables mesurées, en "input": les facteurs. - Les "target" sont nécessairement continues.
- Les "input" sont nécessairement discretes.

Group characterization
Caractérisation des groupes, définies à travers des variables discrètes (en target) à l'aide d'une série de variables (en input), de type quelconque.

Cet opérateur est très utile lorsque l'on veut mettre en évidence des groupes (classes) produites par un clustering.

- L. Lebart, A. Morineau, M. Piron, "Statistique exploratoire multidimensionnelle", Ed. Dunod, pp. 181-184, 2000. (à voir surtout pour la notion de valeur test)

- Avec un opérateur de définition des variables, en "Target" : les variables définissant les groupes, en "input": les variables de description. - Les "target" sont nécessairement discrètes.
- Les "input" sont de type quelconque.

Dernière modification : 12 janvier 2004.