AIC et erreur de classification

Voir le sujet précédent Voir le sujet suivant Aller en bas

AIC et erreur de classification

Message par Bubble974 le Mer 12 Déc 2012 - 13:38

Bonjour à tous,

Je travaille sur de la sélection de modèles GLM.
Un petit aperçu des données que je mouline. J'ai plein de lignes qui représentent mes individus (ici des bananes). En colonne j'ai leur attribution à une classe (1= banane malade / 0 = banane saine). J'ai également 102 variables quantitatives. Le but est de trouver les facteurs influents sur l'apparition de la maladie de la banane mais aussi de prédire l'état sanitaire de futurs échantillons.

Pour sélectionner mon meilleur modèle, j'utilise le classique critère AIC.
Par curiosité, j'ai testé l'erreur de classification que j'obtiens pour chaque modèle généré (grâce à une fonction predict sous R). Quelle ne fut pas ma surprise de constater que les modèles que j'avais privilégié pour leur faible AIC, ne se révèlent pas être ceux qui possèdent le plus faible taux d'erreur de classification.

Quelqu'un a-t-il une explication ?

En vous remerciant par avance,

Bubble974

Nombre de messages : 8
Date d'inscription : 12/12/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: AIC et erreur de classification

Message par Nik le Mer 12 Déc 2012 - 19:54

salut,

L'AIC n'est pas un critère de qualité prédictive comme l'étude de la spécificité et de la sensibilité. C'est un critère qui fait parti de la qualité d'ajustement du modèle. Une valeur d'AIC est dépendante des données.

Donc il faut que tu revois ce que tu veux faire car là tu pars dans une mauvaise direction à priori.

Nik

Nik

Nombre de messages : 1501
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: AIC et erreur de classification

Message par Bubble974 le Mar 18 Déc 2012 - 14:27

Je ne suis pas vraiment d'accord...
le critère d'Akaike est un critère de comparaison de modèles, mais pas un critère de qualité d'ajustement du modèle. Il est couramment utilisé dans les procédures stepwise de R par exemple...
Il est utilisé dans la sélection de modèles et reste un moyen de sélectionner un modèle ayant des propriétés "optimales" pour la prédiction.

il est vrai que je n'ai pas regardé spécificité et sensibilité, je vais tester ! merci !

Bubble974

Nombre de messages : 8
Date d'inscription : 12/12/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: AIC et erreur de classification

Message par Nik le Mar 18 Déc 2012 - 15:04

Effectivement parler de qualité d'ajustement pour l'AIC était un peu abusif Smile. En voulant être global j'ai dit n'importe quoi.
Mais si tu as cette différence en tête alors pourquoi t'étonner que le modèle ayant le plus faible AIC n'a pa forcément les meilleurs taux d'erreur ?

Nik

Nombre de messages : 1501
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: AIC et erreur de classification

Message par Contenu sponsorisé Aujourd'hui à 20:26


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum