Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
AIC et erreur de classification
2 participants
Page 1 sur 1
AIC et erreur de classification
Bonjour à tous,
Je travaille sur de la sélection de modèles GLM.
Un petit aperçu des données que je mouline. J'ai plein de lignes qui représentent mes individus (ici des bananes). En colonne j'ai leur attribution à une classe (1= banane malade / 0 = banane saine). J'ai également 102 variables quantitatives. Le but est de trouver les facteurs influents sur l'apparition de la maladie de la banane mais aussi de prédire l'état sanitaire de futurs échantillons.
Pour sélectionner mon meilleur modèle, j'utilise le classique critère AIC.
Par curiosité, j'ai testé l'erreur de classification que j'obtiens pour chaque modèle généré (grâce à une fonction predict sous R). Quelle ne fut pas ma surprise de constater que les modèles que j'avais privilégié pour leur faible AIC, ne se révèlent pas être ceux qui possèdent le plus faible taux d'erreur de classification.
Quelqu'un a-t-il une explication ?
En vous remerciant par avance,
Je travaille sur de la sélection de modèles GLM.
Un petit aperçu des données que je mouline. J'ai plein de lignes qui représentent mes individus (ici des bananes). En colonne j'ai leur attribution à une classe (1= banane malade / 0 = banane saine). J'ai également 102 variables quantitatives. Le but est de trouver les facteurs influents sur l'apparition de la maladie de la banane mais aussi de prédire l'état sanitaire de futurs échantillons.
Pour sélectionner mon meilleur modèle, j'utilise le classique critère AIC.
Par curiosité, j'ai testé l'erreur de classification que j'obtiens pour chaque modèle généré (grâce à une fonction predict sous R). Quelle ne fut pas ma surprise de constater que les modèles que j'avais privilégié pour leur faible AIC, ne se révèlent pas être ceux qui possèdent le plus faible taux d'erreur de classification.
Quelqu'un a-t-il une explication ?
En vous remerciant par avance,
Bubble974- Nombre de messages : 8
Date d'inscription : 12/12/2012
Re: AIC et erreur de classification
salut,
L'AIC n'est pas un critère de qualité prédictive comme l'étude de la spécificité et de la sensibilité. C'est un critère qui fait parti de la qualité d'ajustement du modèle. Une valeur d'AIC est dépendante des données.
Donc il faut que tu revois ce que tu veux faire car là tu pars dans une mauvaise direction à priori.
Nik
L'AIC n'est pas un critère de qualité prédictive comme l'étude de la spécificité et de la sensibilité. C'est un critère qui fait parti de la qualité d'ajustement du modèle. Une valeur d'AIC est dépendante des données.
Donc il faut que tu revois ce que tu veux faire car là tu pars dans une mauvaise direction à priori.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: AIC et erreur de classification
Je ne suis pas vraiment d'accord...
le critère d'Akaike est un critère de comparaison de modèles, mais pas un critère de qualité d'ajustement du modèle. Il est couramment utilisé dans les procédures stepwise de R par exemple...
Il est utilisé dans la sélection de modèles et reste un moyen de sélectionner un modèle ayant des propriétés "optimales" pour la prédiction.
il est vrai que je n'ai pas regardé spécificité et sensibilité, je vais tester ! merci !
le critère d'Akaike est un critère de comparaison de modèles, mais pas un critère de qualité d'ajustement du modèle. Il est couramment utilisé dans les procédures stepwise de R par exemple...
Il est utilisé dans la sélection de modèles et reste un moyen de sélectionner un modèle ayant des propriétés "optimales" pour la prédiction.
il est vrai que je n'ai pas regardé spécificité et sensibilité, je vais tester ! merci !
Bubble974- Nombre de messages : 8
Date d'inscription : 12/12/2012
Re: AIC et erreur de classification
Effectivement parler de qualité d'ajustement pour l'AIC était un peu abusif . En voulant être global j'ai dit n'importe quoi.
Mais si tu as cette différence en tête alors pourquoi t'étonner que le modèle ayant le plus faible AIC n'a pa forcément les meilleurs taux d'erreur ?
Mais si tu as cette différence en tête alors pourquoi t'étonner que le modèle ayant le plus faible AIC n'a pa forcément les meilleurs taux d'erreur ?
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum