Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Quel indice de similarité choisir?Bray-Curtis et ses copains
2 participants
Page 1 sur 1
Quel indice de similarité choisir?Bray-Curtis et ses copains
Bonjour,
Nouvelle sur ce forum et plutôt débutante en statistique je me heurte à un problème qui semble assez récurrent dans le monde des stats': Quel indice de similarité choisir pour comparer 2 ensembles (sites, habitats, ou autres)?
Dans mon cas, je travaille en écologie marine et mes données sont de type quantitatives (% de recouvrement et nombre d'individus par espèces).
J'ai transformé toutes mes données avec la distance de Hellinger.
Je souhaite maintenant obtenir le niveau de similarité entre 2 habitats au sein d'un même site à partir de ces données. Après lecture de pas mal de publi et documents je comprends qu'on peut soit jouer sur la notion de distance (ou dissimilarité) soit sur la notion de similarité. Je vois que l'indice de dissimilarité de Bray-Curtis revient souvent. Je l'utilise et j'obtiens un résultat complètement incohérent!
J'essaie donc l'indice de similarité de Czekanowski, qui, d'après ce que je comprends est un peu "l'inverse de l'indice de dissimilarité de Bray-curtis" et là ça marche pas trop mal...On parle aussi d'indice de Steinhaus (à priori même signification que Czekanowski), mais là je m'y perds...
Bref pouvez-vous me conseiller sur l'indice de similarité le plus approprié pour traiter mes données, et si un prétraitement des données est nécessaire avant son utilisation?
Je précise que tout ce travail fera peut-être l'objet d'une publication, j'ai donc vraiment besoin d'une bonne justification à un choix d'indice. Je travaille aussi sous R, alors je suis preneuse du script si vous me conseillez un indice en particulier...
Merci beaucoup par avance!!
Nouvelle sur ce forum et plutôt débutante en statistique je me heurte à un problème qui semble assez récurrent dans le monde des stats': Quel indice de similarité choisir pour comparer 2 ensembles (sites, habitats, ou autres)?
Dans mon cas, je travaille en écologie marine et mes données sont de type quantitatives (% de recouvrement et nombre d'individus par espèces).
J'ai transformé toutes mes données avec la distance de Hellinger.
Je souhaite maintenant obtenir le niveau de similarité entre 2 habitats au sein d'un même site à partir de ces données. Après lecture de pas mal de publi et documents je comprends qu'on peut soit jouer sur la notion de distance (ou dissimilarité) soit sur la notion de similarité. Je vois que l'indice de dissimilarité de Bray-Curtis revient souvent. Je l'utilise et j'obtiens un résultat complètement incohérent!
J'essaie donc l'indice de similarité de Czekanowski, qui, d'après ce que je comprends est un peu "l'inverse de l'indice de dissimilarité de Bray-curtis" et là ça marche pas trop mal...On parle aussi d'indice de Steinhaus (à priori même signification que Czekanowski), mais là je m'y perds...
Bref pouvez-vous me conseiller sur l'indice de similarité le plus approprié pour traiter mes données, et si un prétraitement des données est nécessaire avant son utilisation?
Je précise que tout ce travail fera peut-être l'objet d'une publication, j'ai donc vraiment besoin d'une bonne justification à un choix d'indice. Je travaille aussi sous R, alors je suis preneuse du script si vous me conseillez un indice en particulier...
Merci beaucoup par avance!!
Maud- Nombre de messages : 1
Date d'inscription : 25/11/2010
Re: Quel indice de similarité choisir?Bray-Curtis et ses copains
Salut,
Oui effectivement, très vaste question qui a fait couler beaucoup d'encre dans bcp de publi notamment en écologie.
Alors très sincèrement il n'y a aucun indice qui est meilleur qu'un autre et ils souffrent absolument tous d'un biais majeur qui est de ne pouvoir être utilisé en tant qu'outil de comparaison (leur rôle fondamental) uniquement si les sites (régions, zones etc...) que tu compares ont des richesses (nombres d'espèces) très voisins. Ne cherche pas de publi là dessus, la seule qui concerne le sujet (encore actuellement) je l'ai sur mon bureau à l'état de "manuscript en cours" (je ne désespère pas de la sortir rapidement.... )
Pour donner un peu de détail, la différence (similarité) entre deux sites exprimée par ce genre d'indice dépend d'une part des pool d'espèces locaux, de la différence entre les deux pools, des pools régionaux de chacun des sites et de leur éventuelles différences. Une des conséquences observable est que plus les sites sont riches plus on a de chance que l'indice sature et ne donne aucune différence même si les contenus des 2 sites sont très différents.
Voilà maintenant tu fais ce que tu veux mais ce que tu vas obtenir est forcément largement biaisé. Et bien sûr il n'existe pas de correctif possible car c'est inhérent à la nature même des stats que l'on utilise.
nik
Oui effectivement, très vaste question qui a fait couler beaucoup d'encre dans bcp de publi notamment en écologie.
Alors très sincèrement il n'y a aucun indice qui est meilleur qu'un autre et ils souffrent absolument tous d'un biais majeur qui est de ne pouvoir être utilisé en tant qu'outil de comparaison (leur rôle fondamental) uniquement si les sites (régions, zones etc...) que tu compares ont des richesses (nombres d'espèces) très voisins. Ne cherche pas de publi là dessus, la seule qui concerne le sujet (encore actuellement) je l'ai sur mon bureau à l'état de "manuscript en cours" (je ne désespère pas de la sortir rapidement.... )
Pour donner un peu de détail, la différence (similarité) entre deux sites exprimée par ce genre d'indice dépend d'une part des pool d'espèces locaux, de la différence entre les deux pools, des pools régionaux de chacun des sites et de leur éventuelles différences. Une des conséquences observable est que plus les sites sont riches plus on a de chance que l'indice sature et ne donne aucune différence même si les contenus des 2 sites sont très différents.
Voilà maintenant tu fais ce que tu veux mais ce que tu vas obtenir est forcément largement biaisé. Et bien sûr il n'existe pas de correctif possible car c'est inhérent à la nature même des stats que l'on utilise.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» distance de Bray-Curtis
» Quel’ indice Artistiques chosir ?
» Quel test choisir
» Quel test choisir ?
» Quel test choisir?
» Quel’ indice Artistiques chosir ?
» Quel test choisir
» Quel test choisir ?
» Quel test choisir?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum