Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Correlation entre deux séries de données
3 participants
Page 1 sur 1
Correlation entre deux séries de données
Bonjour à tous !
J'espère que vous allez bien.
Dans le cadre de mon travail en sécurité informatique, je suis en train de développer un outil assez spécifique.
En gros, nous recevons des tickets d'un client spécifique, et mon outil extrait des données, pour chaque incident, telles que :
- Le numéro de la règle de sécurité qui a trig
- La date et l'heure
- Le numéro de l'utilisateur
- Le numéro de la machine (alphanumérique)
- Les adresses IP source et destination, ainsi que les ports
- Le nom du réseau
- etc ...
Il se trouve que ce client nous fournit souvent des doublons (la même règle a trig la semaine d'avant pour la même raison, par exemple, si la règle se déclenche s'il y a quelqu'un qui se connecte sur 10 ports d'une IP en 1 minute, et qu'en fait c'est un admin qui a besoin de ça, mais qu'il le fait chaque semaine et que chaque semaine on a le ticket ...)
Ce que j'aimerais faire, c'est, en entrant des critères de recherche (par exemple la règle, l'ip source, etc), que l'outil me sorte des anciens tickets ressemblants, avec une forte probabilité que ce soit un doublon.
J'ai donc, pour chaque événement, une série de données quantitatives (non ordonnées, à part la date) et surtout des qualitatives, et je cherche à faire un test pour savoir si deux événements sont corrélés ou pas.
J'ai pensé à pondérer chaque critère et faire des comparaisons "simples", mais j'aurais aimé quelque chose de plus poussé si ça existe.
Le souci c'est que je n'ai aucune idée de comment m'y prendre ... Je sors d'un master en mathématiques-informatique, mais les seuls tests statistiques de corrélation que j'aie vue sont des test qui permettent de mettre en lien deux variables, et ce n'est pas vraiment ce que je cherche ... J'ai aussi un peu étudié les ACM mais pas assez pour savoir si ça a un lien.
Si certains ont des idées qui pourraient me guider vers une piste, je vous en serais infiniment reconnaissant
Merci d'avance !
J'espère que vous allez bien.
Dans le cadre de mon travail en sécurité informatique, je suis en train de développer un outil assez spécifique.
En gros, nous recevons des tickets d'un client spécifique, et mon outil extrait des données, pour chaque incident, telles que :
- Le numéro de la règle de sécurité qui a trig
- La date et l'heure
- Le numéro de l'utilisateur
- Le numéro de la machine (alphanumérique)
- Les adresses IP source et destination, ainsi que les ports
- Le nom du réseau
- etc ...
Il se trouve que ce client nous fournit souvent des doublons (la même règle a trig la semaine d'avant pour la même raison, par exemple, si la règle se déclenche s'il y a quelqu'un qui se connecte sur 10 ports d'une IP en 1 minute, et qu'en fait c'est un admin qui a besoin de ça, mais qu'il le fait chaque semaine et que chaque semaine on a le ticket ...)
Ce que j'aimerais faire, c'est, en entrant des critères de recherche (par exemple la règle, l'ip source, etc), que l'outil me sorte des anciens tickets ressemblants, avec une forte probabilité que ce soit un doublon.
J'ai donc, pour chaque événement, une série de données quantitatives (non ordonnées, à part la date) et surtout des qualitatives, et je cherche à faire un test pour savoir si deux événements sont corrélés ou pas.
J'ai pensé à pondérer chaque critère et faire des comparaisons "simples", mais j'aurais aimé quelque chose de plus poussé si ça existe.
Le souci c'est que je n'ai aucune idée de comment m'y prendre ... Je sors d'un master en mathématiques-informatique, mais les seuls tests statistiques de corrélation que j'aie vue sont des test qui permettent de mettre en lien deux variables, et ce n'est pas vraiment ce que je cherche ... J'ai aussi un peu étudié les ACM mais pas assez pour savoir si ça a un lien.
Si certains ont des idées qui pourraient me guider vers une piste, je vous en serais infiniment reconnaissant
Merci d'avance !
SherrifPepper- Nombre de messages : 1
Date d'inscription : 30/11/2018
Re: Correlation entre deux séries de données
bonjour il faut calculer la covariance entre deux matrice de donnée
stat714- Nombre de messages : 17
Date d'inscription : 04/01/2016
Re: Correlation entre deux séries de données
Bonjour.
Je n'ai pas l'impression qu'il s'agisse d'un problème statistique, puisque tu cherches simplement à savoir si un événement a déjà eu lieu à une autre date (la notion de corrélation ne concerne pas des individus statistiques (*) mais des variables statistiques.
A moins que tu veuilles rechercher les événements qui se répètent souvent, ce qui relève des méthodes de classification voire du data mining.
Cordialement.
(*) ici, les individus statistiques sont tes enregistrements.
Je n'ai pas l'impression qu'il s'agisse d'un problème statistique, puisque tu cherches simplement à savoir si un événement a déjà eu lieu à une autre date (la notion de corrélation ne concerne pas des individus statistiques (*) mais des variables statistiques.
A moins que tu veuilles rechercher les événements qui se répètent souvent, ce qui relève des méthodes de classification voire du data mining.
Cordialement.
(*) ici, les individus statistiques sont tes enregistrements.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Sujets similaires
» Correlation entre deux series de donnees en pourcentages
» Etablir une corrélation entre deux séries de données
» Corrélation entre 2 séries de données, quel test?
» Différence entre les résultats de séries appariées et échant
» Corrélation entre deux variables qualitatives
» Etablir une corrélation entre deux séries de données
» Corrélation entre 2 séries de données, quel test?
» Différence entre les résultats de séries appariées et échant
» Corrélation entre deux variables qualitatives
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum