Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Fnac : 2 Funko Pop achetées : le 3ème offert (large sélection de ...
Voir le deal

Correlation entre deux séries de données

3 participants

Aller en bas

Correlation entre deux séries de données Empty Correlation entre deux séries de données

Message par SherrifPepper Ven 30 Nov 2018 - 10:20

Bonjour à tous !
J'espère que vous allez bien.

Dans le cadre de mon travail en sécurité informatique, je suis en train de développer un outil assez spécifique.
En gros, nous recevons des tickets d'un client spécifique, et mon outil extrait des données, pour chaque incident, telles que :
- Le numéro de la règle de sécurité qui a trig
- La date et l'heure
- Le numéro de l'utilisateur
- Le numéro de la machine (alphanumérique)
- Les adresses IP source et destination, ainsi que les ports
- Le nom du réseau
- etc ...

Il se trouve que ce client nous fournit souvent des doublons (la même règle a trig la semaine d'avant pour la même raison, par exemple, si la règle se déclenche s'il y a quelqu'un qui se connecte sur 10 ports d'une IP en 1 minute, et qu'en fait c'est un admin qui a besoin de ça, mais qu'il le fait chaque semaine et que chaque semaine on a le ticket ...)

Ce que j'aimerais faire, c'est, en entrant des critères de recherche (par exemple la règle, l'ip source, etc), que l'outil me sorte des anciens tickets ressemblants, avec une forte probabilité que ce soit un doublon.

J'ai donc, pour chaque événement, une série de données quantitatives (non ordonnées, à part la date) et surtout des qualitatives, et je cherche à faire un test pour savoir si deux événements sont corrélés ou pas.
J'ai pensé à pondérer chaque critère et faire des comparaisons "simples", mais j'aurais aimé quelque chose de plus poussé si ça existe.

Le souci c'est que je n'ai aucune idée de comment m'y prendre ... Je sors d'un master en mathématiques-informatique, mais les seuls tests statistiques de corrélation que j'aie vue sont des test qui permettent de mettre en lien deux variables, et ce n'est pas vraiment ce que je cherche ... J'ai aussi un peu étudié les ACM mais pas assez pour savoir si ça a un lien.

Si certains ont des idées qui pourraient me guider vers une piste, je vous en serais infiniment reconnaissant Very Happy

Merci d'avance !

SherrifPepper

Nombre de messages : 1
Date d'inscription : 30/11/2018

Revenir en haut Aller en bas

Correlation entre deux séries de données Empty Re: Correlation entre deux séries de données

Message par stat714 Mar 27 Juil 2021 - 1:29

bonjour il faut calculer la covariance entre deux matrice de donnée

stat714

Nombre de messages : 17
Date d'inscription : 04/01/2016

Revenir en haut Aller en bas

Correlation entre deux séries de données Empty Re: Correlation entre deux séries de données

Message par gg Mar 27 Juil 2021 - 7:24

Bonjour.

Je n'ai pas l'impression qu'il s'agisse d'un problème statistique, puisque tu cherches simplement à savoir si un événement a déjà eu lieu à une autre date (la notion de corrélation ne concerne pas des individus statistiques (*) mais des variables statistiques.
A moins que tu veuilles rechercher les événements qui se répètent souvent, ce qui relève des méthodes de classification voire du data mining.

Cordialement.

(*) ici, les individus statistiques sont tes enregistrements.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Correlation entre deux séries de données Empty Re: Correlation entre deux séries de données

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum