C’est peut-être la phase la plus importante de ton étude.
Ton tableau de recueil doit être rempli de façon claire et reproductible pour que toi et toutes les personnes qui y ont accès puissiez le lire et le remplir simplement.

Au final un tableau de donnée bien rempli et clair c’est un gain de temps et une diminution du risque d’erreur !

Ta base de données doit être sécurisée et anonymiser c’est ta responsabilité.

Code les variables et les données

Coder c’est transformer des données sous forme de code (logique tu me diras !).

Dans un tableau de données, tu vas rentrer :
• 1 Colonne = 1 Variable
• 1 Ligne = 1 Sujet
• 1 Case = 1 Donnée

Jusque là c’est très simple

En général on utilise 2 pages (tableaux) sur le même fichier.
La première page c’est ta page de recueil à proprement parler, c’est là que tu va mettre tes données.
La deuxième page c’est là ou tu vas expliquer ton code. Cette page c’est pour te souvenir ce que signifie chaque variable (ex : EVA = Échelle Visuelle Analogique // Codée 0 à 10 // 0=Pas de douleurs – 10=Douleurs max).

Règle de base pour remplir le tableur :
• Pas d’accent
• Pas d’espace
• Pas de majuscule
• Pas de caractère spécial

Coder les variables :

Les variables (colonnes) doivent être identifiées en tête de colonne. Elles sont généralement identifiées par un nom simple et sans espaces. Par exemple, on codera « Douleur Pré-opératoire » en « EVA.preop ».
En codant les variables de cette manière cela rend l’analyse claire et simple toutes les informations complémentaires étant renseignées sur la deuxième page du tableur.
La première colonne du tableur concerne généralement l’identification du patient (rappel : une base de données doit être ANONYME, d’autant plus quand tu l’envoies !!!). Cette colonne te permet de retrouver tes sujets, mais elle ne doit pas contenir de Nom, Prénom, NIP, Date de Naissance … Lorsque tu transmets ta base de données, tu peux simplement transformer cette colonne en une colonne « sujet » et les variables en « 1 », « 2 », « 3 ».

Coder les données

Pour coder les données, c’est un peu le même principe.
Tu as des données continues (ex : taille, poids, température, PAS …) dans ce cas tu remplis la case correspondant par la valeur que tu as obtenue. N’oublie pas de mettre à quoi correspond cette variable sur ton 2e tableau (ex. : taille = Taille du patient en mètre)
Dans le cas des variables dont la réponse est « Oui » ou « Non » on les code par habitude en « 0 » pour Non et « 1 » pour Oui.
Si tu as des variables dont la réponse est un nom, tu as plusieurs solutions. Prenons l’exemple d’une variable métier tu peux, soit les coder avec quelques lettres (ex. : Ouvier = ouv, Salarié = sal …) ou tu recodes en chiffre (ex. : Ouvrier = 1, Salarié = 2 …). Encore une fois on remplit la 2e page du tableur pour bien rappeler ce à quoi correspond chaque code.

Une fois que ton tableau est bien rempli, il ne te reste plus qu’à contrôler tes données

Contrôle des données

Valeurs aberrantes

Ce sont des valeurs qui n’ont aucun sens. Elles peuvent être dues à une erreur de saisie (oubli d’un point, valeurs dans une mauvaise unité…).

Pour retrouver ces valeurs, il faut contrôler chacune des variables une à une. Le plus simple c’est d’utiliser la fonction filtre et de regarder les extrêmes pour chacune des colonnes. Ainsi tu repèreras d’un premier coup d’oeil si dans ta colonne Kaliémie tu as une valeur maximale à 70mmol/L.

Données manquantes

Il arrive souvent que certaines données soient manquantes ou non disponibles.
Dans ce cas-là c’est assez simple tu laisses la case concernée vide. Évite les codages compliqués du genre Na ou Nan ou NA qui sont plus difficiles à analyser après via les logiciels de statistique.
Donc pour faire simple Donnée Manquante = Case Vide.

Cas Particulier des Données de Survie

Les études de survie, si tu te souviens des cours de LCA, c’est des études longitudinales ou l’on suit un paramètre évoluant dans le temps.
C’est des études qui possèdent leurs analyses statistiques propres. Dans ce cas là il faut remplir les tableaux de variables de façon spécifique.

Dans ton tableau d’étude de survie, les mêmes règles s’appliquent que précédemment, mais on est avec des données temporelles. Il faut donc rajouter des colonnes :
• Durée de Suivie : C’est le temps ou le patient a été suivi dans l’étude (par exemple si le patient a été suivi pendant 3 mois on met 3 mois ou 90j)
• Durée de Survie : C’est le temps entre le début du suivi du patient et l’apparition du signe d’intérêt (ex. : Temps entre le début du suivi et le décès ou Temps entre le début du suivi et l’apparition d’une récidive …)

Maintenant à toi de Jouer !