Créer deux vecteurs \(u\) et \(v\) de taille 6. Calculer \(u^\intercal v\), \(u v^\intercal\) avec les commandes %*%
puis les commandes crossprod
et tcrossprod
.
Créer une matrice \(A\) à 3 lignes et 2 colonnes à partie du vecteur \(u\) puis une matrice \(B\) à 2 lignes et 3 colonnes à partir du vecteur \(v\) Effectuer un produit matriciel entre \(A\) et \(B\) puis entre \(B\) et \(A\).
À partir des matrice \(A\) et \(B\), calculer le produit scalaire entre les deux dernières lines de \(A\) et la 1ère colonne de \(B\).
Concaténer les matrices \(A\) et \(B^\intercal\) en colonne pour former une matrice \(6 \times 4\). De même, concaténer \(A^\intercal\) et \(B\) en ligne pour obtenir une matrice \(4 \times 6\)
Charger les valeurs numériques des données iris à l’aide de la commande
Donner la dimension de la matrice ainsi construite. Trouver la plus grande valeur observée. Donner le numéro de ligne et de colonne correspondant.
Calculer la moyenne en ligne et en colonne, d’abord avec les commandes rowSums
, colSums
et nrow
, ncol
, puis à l’aide de la commande apply
. Quel individu à la plus grande longueur de Sépale ? Largeur de Pétale
Représenter le graphe des paires de variable à l’aide de la commande pairs
.
microarray <- as.matrix(read.table("http://statweb.stanford.edu/~tibs/ElemStatLearn/datasets/14cancer.xtrain"))
heatmap
.On utilise un programme permettant de calculer le nombre d’occurence des 4 nucléotides “a”, “c”, “g” et “t” dans une séquence d’ADN. Celui-ci renvoie une liste comportant 4 éléments, chacun étant un vecteurs décrivant les indices des occurrences des lettres correspondantes.
R
correspondant à l’exécution du programme ci-dessus.sapply
).Charger le tableau de données diamonds
(commande data
). Vérifier qu’il s’agit bien d’un data.frame
. Déterminer les noms des variables considérées et leur nature. Faites un résumé numérique.
subset
, extraire les entrée du tableau telles que
Premium
Déterminer le prix moyen par classe de qualité. Même question par intervalle de carat (vous créerez une variable factorielle composée de 6 intervalle à l’aide la fonction cut
).
Tracer le volume en fonction du prix, le carat en fonction du prix. Représenter les boxplot de carat, prix et profondeur par classe de qualité et par couleur.
Pour chaque triplet (cut,color,clarity), renvoyer le prix moyen.