Referencias para R

Esta es una traducción del documento breve de referencia por Tom Short

  1. Aspectos generales:

Vectores: Son el tipo de dato principal de r, permite almacenar múltiples datos en el, de manera similar a una lista

Variables: Son espacios creados por el usuario que almacenan cualquier tipo de dato

<- : Este es el comando de asignación, utilizado para asignar datos a variables

Ejemplo: Calificaciones <- c(10,8,9,7,5)

$ : Este comando permite acceder a un subgrupo (Parte del grupo de datos) dentro de la variable principal, se usa después del nombre de la variable (por ejemplo, una tabla) y antes del nombre del subgrupo de datos que buscamos (por ejemplo, una columna dentro de una tabla)

Ejemplo: Cuestionario$Pregunta1

[ ]: Los corchetes se usan también para seleccionar un subgrupo de datos, sin embargo nos permite especificar por el contenido, más que por el nombre del subgrupo.

Ejemplo: Cuestionario[Pregunta1 < 20]

Funciones y Argumentos: R generalmente utiliza funciones (comandos que le dan ordenes a R) que requieren de argumentos (especificaciones de la orden) colocados dentro de un paréntesis

Ejemplo: mean(3,4,5,6)

Operaciones matemáticas básicas: +(suma),-(resta),/(división),*(multiplicación),^(potencia)

Operaciones lógicas básicas:

> (Mayor que)

< (Menor que)

>= (Mayor o igual que)

<= (Menor o igual que)

== (Igual que)

!= (Diferente que)

2. Manejo de datos

c(x,y): Combina los datos (x,y) colocados como argumentos en un vector

matrix(x, nrow=,ncol=): Genera una matriz con los datos (x) con el numero de columnas y lineas indicadas en nrow y ncol respectivamente.

array(x,dim=): Genera un arreglo con los datos (x) del numero y tamaño de dimensiones especificadas en dim.

read.csv(“archivo.csv”): Carga un archivo csv a R, busca en la carpeta “Mis documentos” por defecto

3. Estadística descriptiva

mean(x, na.rm=): Obtendrá la media de los datos (x) solicitados, si se pone na.rm=TRUE, ignorará los datos faltantes (si los hay).

median(x, na.rm=): Obtendrá la mediana de los datos (x) solicitados, si se pone na.rm=TRUE, ignorará los datos faltantes (si los hay).

sd(x, na.rm=): Obtendrá la desviación estándar de los datos (x) solicitados, si se pone na.rm=TRUE, ignorará los datos faltantes (si los hay).

summary(x, na.rm=): genera un resumen de los datos (x) solicitados, incluye media, mínimo, máximo y cuartiles.

4. Gráficas

hist(x, col=, main=, sub=,xlab=,ylab=): genera un histograma de la frecuencia de (x), se puede incluir el color (col=), cambiar el título (main=) así como el subtitulo (sub=), y editar las etiquetas en el eje x (xlab) y el eje y (ylab).

pie(x, col=, main=, sub=,labels=): genera una gráfica de pastel de la frecuencia de (x), se puede incluir el color (col=), cambiar el título (main=) así como el subtitulo (sub=), y editar las etiquetas de cada rebanada de la gráfica (labels=).

Share

You may also like...

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *