• Quejarse

Rubén Sanchez Sancho - Ciencia de Datos con R

Aquí puedes leer online Rubén Sanchez Sancho - Ciencia de Datos con R texto completo del libro (historia completa) en español de forma gratuita. Descargue pdf y epub, obtenga significado, portada y reseñas sobre este libro electrónico. Año: 2017, Género: Ordenador. Descripción de la obra, (prefacio), así como las revisiones están disponibles. La mejor biblioteca de literatura LitFox.es creado para los amantes de la buena lectura y ofrece una amplia selección de géneros:

Novela romántica Ciencia ficción Aventura Detective Ciencia Historia Hogar y familia Prosa Arte Política Ordenador No ficción Religión Negocios Niños

Elija una categoría favorita y encuentre realmente lee libros que valgan la pena. Disfrute de la inmersión en el mundo de la imaginación, sienta las emociones de los personajes o aprenda algo nuevo para usted, haga un descubrimiento fascinante.

Rubén Sanchez Sancho Ciencia de Datos con R

Ciencia de Datos con R: resumen, descripción y anotación

Ofrecemos leer una anotación, descripción, resumen o prefacio (depende de lo que el autor del libro "Ciencia de Datos con R" escribió él mismo). Si no ha encontrado la información necesaria sobre el libro — escribe en los comentarios, intentaremos encontrarlo.

Importa Ordena Transforma Visualiza Comunica

Rubén Sanchez Sancho: otros libros del autor


¿Quién escribió Ciencia de Datos con R? Averigüe el apellido, el nombre del autor del libro y una lista de todas las obras del autor por series.

Ciencia de Datos con R — leer online gratis el libro completo

A continuación se muestra el texto del libro, dividido por páginas. Sistema guardar el lugar de la última página leída, le permite leer cómodamente el libro" Ciencia de Datos con R " online de forma gratuita, sin tener que buscar de nuevo cada vez donde lo dejaste. Poner un marcador, y puede ir a la página donde terminó de leer en cualquier momento.

Luz

Tamaño de fuente:

Restablecer

Intervalo:

Marcador:

Hacer
Tabla de contenido
  1. 1.1
  2. 1.2
  3. Parte 1. Lenguaje R
  4. 2.1
    1. 2.1.1
    2. 2.1.2
    3. 2.1.3
      1. 2.1.3.1
      2. 2.1.3.2
      3. 2.1.3.3
      4. 2.1.3.4
    4. 2.1.4
    5. 2.1.5
      1. 2.1.5.1
      2. 2.1.5.2
      3. 2.1.5.3
    6. 2.1.6
  5. 2.2
    1. 2.2.1
    2. 2.2.2
    3. 2.2.3
    4. 2.2.4
    5. 2.2.5
  6. 2.3
    1. 2.3.1
    2. 2.3.2
  7. 2.4
  8. 2.5
  9. Parte 2. Manipulación de Datos
  10. 3.1
    1. 3.1.1
    2. 3.1.2
    3. 3.1.3
    4. 3.1.4
  11. Parte 3. Visualización de Datos
  12. Apéndice
Lectura de Archivos Jerarquizados
Lectura de Archivos Jerarquizados

En ocasiones necesitaremos importar datos de sitios web. La mayoría de proveedores proporcionan los datos en formato XML y JSON. En esta sección, aprenderemos como leer datos de archivos JSON y XML.

Además, en el último apartado veremos como importar tablas HTML alojadas en sitios web.

Lectura de archivos JSON en R

Para importar archivos JSON, primero necesitamos instalar y/o cargar el paquete jsonlite.

Instalación

Podemos instalar jsonlitedesde CRAN:

# Instalamos el paquete install.packages( "jsonlite" )
Uso

Para importar archivos JSON haremos uso de la función fromJSON():

# Cargamos `rjson` library (jsonlite)# Importamos los datos a un dataframe desde Github en un archivo json datos <- fromJSON( "https://api.github.com/users/rsanchezs/repos" ) # Mostramos las variables de ´datos´ names(datos) ## [1] "id" "name" "full_name" ## [4] "owner" "private" "html_url" ## [7] "description" "fork" "url" ## [10] "forks_url" "keys_url" "collaborators_url" ## [13] "teams_url" "hooks_url" "issue_events_url" ## [16] "events_url" "assignees_url" "branches_url" ## [19] "tags_url" "blobs_url" "git_tags_url" ## [22] "git_refs_url" "trees_url" "statuses_url" ## [25] "languages_url" "stargazers_url" "contributors_url" ## [28] "subscribers_url" "subscription_url" "commits_url" ## [31] "git_commits_url" "comments_url" "issue_comment_url" ## [34] "contents_url" "compare_url" "merges_url" ## [37] "archive_url" "downloads_url" "issues_url" ## [40] "pulls_url" "milestones_url" "notifications_url" ## [43] "labels_url" "releases_url" "deployments_url" ## [46] "created_at" "updated_at" "pushed_at" ## [49] "git_url" "ssh_url" "clone_url" ## [52] "svn_url" "homepage" "size" ## [55] "stargazers_count" "watchers_count" "language" ## [58] "has_issues" "has_projects" "has_downloads" ## [61] "has_wiki" "has_pages" "forks_count" ## [64] "mirror_url" "archived" "open_issues_count" ## [67] "forks" "open_issues" "watchers" ## [70] "default_branch"# Accedemos a los nombres de mis repositorios datos$name ## [1] "appliedStatsR" ## [2] "ciencia-de-datos-con-r" ## [3] "ciencia-de-datos-con-r-casos-de-estudio" ## [4] "ciencia-de-datos-con-r-libro" ## [5] "courses" ## [6] "datasciencecoursera" ## [7] "datasharing" ## [8] "dplyr" ## [9] "EHairdressing" ## [10] "jekyll-now" ## [11] "manipulacion-datos-con-r" ## [12] "MITx_6_00_1x" ## [13] "probability" ## [14] "programacion-en-r" ## [15] "programacion-estadistica-r" ## [16] "PY4E" ## [17] "r4ds" ## [18] "RGraphic" ## [19] "rprogramming" ## [20] "rsanchezs.github.io" ## [21] "statsR" ## [22] "videoRprogramming" ## [23] "visualizacion-de-datos-con-r" ## [24] "webinars"
Lectura de archivos XML en R

Si deseamos importar archivos XML, una de los métodos más fáciles es mediante el uso del paquete XML2.

Instalación

Podemos installar xml2desde CRAN:

# Instalación de `xml2` desde CRAN install.packages( "xml2" )

o podemos instalar la versión en desarrollo en GitHub, con la ayuda de devtools:

# Instalación desde el repositorio de GitHub install_github( "r-lib/xml2" )
Uso

Mediante la función read_xml() podemos importar archivos XML:

# Cargamos el paquete library (xml2) # Importamos los datos XML archivo_xml <- read_xml( "data/empleados.xml" ) archivo_xml ## {xml_document} ## ## [1] \n 1\n Ruben\n 623.3 ... ## [2] \n 2\n Ramon\n 515.2 ... ## [3] \n 3\n Tomas\n 611</ ... ## [4] \n 4\n Marga\n 729</ ... ## [5] \n 5\n Miguel\n 843.... ## [6] \n 6\n Nuria\n 578</ ... ## [7] \n 7\n Jaime\n 632.8 ... ## [8] \n 8\n Dani\n 722.5< ...

En primer lugar, podríamos estar interesados en el número de nodos que contienen el archivo y que podemos conocer como se muestra a continuación:

# Mostramos el número de nodos del archivo xml_length(archivo_xml) ## [1] 8

Podemos acceder a un nodo con la ayuda de la función xml_child() como se muestra en el siguiente fragmento de código:

# Accedemos al primer nodo xml_child(archivo_xml, ) ## {xml_node} ## ## [1] 1 ## [2] Ruben ## [3] 623.3 ## [4] 1/1/2012 ## [5] IT

Para conocer todos los valores de un nodo que coinciden con una expresión xpath podemos hacerlo como se muestra a continuación:

# Conocer todos los valores que coinciden con un elemento nombre <- xml_find_all(archivo_xml, ".//NOMBRE" ) nombre ## {xml_nodeset (8)} ## [1] Ruben ## [2] Ramon ## [3] Tomas ## [4] Marga ## [5] Miguel ## [6] Nuria ## [7] Jaime ## [8] Dani

Con la ayuda de la función xml_text(), xml_double y xml_integer obtendremos un vector de caracteres, reales o enteros respectivamente del documento, nodo o conjunto de nodos:

# Convertir un documento, nodo o conjunto de nodo a vectores nombres <- xml_text(nombre) nombres ## [1] "Ruben" "Ramon" "Tomas" "Marga" "Miguel" "Nuria" "Jaime" "Dani"

Con lo visto hasta ahora podemos pasar el documento XML a un dataframe para nuestro análisis como se muestra a continuación:

# Obtenemos los valores de cado nodo en un vector id <- xml_integer(xml_find_all(archivo_xml, ".//ID" )) nombre <- xml_text(xml_find_all(archivo_xml, ".//NOMBRE" )) salario <- xml_double(xml_find_all(archivo_xml, ".//SALARIO" )) alta <- xml_text(xml_find_all(archivo_xml, ".//ALTA" )) dept <- xml_text(xml_find_all(archivo_xml, ".//DEPT" )) # Creamos un dataframe a partir de los vectores plantilla <- data.frame(id, nombre, salario, alta, dept) plantilla ## id nombre salario alta dept ## 1 1 Ruben 623.30 1/1/2012 IT ## 2 2 Ramon 515.20 9/23/2013 Produccion ## 3 3 Tomas 611.00 11/15/2014 IT ## 4 4 Marga 729.00 5/11/2014 HR ## 5 5 Miguel 843.25 3/27/2015 Finanzas ## 6 6 Nuria 578.00 5/21/2013 Limpieza ## 7 7 Jaime 632.80 7/30/2013 I+D ## 8 8 Dani 722.50 6/17/2014 Produccion
Lectura de tablas HTML en R

Para importar tablas HTML necesitaremos del paquete rvest.

Instalación

Para conseguir la última versión desde CRAN

# Instalación de `rvest`desde CRAN install.packages( "rvest" )

Para descargar la versión en desarrollo desde su repositorio en GitHub:

# install.packages('devtools') devtools::install_github( "hadley/rvest" )
Uso

Cargamos la libreria rvest:

# Cargamos la libreria `rvest` library (rvest)

Para el ejemplo, además haremos uso del paquete xml2 para descargar una tabla de la siguiente con los nombres de niño y niña más comunes en 2017:

# Cargamos la libreria `xml2` library (xml2)

Descargamos la página mediante xml2::read_html() y con la ayuda de xml2::xml_find_first() encontramos el nodo que coincide con xpath = "//table":

# Descargamos la página html <- read_html( "http://www.enterat.com/servicios/nombres-nino-nina.php" ) # Encontramos el elemento que coincide con la clase `table` tabla <- xml_find_first(html, xpath = "//table" )
Página siguiente
Luz

Tamaño de fuente:

Restablecer

Intervalo:

Marcador:

Hacer

Libros similares «Ciencia de Datos con R»

Mira libros similares a Ciencia de Datos con R. Hemos seleccionado literatura similar en nombre y significado con la esperanza de proporcionar lectores con más opciones para encontrar obras nuevas, interesantes y aún no leídas.


José Manuel Sánchez Ron - El poder de la ciencia
El poder de la ciencia
José Manuel Sánchez Ron
Rubén Darío - Prosa dispersa
Prosa dispersa
Rubén Darío
José Manuel Sánchez Ron - Los pilares de la ciencia
Los pilares de la ciencia
José Manuel Sánchez Ron
Rubén Darío - Cabezas
Cabezas
Rubén Darío
Ian Gibson - Yo, Rubén Darío
Yo, Rubén Darío
Ian Gibson
No cover
No cover
José Manuel Sánchez Ron
José Maza Sancho - Somos polvo de estrellas
Somos polvo de estrellas
José Maza Sancho
Reseñas sobre «Ciencia de Datos con R»

Discusión, reseñas del libro Ciencia de Datos con R y solo las opiniones de los lectores. Deja tus comentarios, escribe lo que piensas sobre la obra, su significado o los personajes principales. Especifica exactamente lo que te gustó y lo que no te gustó, y por qué crees que sí.