Rubén Sanchez Sancho - Ciencia de Datos con R
Aquí puedes leer online Rubén Sanchez Sancho - Ciencia de Datos con R texto completo del libro (historia completa) en español de forma gratuita. Descargue pdf y epub, obtenga significado, portada y reseñas sobre este libro electrónico. Año: 2017, Género: Ordenador. Descripción de la obra, (prefacio), así como las revisiones están disponibles. La mejor biblioteca de literatura LitFox.es creado para los amantes de la buena lectura y ofrece una amplia selección de géneros:
Novela romántica
Ciencia ficción
Aventura
Detective
Ciencia
Historia
Hogar y familia
Prosa
Arte
Política
Ordenador
No ficción
Religión
Negocios
Niños
Elija una categoría favorita y encuentre realmente lee libros que valgan la pena. Disfrute de la inmersión en el mundo de la imaginación, sienta las emociones de los personajes o aprenda algo nuevo para usted, haga un descubrimiento fascinante.
- Libro:Ciencia de Datos con R
- Autor:
- Genre:
- Año:2017
- Índice:3 / 5
- Favoritos:Añadir a favoritos
- Tu marca:
- 60
- 1
- 2
- 3
- 4
- 5
Ciencia de Datos con R: resumen, descripción y anotación
Ofrecemos leer una anotación, descripción, resumen o prefacio (depende de lo que el autor del libro "Ciencia de Datos con R" escribió él mismo). Si no ha encontrado la información necesaria sobre el libro — escribe en los comentarios, intentaremos encontrarlo.
Ciencia de Datos con R — leer online gratis el libro completo
A continuación se muestra el texto del libro, dividido por páginas. Sistema guardar el lugar de la última página leída, le permite leer cómodamente el libro" Ciencia de Datos con R " online de forma gratuita, sin tener que buscar de nuevo cada vez donde lo dejaste. Poner un marcador, y puede ir a la página donde terminó de leer en cualquier momento.
Tamaño de fuente:
Intervalo:
Marcador:
- 1.1
- 1.2
- Parte 1. Lenguaje R
- 2.1
- 2.1.1
- 2.1.2
- 2.1.3
- 2.1.3.1
- 2.1.3.2
- 2.1.3.3
- 2.1.3.4
- 2.1.4
- 2.1.5
- 2.1.5.1
- 2.1.5.2
- 2.1.5.3
- 2.1.6
- 2.2
- 2.2.1
- 2.2.2
- 2.2.3
- 2.2.4
- 2.2.5
- 2.3
- 2.3.1
- 2.3.2
- 2.4
- 2.5
- Parte 2. Manipulación de Datos
- 3.1
- 3.1.1
- 3.1.2
- 3.1.3
- 3.1.4
- Parte 3. Visualización de Datos
- Apéndice
En ocasiones necesitaremos importar datos de sitios web. La mayoría de proveedores proporcionan los datos en formato XML y JSON. En esta sección, aprenderemos como leer datos de archivos JSON y XML.
Además, en el último apartado veremos como importar tablas HTML alojadas en sitios web.
Para importar archivos JSON, primero necesitamos instalar y/o cargar el paquete jsonlite.
Podemos instalar jsonlite
desde CRAN:
# Instalamos el paquete install.packages( "jsonlite" )
Para importar archivos JSON haremos uso de la función fromJSON()
:
# Cargamos `rjson` library (jsonlite)
# Importamos los datos a un dataframe desde Github en un archivo json datos <- fromJSON( "https://api.github.com/users/rsanchezs/repos" ) # Mostramos las variables de ´datos´ names(datos) ## [1] "id" "name" "full_name" ## [4] "owner" "private" "html_url" ## [7] "description" "fork" "url" ## [10] "forks_url" "keys_url" "collaborators_url" ## [13] "teams_url" "hooks_url" "issue_events_url" ## [16] "events_url" "assignees_url" "branches_url" ## [19] "tags_url" "blobs_url" "git_tags_url" ## [22] "git_refs_url" "trees_url" "statuses_url" ## [25] "languages_url" "stargazers_url" "contributors_url" ## [28] "subscribers_url" "subscription_url" "commits_url" ## [31] "git_commits_url" "comments_url" "issue_comment_url" ## [34] "contents_url" "compare_url" "merges_url" ## [37] "archive_url" "downloads_url" "issues_url" ## [40] "pulls_url" "milestones_url" "notifications_url" ## [43] "labels_url" "releases_url" "deployments_url" ## [46] "created_at" "updated_at" "pushed_at" ## [49] "git_url" "ssh_url" "clone_url" ## [52] "svn_url" "homepage" "size" ## [55] "stargazers_count" "watchers_count" "language" ## [58] "has_issues" "has_projects" "has_downloads" ## [61] "has_wiki" "has_pages" "forks_count" ## [64] "mirror_url" "archived" "open_issues_count" ## [67] "forks" "open_issues" "watchers" ## [70] "default_branch"
# Accedemos a los nombres de mis repositorios datos$name ## [1] "appliedStatsR" ## [2] "ciencia-de-datos-con-r" ## [3] "ciencia-de-datos-con-r-casos-de-estudio" ## [4] "ciencia-de-datos-con-r-libro" ## [5] "courses" ## [6] "datasciencecoursera" ## [7] "datasharing" ## [8] "dplyr" ## [9] "EHairdressing" ## [10] "jekyll-now" ## [11] "manipulacion-datos-con-r" ## [12] "MITx_6_00_1x" ## [13] "probability" ## [14] "programacion-en-r" ## [15] "programacion-estadistica-r" ## [16] "PY4E" ## [17] "r4ds" ## [18] "RGraphic" ## [19] "rprogramming" ## [20] "rsanchezs.github.io" ## [21] "statsR" ## [22] "videoRprogramming" ## [23] "visualizacion-de-datos-con-r" ## [24] "webinars"
Si deseamos importar archivos XML, una de los métodos más fáciles es mediante el uso del paquete XML2.
Podemos installar xml2
desde CRAN:
# Instalación de `xml2` desde CRAN install.packages( "xml2" )
o podemos instalar la versión en desarrollo en GitHub, con la ayuda de devtools
:
# Instalación desde el repositorio de GitHub install_github( "r-lib/xml2" )
Mediante la función read_xml()
podemos importar archivos XML:
# Cargamos el paquete library (xml2) # Importamos los datos XML archivo_xml <- read_xml( "data/empleados.xml" ) archivo_xml ## {xml_document} ## ## [1] \n 1\n Ruben\n 623.3 ... ## [2] \n 2\n Ramon\n 515.2 ... ## [3] \n 3\n Tomas\n 611</ ... ## [4] \n 4\n Marga\n 729</ ... ## [5] \n 5\n Miguel\n 843.... ## [6] \n 6\n Nuria\n 578</ ... ## [7] \n 7\n Jaime\n 632.8 ... ## [8] \n 8\n Dani\n 722.5< ...
En primer lugar, podríamos estar interesados en el número de nodos que contienen el archivo y que podemos conocer como se muestra a continuación:
# Mostramos el número de nodos del archivo xml_length(archivo_xml) ## [1] 8
Podemos acceder a un nodo con la ayuda de la función xml_child()
como se muestra en el siguiente fragmento de código:
# Accedemos al primer nodo xml_child(archivo_xml, ) ## {xml_node} ## ## [1] 1 ## [2] Ruben ## [3] 623.3 ## [4] 1/1/2012 ## [5] IT
Para conocer todos los valores de un nodo que coinciden con una expresión xpath podemos hacerlo como se muestra a continuación:
# Conocer todos los valores que coinciden con un elemento nombre <- xml_find_all(archivo_xml, ".//NOMBRE" ) nombre ## {xml_nodeset (8)} ## [1] Ruben ## [2] Ramon ## [3] Tomas ## [4] Marga ## [5] Miguel ## [6] Nuria ## [7] Jaime ## [8] Dani
Con la ayuda de la función xml_text()
, xml_double
y xml_integer
obtendremos un vector de caracteres, reales o enteros respectivamente del documento, nodo o conjunto de nodos:
# Convertir un documento, nodo o conjunto de nodo a vectores nombres <- xml_text(nombre) nombres ## [1] "Ruben" "Ramon" "Tomas" "Marga" "Miguel" "Nuria" "Jaime" "Dani"
Con lo visto hasta ahora podemos pasar el documento XML a un dataframe para nuestro análisis como se muestra a continuación:
# Obtenemos los valores de cado nodo en un vector id <- xml_integer(xml_find_all(archivo_xml, ".//ID" )) nombre <- xml_text(xml_find_all(archivo_xml, ".//NOMBRE" )) salario <- xml_double(xml_find_all(archivo_xml, ".//SALARIO" )) alta <- xml_text(xml_find_all(archivo_xml, ".//ALTA" )) dept <- xml_text(xml_find_all(archivo_xml, ".//DEPT" )) # Creamos un dataframe a partir de los vectores plantilla <- data.frame(id, nombre, salario, alta, dept) plantilla ## id nombre salario alta dept ## 1 1 Ruben 623.30 1/1/2012 IT ## 2 2 Ramon 515.20 9/23/2013 Produccion ## 3 3 Tomas 611.00 11/15/2014 IT ## 4 4 Marga 729.00 5/11/2014 HR ## 5 5 Miguel 843.25 3/27/2015 Finanzas ## 6 6 Nuria 578.00 5/21/2013 Limpieza ## 7 7 Jaime 632.80 7/30/2013 I+D ## 8 8 Dani 722.50 6/17/2014 Produccion
Para importar tablas HTML necesitaremos del paquete rvest
.
Para conseguir la última versión desde CRAN
# Instalación de `rvest`desde CRAN install.packages( "rvest" )
Para descargar la versión en desarrollo desde su repositorio en GitHub:
# install.packages('devtools') devtools::install_github( "hadley/rvest" )
Cargamos la libreria rvest
:
# Cargamos la libreria `rvest` library (rvest)
Para el ejemplo, además haremos uso del paquete xml2
para descargar una tabla de la siguiente con los nombres de niño y niña más comunes en 2017:
# Cargamos la libreria `xml2` library (xml2)
Descargamos la página mediante xml2::read_html()
y con la ayuda de xml2::xml_find_first()
encontramos el nodo que coincide con xpath = "//table"
:
# Descargamos la página html <- read_html( "http://www.enterat.com/servicios/nombres-nino-nina.php" ) # Encontramos el elemento que coincide con la clase `table` tabla <- xml_find_first(html, xpath = "//table" )
Tamaño de fuente:
Intervalo:
Marcador:
Libros similares «Ciencia de Datos con R»
Mira libros similares a Ciencia de Datos con R. Hemos seleccionado literatura similar en nombre y significado con la esperanza de proporcionar lectores con más opciones para encontrar obras nuevas, interesantes y aún no leídas.
Discusión, reseñas del libro Ciencia de Datos con R y solo las opiniones de los lectores. Deja tus comentarios, escribe lo que piensas sobre la obra, su significado o los personajes principales. Especifica exactamente lo que te gustó y lo que no te gustó, y por qué crees que sí.