Discussion:
[R-es] Tibble o data.table?
Jesús Para Fernández
2017-11-22 09:39:08 UTC
Permalink
Buenas

Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer vuestra opinion.

Gracias
Jesús

[[alternative HTML version deleted]]
Carlos Ortega
2017-11-22 20:29:12 UTC
Permalink
Hola,

Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
queda otra opción que usar los tibbles.

La sintaxis de data.table es un tanto compleja frente a la sencillez que
ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer
compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
mismo "sparklyr").

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
***@hotmail.com> escribió:

> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



--
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]
Jesús Para Fernández
2017-11-22 20:51:28 UTC
Permalink
Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse...

Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...
________________________________
De: Carlos Ortega <***@qualityexcellence.es>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-***@r-project.org
Asunto: Re: [R-es] Tibble o data.table?

Hola,

Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te queda otra opción que usar los tibbles.

La sintaxis de data.table es un tanto compleja frente a la sencillez que ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el mismo "sparklyr").

Gracias,
Carlos Ortega
www.qualityexcellence.es<https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>

El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <***@hotmail.com<mailto:***@hotmail.com>> escribió:
Buenas

Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer vuestra opinion.

Gracias
Jesús

[[alternative HTML version deleted]]


_______________________________________________
R-help-es mailing list
R-help-***@r-project.org<mailto:R-help-***@r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es<https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0>



--
Saludos,
Carlos Ortega
www.qualityexcellence.es<https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>

[[alternative HTML version deleted]]
Freddy Omar López Quintero
2017-11-22 20:59:04 UTC
Permalink
El mié, 22-11-2017 a las 20:51 +0000, Jesús Para Fernández escribió:
> Me parece que queda mas limpio, pero no se porque no le pillo la
> gracia

No estás solo en el mundo: si bien muchas cosas facilitan la vida
utilizando elementos de tidyverse, en su conjunto, yo no lo compro,
tampoco. Son como un dialecto en el idioma R.
¡Salud!


--
«...homines autem hominum causa esse generatos...»

Cicero
[[alternative HTML version deleted]]
José Luis Cañadas
2017-11-22 21:01:29 UTC
Permalink
Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la
conexión a fuentes externas , como postgres,spark, presto y usar dplyr como
front.


El mié., 22 nov. 2017 21:51, Jesús Para Fernández <
***@hotmail.com> escribió:

> Tienes razon de que hay una serie de paquetes que lo usan, pero me da que
> vienen impulsados por Rstudio desde el paquete tidyverse...
>
> Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque
> no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para
> atras...
> ________________________________
> De: Carlos Ortega <***@qualityexcellence.es>
> Enviado: miércoles, 22 de noviembre de 2017 21:29
> Para: Jesús Para Fernández
> Cc: r-help-***@r-project.org
> Asunto: Re: [R-es] Tibble o data.table?
>
> Hola,
>
> Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
> queda otra opción que usar los tibbles.
>
> La sintaxis de data.table es un tanto compleja frente a la sencillez que
> ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
> diferencia en rendimiento.
> Por otro lado, son cada vez más los paquetes que se quieren hacer
> compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
> mismo "sparklyr").
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es<
> https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
> >
>
> El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
> ***@hotmail.com<mailto:***@hotmail.com>>
> escribió:
> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org<mailto:R-help-***@r-project.org>
> https://stat.ethz.ch/mailman/listinfo/r-help-es<
> https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0
> >
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es<
> https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
> >
>
> [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]
Jesús Para Fernández
2017-11-22 21:07:56 UTC
Permalink
Que es postgres y presto?? Se uqe google tiene la respuesta,....
________________________________
De: José Luis Cañadas <***@gmail.com>
Enviado: miércoles, 22 de noviembre de 2017 22:01
Para: Jesús Para Fernández
Cc: Carlos Ortega; r-help-***@r-project.org
Asunto: Re: [R-es] Tibble o data.table?


Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la conexión a fuentes externas , como postgres,spark, presto y usar dplyr como front.

El mié., 22 nov. 2017 21:51, Jesús Para Fernández <***@hotmail.com<mailto:***@hotmail.com>> escribió:
Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse...

Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...
________________________________
De: Carlos Ortega <***@qualityexcellence.es<mailto:***@qualityexcellence.es>>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-***@r-project.org<mailto:r-help-***@r-project.org>
Asunto: Re: [R-es] Tibble o data.table?

Hola,

Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te queda otra opción que usar los tibbles.

La sintaxis de data.table es un tanto compleja frente a la sencillez que ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el mismo "sparklyr").

Gracias,
Carlos Ortega
www.qualityexcellence.es<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>

El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <***@hotmail.com<mailto:***@hotmail.com><mailto:***@hotmail.com<mailto:***@hotmail.com>>> escribió:
Buenas

Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer vuestra opinion.

Gracias
Jesús

[[alternative HTML version deleted]]


_______________________________________________
R-help-es mailing list
R-help-***@r-project.org<mailto:R-help-***@r-project.org><mailto:R-help-***@r-project.org<mailto:R-help-***@r-project.org>>
https://stat.ethz.ch/mailman/listinfo/r-help-es<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0>



--
Saludos,
Carlos Ortega
www.qualityexcellence.es<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>

[[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-***@r-project.org<mailto:R-help-***@r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>

[[alternative HTML version deleted]]
José Luis Cañadas
2017-11-22 21:23:13 UTC
Permalink
Te pongo enlace de Presto. De postgress hay muchas referencias.
https://aws.amazon.com/es/emr/details/presto/

Y para Presto existe Rpresto, que permite usar DBI sobre Presto.
Básicamente, permite ver tablas hive en R y hacer sql muy rápidas sobre
grandes volúmenes de datos, sin tener que levantar un spark.

El mié., 22 nov. 2017 22:07, Jesús Para Fernández <
***@hotmail.com> escribió:

> Que es postgres y presto?? Se uqe google tiene la respuesta,....
> ------------------------------
> *De:* José Luis Cañadas <***@gmail.com>
> *Enviado:* miércoles, 22 de noviembre de 2017 22:01
> *Para:* Jesús Para Fernández
> *Cc:* Carlos Ortega; r-help-***@r-project.org
>
> *Asunto:* Re: [R-es] Tibble o data.table?
>
> Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la
> conexión a fuentes externas , como postgres,spark, presto y usar dplyr como
> front.
>
>
> El mié., 22 nov. 2017 21:51, Jesús Para Fernández <
> ***@hotmail.com> escribió:
>
> Tienes razon de que hay una serie de paquetes que lo usan, pero me da que
> vienen impulsados por Rstudio desde el paquete tidyverse...
>
> Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque
> no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para
> atras...
> ________________________________
> De: Carlos Ortega <***@qualityexcellence.es>
> Enviado: miércoles, 22 de noviembre de 2017 21:29
> Para: Jesús Para Fernández
> Cc: r-help-***@r-project.org
> Asunto: Re: [R-es] Tibble o data.table?
>
> Hola,
>
> Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
> queda otra opción que usar los tibbles.
>
> La sintaxis de data.table es un tanto compleja frente a la sencillez que
> ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
> diferencia en rendimiento.
> Por otro lado, son cada vez más los paquetes que se quieren hacer
> compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
> mismo "sparklyr").
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
> <https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
> <
> https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
> >
>
> El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
> ***@hotmail.com<mailto:***@hotmail.com>>
> escribió:
> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org<mailto:R-help-***@r-project.org>
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> <https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
> <
> https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0
> >
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
> <https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
> <
> https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
> >
>
> [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> <https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
>
>

[[alternative HTML version deleted]]
Jesús Para Fernández
2017-11-22 21:36:22 UTC
Permalink
Muchisimas gracias 😊


________________________________
De: José Luis Cañadas <***@gmail.com>
Enviado: miércoles, 22 de noviembre de 2017 22:23
Para: Jesús Para Fernández
Cc: Carlos Ortega; r-help-***@r-project.org
Asunto: Re: [R-es] Tibble o data.table?


Te pongo enlace de Presto. De postgress hay muchas referencias.
https://aws.amazon.com/es/emr/details/presto/<https://eur03.safelinks.protection.outlook.com/?url=https%3A%2F%2Faws.amazon.com%2Fes%2Femr%2Fdetails%2Fpresto%2F&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7Cf775a4ba7b784a806a4e08d531ef46a7%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469826098044239&sdata=z0y7Av3UAVw%2FJfqvzSwENNWQsIpIfnfeW2ju9%2BrC%2F%2Bo%3D&reserved=0>

Y para Presto existe Rpresto, que permite usar DBI sobre Presto. Básicamente, permite ver tablas hive en R y hacer sql muy rápidas sobre grandes volúmenes de datos, sin tener que levantar un spark.

El mié., 22 nov. 2017 22:07, Jesús Para Fernández <***@hotmail.com<mailto:***@hotmail.com>> escribió:
Que es postgres y presto?? Se uqe google tiene la respuesta,....
________________________________
De: José Luis Cañadas <***@gmail.com<mailto:***@gmail.com>>
Enviado: miércoles, 22 de noviembre de 2017 22:01
Para: Jesús Para Fernández
Cc: Carlos Ortega; r-help-***@r-project.org<mailto:r-help-***@r-project.org>

Asunto: Re: [R-es] Tibble o data.table?

Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la conexión a fuentes externas , como postgres,spark, presto y usar dplyr como front.

El mié., 22 nov. 2017 21:51, Jesús Para Fernández <***@hotmail.com<mailto:***@hotmail.com>> escribió:
Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse...

Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...
________________________________
De: Carlos Ortega <***@qualityexcellence.es<mailto:***@qualityexcellence.es>>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-***@r-project.org<mailto:r-help-***@r-project.org>
Asunto: Re: [R-es] Tibble o data.table?

Hola,

Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te queda otra opción que usar los tibbles.

La sintaxis de data.table es un tanto compleja frente a la sencillez que ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el mismo "sparklyr").

Gracias,
Carlos Ortega
www.qualityexcellence.es<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>

El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <***@hotmail.com<mailto:***@hotmail.com><mailto:***@hotmail.com<mailto:***@hotmail.com>>> escribió:
Buenas

Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer vuestra opinion.

Gracias
Jesús

[[alternative HTML version deleted]]


_______________________________________________
R-help-es mailing list
R-help-***@r-project.org<mailto:R-help-***@r-project.org><mailto:R-help-***@r-project.org<mailto:R-help-***@r-project.org>>
https://stat.ethz.ch/mailman/listinfo/r-help-es<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0>



--
Saludos,
Carlos Ortega
www.qualityexcellence.es<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>

[[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-***@r-project.org<mailto:R-help-***@r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>

[[alternative HTML version deleted]]
Carlos Ortega
2017-11-22 21:37:12 UTC
Permalink
PostgresSQL (es una base de datos relacional opensource)
Y Presto es un motor de base de datos distribuida que se entiende con Hive,
Cassandra, etc..

Vaya, lo que quería aportar es otra idea.
Leía hace poco en este blog:

http://winvector.github.io/FluidData/DataWranglingAtScale.html

*"R its is packages"*

Que me parece una de las mejores definiciones a la tradicional de "entorno
y lenguaje para análisis de datos"...
data.table es en sí otro "lenguaje" dentro de "R", su creador ahora está en
H2O que también lo han integrado en la lectura de ficheros.

No veo mucho problema en que RStudio apoye todo el "tidyverse", casi al
contrario es una forma de garantizar consistencia entre toda su sintaxis
con la que puedes hacer gran parte de las actividades que requiere un
proceso de análisis. Y esto que con "dplyr" puedas conectarte a casi
cualquier fuente de datos (ahora tiene conectores empresariales para las
bases de datos BigData: Hive, Impala, ...) es una gran ventaja. O todo lo
que están haciendo con "sparklyr", o más recientemente con "keras" y
"tensorflow". Y con el fichaje de Max Kuhn, y su paquete "recipes", "caret"
también formará parte del ecosistema "tidy".


Saludos,
Carlos Ortega
www.qualityexcellence.es


El 22 de noviembre de 2017, 22:07, Jesús Para Fernández <
***@hotmail.com> escribió:

> Que es postgres y presto?? Se uqe google tiene la respuesta,....
> ------------------------------
> *De:* José Luis Cañadas <***@gmail.com>
> *Enviado:* miércoles, 22 de noviembre de 2017 22:01
> *Para:* Jesús Para Fernández
> *Cc:* Carlos Ortega; r-help-***@r-project.org
>
> *Asunto:* Re: [R-es] Tibble o data.table?
>
>
> Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la
> conexión a fuentes externas , como postgres,spark, presto y usar dplyr como
> front.
>
>
> El mié., 22 nov. 2017 21:51, Jesús Para Fernández <
> ***@hotmail.com> escribió:
>
> Tienes razon de que hay una serie de paquetes que lo usan, pero me da que
> vienen impulsados por Rstudio desde el paquete tidyverse...
>
> Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque
> no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para
> atras...
> ________________________________
> De: Carlos Ortega <***@qualityexcellence.es>
> Enviado: miércoles, 22 de noviembre de 2017 21:29
> Para: Jesús Para Fernández
> Cc: r-help-***@r-project.org
> Asunto: Re: [R-es] Tibble o data.table?
>
> Hola,
>
> Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
> queda otra opción que usar los tibbles.
>
> La sintaxis de data.table es un tanto compleja frente a la sencillez que
> ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
> diferencia en rendimiento.
> Por otro lado, son cada vez más los paquetes que se quieren hacer
> compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
> mismo "sparklyr").
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
> <https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
> <https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%
> 2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%
> 7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaa
> aaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%
> 2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
>
> El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
> ***@hotmail.com<mailto:***@hotmail.com>>
> escribió:
> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org<mailto:R-help-***@r-project.org>
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> <https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
> <https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%
> 2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=
> 02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7
> b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%
> 7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKS
> v89psbhpA489A%3D&reserved=0>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
> <https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
> <https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%
> 2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%
> 7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaa
> aaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%
> 2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
>
> [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> <https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
>
>


--
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]
Loading...