Discussion:
[R-es] Es todo python
Jesús Para Fernández
2017-11-11 11:51:28 UTC
Permalink
Un offtopic para empezar el fin de semana.

Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con 'estupor' que practicamente la gente trabaja con python.

Es cierto que la mayor parte de competiciones son usadas con redes neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver como python para temas de machine learning parece estar ganando la partida...

¿Opiniones?

Obtener Outlook para Android<https://aka.ms/ghei36>


[[alternative HTML version deleted]]
Javier Marcuzzi
2017-11-11 13:44:49 UTC
Permalink
Estimados

Antes de R, intenté algunas cosas con python, hablemos de más de 15 a anos
(no me sale la letra en espannniiiol), yo estaba con le jefe de cátedra de
genética y mejoramiento animal haciendo cosas con fortran y me pareció
mucho más simple, luego encontré R y fue este para muchas cosas. Hace una
semana o dos vi algo porque lo tiene visual studio y un conocido lo usa y
le encanta. Leí sobre modelos mixtos, ellos incluso realizan referencia a
la documentación de R, es algo de costumbre, pero profundizando los
algoritmos de R tienen funcionalidades para los análisis que ellos no
disponen, por otro lado me gustó la forma de colocar cosas, en otras
palabras, si uno quiere conectar R con C# el R.dotnet hace que se yo cuánto
no se actualiza y hoy no lo puedo hacer andar, estaría el sqlserver o
rserver, ellos creo que tienen más simple el colocar en un servidor (es mi
impresión), y otro punto a favor de ellos es la posibilidad de editar
código de distintas cosas, algo de lenguaje humano con títulos, texto, algo
de ecuaciones, otra parte de un análisis estadístico y un gráfico, todo
desde un mismo documento en una forma amigable a la vista. Por otro lado
google y tensorflow es una apuesta interesante y con mucha publicidad, sin
embargo esta semana leí parte de la documentación mi Microsoft que también
ofrece su librería para redes neuronales, y lo comparan en algo de 10 o 15
veces respecto a la velocidad, aunque también vi unos videos saltando
partes donde las herramientas para crear redes neuronales con tensorflow en
forma gráfica son geniales, ellos colocaban y sacaban neuronas y veían como
cambiaba el resultado en el reconocimiento de una imagen o números, y
podían ver cuánto era la contribución de cada una en el resultado final y
en forma gráfica (como si fuese la cuenta del supermercado colocando y
sacando productos pero sin recalcular el entrenamiento y cálculos, solo al
suma total). R es maduro, tiene de todo, pero es a mi impresión duro
respecto a python, lo que en R se puede hacer de muchas formas y con varias
librerías, como por ejemplo acomodar datos, pyr, dlpyr, etc y etc, en caso
de python tienen menos posibilidades para realizar lo mismo, desconozco
como es el resultado en cuándo demora en acomodar los datos para el
posterior análisis, pero es mucho más simple para alguien que comienza
tener una forma y muchos ejemplos con los mismos comandos que como es en R
donde para algo simple muchas veces en la lista aparecen soluciones muy
distantes una de otra.

Javier Rubén Marcuzzi

El 11 de noviembre de 2017, 8:51, Jesús Para Fernández <
***@hotmail.com> escribió:

> Un offtopic para empezar el fin de semana.
>
> Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con
> 'estupor' que practicamente la gente trabaja con python.
>
> Es cierto que la mayor parte de competiciones son usadas con redes
> neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver
> como python para temas de machine learning parece estar ganando la
> partida...
>
> ¿Opiniones?
>
> Obtener Outlook para Android<https://aka.ms/ghei36>
>
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]
Francisco Rodríguez
2017-11-11 15:16:36 UTC
Permalink
Lo de la multiplicidad de soluciones es algo interesante y de lo que más me gusta en R. A veces python resulta muy encasillado y no da la flexibilidad suficiente.


Es cierto que entre muchas soluciones una es mejor que otra, pero en general cuando se empieza por R fácilmente se suele llegar a una solución (por lo menos se llega a una) y si se avanza y si le merece la pena, uno puede profundizar más.


Debo admitir que la empresa privada, por causa en general de gente no estadística que primero aprendieron python están apostando más por esta tecnología que no está exenta de problema y que tiene sus fortalezas.


Pero 2 puntos en los que yo, personal destaco a R sobre python es el entorno de desarrollo RStudio donde lo más parecido en Python (que yo conozca) es el PyCharm que se acerca pero no llega, y el entorno de desarrollo Shiny, que permite rápidamente montar una web sin conocer mucho de otras tecnologías donde lo más parecido en Python es el Flask que aunque da aspectos bastante amigables (en ocasiones mejores que el shiny) es mucho menos trivial en su uso.


Otro punto que se ha destacado es que un lenguaje para Estadísticos (nota, no me gusta dividir el mundo entre data scientist y data ingeneers, es como si ahora hubieran desaparecido los estadísticos y los informáticos) esto tiene lo bueno de que los métodos en R ofrecen en general más riqueza de salida que los de python pero si no hay una mano "informática" por detrás, veo difícil que pueda retomar algunas batallas con éxito frente al mundo python como el tema deep learning y este punto es crucial si R quiere estar a la altura en un futuro.


Un saludo


________________________________
De: R-help-es <r-help-es-***@r-project.org> en nombre de Javier Marcuzzi <***@gmail.com>
Enviado: sábado, 11 de noviembre de 2017 13:44
Para: Jesús Para Fernández
Cc: r-help-***@r-project.org
Asunto: Re: [R-es] Es todo python

Estimados

Antes de R, intenté algunas cosas con python, hablemos de más de 15 a anos
(no me sale la letra en espannniiiol), yo estaba con le jefe de cátedra de
genética y mejoramiento animal haciendo cosas con fortran y me pareció
mucho más simple, luego encontré R y fue este para muchas cosas. Hace una
semana o dos vi algo porque lo tiene visual studio y un conocido lo usa y
le encanta. Leí sobre modelos mixtos, ellos incluso realizan referencia a
la documentación de R, es algo de costumbre, pero profundizando los
algoritmos de R tienen funcionalidades para los análisis que ellos no
disponen, por otro lado me gustó la forma de colocar cosas, en otras
palabras, si uno quiere conectar R con C# el R.dotnet hace que se yo cuánto
no se actualiza y hoy no lo puedo hacer andar, estaría el sqlserver o
rserver, ellos creo que tienen más simple el colocar en un servidor (es mi
impresión), y otro punto a favor de ellos es la posibilidad de editar
código de distintas cosas, algo de lenguaje humano con títulos, texto, algo
de ecuaciones, otra parte de un análisis estadístico y un gráfico, todo
desde un mismo documento en una forma amigable a la vista. Por otro lado
google y tensorflow es una apuesta interesante y con mucha publicidad, sin
embargo esta semana leí parte de la documentación mi Microsoft que también
ofrece su librería para redes neuronales, y lo comparan en algo de 10 o 15
veces respecto a la velocidad, aunque también vi unos videos saltando
partes donde las herramientas para crear redes neuronales con tensorflow en
forma gráfica son geniales, ellos colocaban y sacaban neuronas y veían como
cambiaba el resultado en el reconocimiento de una imagen o números, y
podían ver cuánto era la contribución de cada una en el resultado final y
en forma gráfica (como si fuese la cuenta del supermercado colocando y
sacando productos pero sin recalcular el entrenamiento y cálculos, solo al
suma total). R es maduro, tiene de todo, pero es a mi impresión duro
respecto a python, lo que en R se puede hacer de muchas formas y con varias
librerías, como por ejemplo acomodar datos, pyr, dlpyr, etc y etc, en caso
de python tienen menos posibilidades para realizar lo mismo, desconozco
como es el resultado en cuándo demora en acomodar los datos para el
posterior análisis, pero es mucho más simple para alguien que comienza
tener una forma y muchos ejemplos con los mismos comandos que como es en R
donde para algo simple muchas veces en la lista aparecen soluciones muy
distantes una de otra.

Javier Rubén Marcuzzi

El 11 de noviembre de 2017, 8:51, Jesús Para Fernández <
***@hotmail.com> escribió:

> Un offtopic para empezar el fin de semana.
>
> Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con
> 'estupor' que practicamente la gente trabaja con python.
>
> Es cierto que la mayor parte de competiciones son usadas con redes
> neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver
> como python para temas de machine learning parece estar ganando la
> partida...
>
> ¿Opiniones?
>
> Obtener Outlook para Android<https://aka.ms/ghei36>
>
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
Página de Información de R-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
stat.ethz.ch
Esta es una lista de correo para solicitar ayuda sobre R en español y se entiende como un complemento social a la documentación, libros, etc. disponibles sobre R ...



>

[[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
R-help-***@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
Página de Información de R-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es>
stat.ethz.ch
Esta es una lista de correo para solicitar ayuda sobre R en español y se entiende como un complemento social a la documentación, libros, etc. disponibles sobre R ...




[[alternative HTML version deleted]]
José Luis Cañadas
2017-11-11 20:17:07 UTC
Permalink
---------- Forwarded message ---------
From: José Luis Cañadas <***@gmail.com>
Date: sáb., 11 nov. 2017 21:16
Subject: Re: [R-es] Es todo python
To: Francisco Rodríguez <***@hotmail.com>


Cierto.
Hay mucho Python por ahí fuera, ¿Y qué? Es software libre igual que R y
funciona bien. También es cierto que R da más detalle de salida y más
funcionalidades de cara a entender un modelo, por ejemplo para diagnosis de
los residuos.

Dicen que en esta era del bigdata, Python (y pyspark) es el futuro, pero yo
no lo he hecho de menos teniendo R, sparkr, sparklyr y H2O y el gran
repositorio de GitHub cloudyr para, por ejemplo, conectar R con googlecloud
o los servicios de Amazon web services como Alexa o leer y escribir datos
de S3

También comentan que en entornos de producción Python es mejor, la verdad
que creo que R también puede competir ahi, utilizando librerías como
opencpu, shiny o el ultra fácil plumber para hacer un API REST. Creo que
hay mucho desconocimiento de herramientas de R para ponerlo en entornos
productivos..

Como nota diré que R y particularmente los paquetes FactomineR y factoextra
me han salvado la vida un par de veces cuando tenía datos con variables
categóricas y tenía que hacer clustering u otras cosas raras de esas que
piden los clientes. Muchas de estas técnicas no están implementadas en
Python ni en spark, aunque sería fácil, solo es transformar un poco la
matriz de datos antes de aplicar una descomposición en valores singulares.

Lo dicho, a mí me gustan ambos lenguajes, aunque encuentro más sencillo R.
Y para los que quieran usar cosas de Python dentro de R el paquete
reticulate es fabuloso. Para temas de deeplearnig existe tensorflow y
keras para R, sin olvidarnos del magnífico MxNet (de los chicos de xgboost)

Un saludo y no olvidéis que el próximo jueves empiezan las jornadas de R
hispano en Granada

El sáb., 11 nov. 2017 16:16, Francisco Rodríguez <***@hotmail.com>
escribió:

> Lo de la multiplicidad de soluciones es algo interesante y de lo que más
> me gusta en R. A veces python resulta muy encasillado y no da la
> flexibilidad suficiente.
>
>
> Es cierto que entre muchas soluciones una es mejor que otra, pero en
> general cuando se empieza por R fácilmente se suele llegar a una solución
> (por lo menos se llega a una) y si se avanza y si le merece la pena, uno
> puede profundizar más.
>
>
> Debo admitir que la empresa privada, por causa en general de gente no
> estadística que primero aprendieron python están apostando más por esta
> tecnología que no está exenta de problema y que tiene sus fortalezas.
>
>
> Pero 2 puntos en los que yo, personal destaco a R sobre python es el
> entorno de desarrollo RStudio donde lo más parecido en Python (que yo
> conozca) es el PyCharm que se acerca pero no llega, y el entorno de
> desarrollo Shiny, que permite rápidamente montar una web sin conocer mucho
> de otras tecnologías donde lo más parecido en Python es el Flask que aunque
> da aspectos bastante amigables (en ocasiones mejores que el shiny) es mucho
> menos trivial en su uso.
>
>
> Otro punto que se ha destacado es que un lenguaje para Estadísticos (nota,
> no me gusta dividir el mundo entre data scientist y data ingeneers, es como
> si ahora hubieran desaparecido los estadísticos y los informáticos) esto
> tiene lo bueno de que los métodos en R ofrecen en general más riqueza de
> salida que los de python pero si no hay una mano "informática" por detrás,
> veo difícil que pueda retomar algunas batallas con éxito frente al mundo
> python como el tema deep learning y este punto es crucial si R quiere estar
> a la altura en un futuro.
>
>
> Un saludo
>
>
> ________________________________
> De: R-help-es <r-help-es-***@r-project.org> en nombre de Javier
> Marcuzzi <***@gmail.com>
> Enviado: sábado, 11 de noviembre de 2017 13:44
> Para: Jesús Para Fernández
> Cc: r-help-***@r-project.org
> Asunto: Re: [R-es] Es todo python
>
> Estimados
>
> Antes de R, intenté algunas cosas con python, hablemos de más de 15 a anos
> (no me sale la letra en espannniiiol), yo estaba con le jefe de cátedra de
> genética y mejoramiento animal haciendo cosas con fortran y me pareció
> mucho más simple, luego encontré R y fue este para muchas cosas. Hace una
> semana o dos vi algo porque lo tiene visual studio y un conocido lo usa y
> le encanta. Leí sobre modelos mixtos, ellos incluso realizan referencia a
> la documentación de R, es algo de costumbre, pero profundizando los
> algoritmos de R tienen funcionalidades para los análisis que ellos no
> disponen, por otro lado me gustó la forma de colocar cosas, en otras
> palabras, si uno quiere conectar R con C# el R.dotnet hace que se yo cuánto
> no se actualiza y hoy no lo puedo hacer andar, estaría el sqlserver o
> rserver, ellos creo que tienen más simple el colocar en un servidor (es mi
> impresión), y otro punto a favor de ellos es la posibilidad de editar
> código de distintas cosas, algo de lenguaje humano con títulos, texto, algo
> de ecuaciones, otra parte de un análisis estadístico y un gráfico, todo
> desde un mismo documento en una forma amigable a la vista. Por otro lado
> google y tensorflow es una apuesta interesante y con mucha publicidad, sin
> embargo esta semana leí parte de la documentación mi Microsoft que también
> ofrece su librería para redes neuronales, y lo comparan en algo de 10 o 15
> veces respecto a la velocidad, aunque también vi unos videos saltando
> partes donde las herramientas para crear redes neuronales con tensorflow en
> forma gráfica son geniales, ellos colocaban y sacaban neuronas y veían como
> cambiaba el resultado en el reconocimiento de una imagen o números, y
> podían ver cuánto era la contribución de cada una en el resultado final y
> en forma gráfica (como si fuese la cuenta del supermercado colocando y
> sacando productos pero sin recalcular el entrenamiento y cálculos, solo al
> suma total). R es maduro, tiene de todo, pero es a mi impresión duro
> respecto a python, lo que en R se puede hacer de muchas formas y con varias
> librerías, como por ejemplo acomodar datos, pyr, dlpyr, etc y etc, en caso
> de python tienen menos posibilidades para realizar lo mismo, desconozco
> como es el resultado en cuándo demora en acomodar los datos para el
> posterior análisis, pero es mucho más simple para alguien que comienza
> tener una forma y muchos ejemplos con los mismos comandos que como es en R
> donde para algo simple muchas veces en la lista aparecen soluciones muy
> distantes una de otra.
>
> Javier Rubén Marcuzzi
>
> El 11 de noviembre de 2017, 8:51, Jesús Para Fernández <
> ***@hotmail.com> escribió:
>
> > Un offtopic para empezar el fin de semana.
> >
> > Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con
> > 'estupor' que practicamente la gente trabaja con python.
> >
> > Es cierto que la mayor parte de competiciones son usadas con redes
> > neuronales, donde python si tiene ventaja frente a R, pero me da miedo
> ver
> > como python para temas de machine learning parece estar ganando la
> > partida...
> >
> > ¿Opiniones?
> >
> > Obtener Outlook para Android<https://aka.ms/ghei36>
> >
> >
> > [[alternative HTML version deleted]]
> >
> >
> > _______________________________________________
> > R-help-es mailing list
> > R-help-***@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> Página de Información de R-help-es<
> https://stat.ethz.ch/mailman/listinfo/r-help-es>
> stat.ethz.ch
> Esta es una lista de correo para solicitar ayuda sobre R en español y se
> entiende como un complemento social a la documentación, libros, etc.
> disponibles sobre R ...
>
>
>
> >
>
> [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
> Página de Información de R-help-es<
> https://stat.ethz.ch/mailman/listinfo/r-help-es>
> stat.ethz.ch
> Esta es una lista de correo para solicitar ayuda sobre R en español y se
> entiende como un complemento social a la documentación, libros, etc.
> disponibles sobre R ...
>
>
>
>
> [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-***@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]
Freddy Omar López Quintero
2017-11-11 21:40:22 UTC
Permalink
> El 11-11-2017, a las 08:51, Jesús Para Fernández <***@hotmail.com> escribió:
>
> Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con 'estupor' que practicamente la gente trabaja con python.
>
> Es cierto que la mayor parte de competiciones son usadas con redes neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver como python para temas de machine learning parece estar ganando la partida...

¿Qué es «machine learning», qué es la estadística?¿Qué es python, qué es R?

Yo creo que R fue concebido como un software para cómputo estadístico, con un poderoso motor gráfico. Sería raro que en un concurso estadístico, R no resultara victorioso. Los estadísticos somos su audiencia por excelencia, pero ahora hablan de ciencia de datos, que me parece aún un término un poquín difuso.

python es un software de propósito general, popular entre computistas, informáticos, ingenieros y, como no, algunos estadísticos. No me alarma que, en grupos multidisciplinarios, un programa de propósito general resulte más útil que uno cuyo objetivo es particular.

En mi percepción, la mayoría de las personas que participan en kaggle y similares, no son estadísticos de formación (cuestión que no invalida nada, por si acaso) y por eso no han estado tan expuestos a R y utilizan otras herramientas de mayor visibilidad, como python. Quién sabe cuánta razón tendré, pero no quiero ni pensar en el porcentaje que utilizan otros excelentes programas estadísticos, como stata o el mismísimo SAS, en este tipo de escenarios.

En el mundo real, alejados de competiciones y ejercicios académicos, python funciona mejor para aglutinar los resultados que se van obteniendo en las distintas áreas. Esa ha sido mi experiencia.

¡Salud!
[[alternative HTML version deleted]]
Loading...