Freddy Omar López Quintero
2018-02-02 15:57:05 UTC
Hola.
Espero que estén bien.
Les cuento. Tengo acceso a unos datos .avro en un s3 de amazon pero estoy
desconcertado con la forma de leerlos desde sparkR (*no sparklyr*) sin
tener que descargar el archivo.
Como antecedente, descargando el archivo, he utilizado felizmente las
instrucciones:
Sys.setenv(SPARK_HOME="/opt/apache-spark/")
library(SparkR, lib.loc = c(file.path(Sys.getenv("SPARK_HOME"), "R",
"lib")))
sparkR.session(master = "local[*]", sparkConfig = list(spark.driver.memory
= "2g"), sparkPackages = c("com.databricks:spark-avro_2.11:4.0.0"
dd <- read.df(path="/home/vate01/Descargas/TR_TRN_1.avro", source =
'com.databricks.spark.avro')
Pero quisiera evitar el paso de la descarga, teniendo las credenciales de
la cuenta de amazon.
¡Gracias!
Espero que estén bien.
Les cuento. Tengo acceso a unos datos .avro en un s3 de amazon pero estoy
desconcertado con la forma de leerlos desde sparkR (*no sparklyr*) sin
tener que descargar el archivo.
Como antecedente, descargando el archivo, he utilizado felizmente las
instrucciones:
Sys.setenv(SPARK_HOME="/opt/apache-spark/")
library(SparkR, lib.loc = c(file.path(Sys.getenv("SPARK_HOME"), "R",
"lib")))
sparkR.session(master = "local[*]", sparkConfig = list(spark.driver.memory
= "2g"), sparkPackages = c("com.databricks:spark-avro_2.11:4.0.0"
dd <- read.df(path="/home/vate01/Descargas/TR_TRN_1.avro", source =
'com.databricks.spark.avro')
Pero quisiera evitar el paso de la descarga, teniendo las credenciales de
la cuenta de amazon.
¡Gracias!
--
«...homines autem hominum causa esse generatos...»
Cicero
[[alternative HTML version deleted]]
«...homines autem hominum causa esse generatos...»
Cicero
[[alternative HTML version deleted]]