Discussion:
[R-es] Codificación redes neuronales, reconocimiento patrón, otras
Javier Marcuzzi
2018-05-04 20:19:04 UTC
Permalink
Estimados

Estoy pensando en una forma para acomodar datos, estos son una sola o más
de una palabra, la única palabra o asociación de estas tiene un
significado, no estaba pensando en un análisis en particular, pero sí en
algo que pueda ser procesado por redes neuronales reconociendo ciertos
patrones, pero que permita un análisis bajo otras técnicas, posiblemente en
un ejemplo se comprenda mejor.

Supongamos unas palabras como

Azul

Rojo

Verde

Amarillo

Auto

Bicicleta

Ferrari

Semáforo

Color

Vehículo



Ahora supongamos tres columnas, la cuarta es el significado, y puede haber
columnas vacías

Azul | |
= Color y azul

Rojo |Verde |Amarillo =
Semáforo y color

Semáforo | |
= Semáforo

Auto | |
= Vehículo y auto (no bici)

Auto |Rojo |
= Ferrari * pero también vehículo

Auto |Rojo |Vehículo =
Vehículo * , auto, color y ferrari



Por ejemplo, está claro que los compradores de autos Ferrari posiblemente
tengan un gusto asociado al color rojo. Ese puede ser un análisis

Pero si yo quiero reconocer lo que hay según el patrón de palabras, tipo
ejemplos de redes neuronales, en el último ejemplo con tres palabras tengo
cuatro posibilidades (auto, rojo, vehículo) => vehículo, auto, color,
Ferrari, pero en el ejemplo dos (Rojo, Verde, Amarillo) => semáforo, como
color, pero el reconocimiento importante es casi únicamente semáforo.

Hay ejemplos donde se buscan patrones en una foto y se reconocen objetos,
pero en un esquema como el que describo, donde el resultado que puede ser
más de uno, también está en la entrada, esta entrada en el ejemplo son tres
columnas, pero todas tienen palabras que están en una sola lista.

¿Alguna sugerencia o ejemplo? En otras palabras, yo podría realizar una
tabla pero hay formas que quedaría afuera, porque auto, rojo, vehículo no
se me ocurriría, salvo que piense en un análisis posterior donde analizo
bicicletas rojas vs autos rojos, o pelota roja donde una pelota no es
vehículo pero en la playa por ahí prefieren las rojas o amarillas antes de
las azules. Entonces posiblemente hay una forma de codificar para luego
poder hacer análisis no pensados al momento de codificar los datos. Esta
segunda parte estaría contemplada al colocar columnas, pero se me crean
dudas para las redes neuronales.

Desde ya muchas gracias

[[alternative HTML version deleted]]
Javier Marcuzzi
2018-05-07 12:48:10 UTC
Permalink
Estimados

He resuelto mi preocupación, por un lado creando una columna que de un
punto fijo, por ejemplo vehículo, entonces todas las demás columnas son
auto, bici, Ferrari, etc., pero a este punto fijo no lo puedo calcular como
cluster, sería sencillo pero en lugares como mi país donde es
extremadamente difícil ver una Ferrari (son mucho más caras que en Europa),
este punto fijo debe tener intervención humana porque de las formas que
conozco en el caso de Ferrari Argentina darían cualquier cosa bajo una
clasificación automatizada, luego sería posible algún otro análisis como
una red neuronal.

Dicho de otra forma, este punto fijo asegura un renglón independiente de
las columnas siguientes, con un resultado fijado para el entrenamiento, por
ejemplo el punto fijo señal de tránsito, con tres columnas, rojo, amarillo
y azul, dan únicamente semáforo, por otro lado en punto fijo color estos se
repiten pero con otro significado, u otro punto dijo juguete donde puede
ser exactamente rojo, amarillo, verde, y ser semáforo, pero al cruzar los
datos puedo detectar semáforos reales de los de juguete.

Lógicamente no di con una forma automatizada para calcular puntos fijos sin
intervención humana, estos serían como un grupo cluster, pero no encontré
la forma de evitar que datos con pocos valores no sean detectados como
ruido cuándo en realidad son importantes, pero escasos como el oro o un
diamante, motivo por el cuál estos costosos y en su costo está la
importancia aunque sus números en unidades sean muy pequeños en relación al
resto de objetos.

Javier Rubén Marcuzzi





El 4 de mayo de 2018, 17:19, Javier Marcuzzi <
Post by Javier Marcuzzi
Estimados
Estoy pensando en una forma para acomodar datos, estos son una sola o más
de una palabra, la única palabra o asociación de estas tiene un
significado, no estaba pensando en un análisis en particular, pero sí en
algo que pueda ser procesado por redes neuronales reconociendo ciertos
patrones, pero que permita un análisis bajo otras técnicas, posiblemente en
un ejemplo se comprenda mejor.
Supongamos unas palabras como
Azul
Rojo
Verde
Amarillo
Auto
Bicicleta
Ferrari
Semáforo
Color
Vehículo
Ahora supongamos tres columnas, la cuarta es el significado, y puede haber
columnas vacías
Azul | |
= Color y azul
Rojo |Verde |Amarillo =
Semáforo y color
Semáforo | |
= Semáforo
Auto | |
= Vehículo y auto (no bici)
Auto |Rojo |
= Ferrari * pero también vehículo
Auto |Rojo |Vehículo =
Vehículo * , auto, color y ferrari
Por ejemplo, está claro que los compradores de autos Ferrari posiblemente
tengan un gusto asociado al color rojo. Ese puede ser un análisis
Pero si yo quiero reconocer lo que hay según el patrón de palabras, tipo
ejemplos de redes neuronales, en el último ejemplo con tres palabras tengo
cuatro posibilidades (auto, rojo, vehículo) => vehículo, auto, color,
Ferrari, pero en el ejemplo dos (Rojo, Verde, Amarillo) => semáforo, como
color, pero el reconocimiento importante es casi únicamente semáforo.
Hay ejemplos donde se buscan patrones en una foto y se reconocen objetos,
pero en un esquema como el que describo, donde el resultado que puede ser
más de uno, también está en la entrada, esta entrada en el ejemplo son tres
columnas, pero todas tienen palabras que están en una sola lista.
¿Alguna sugerencia o ejemplo? En otras palabras, yo podría realizar una
tabla pero hay formas que quedaría afuera, porque auto, rojo, vehículo no
se me ocurriría, salvo que piense en un análisis posterior donde analizo
bicicletas rojas vs autos rojos, o pelota roja donde una pelota no es
vehículo pero en la playa por ahí prefieren las rojas o amarillas antes de
las azules. Entonces posiblemente hay una forma de codificar para luego
poder hacer análisis no pensados al momento de codificar los datos. Esta
segunda parte estaría contemplada al colocar columnas, pero se me crean
dudas para las redes neuronales.
Desde ya muchas gracias
[[alternative HTML version deleted]]

Loading...