MARC details
000 -LEADER |
campo de control de longitud fija |
02826naa a2200313 a 4500 |
003 - IDENTIFICADOR DE NÚMERO DE CONTROL |
campo de control |
AR-LpUFIB |
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN |
campo de control |
20240131183144.0 |
007 - CAMPO FIJO DE DESCRIPCIÓN FÍSICA--INFORMACIÓN GENERAL |
campo de control de longitud fija |
ta |
008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL |
campo de control de longitud fija |
230201s2018 xx do 000 0 eng d |
024 8# - IDENTIFICADOR DE OTROS ESTÁNDARES |
Número estándar o código |
DIF007604 |
040 ## - FUENTE DE CATALOGACIÓN |
Centro catalogador/agencia de origen |
AR-LpUFIB |
Lengua de catalogación |
spa |
Centro/agencia transcriptor |
AR-LpUFIB |
100 1# - ENTRADA PRINCIPAL--NOMBRE DE PERSONA |
Nombre de persona |
Basgall, María José |
9 (RLIN) |
257591 |
245 10 - MENCIÓN DEL TÍTULO |
Título |
SMOTE-BD : |
Resto del título |
an exact and scalable oversampling method for imbalanced classification in big data |
260 ## - PUBLICACIÓN, DISTRIBUCIÓN, ETC. |
Lugar de publicación, distribución, etc. |
: |
Nombre del editor, distribuidor, etc. |
, |
Fecha de publicación, distribución, etc. |
2018 |
300 ## - DESCRIPCIÓN FÍSICA |
Extensión |
1 archivo (861,3 kB) |
500 ## - NOTA GENERAL |
Nota general |
Formato de archivo PDF. -- Este documento es producción intelectual de la Facultad de Informática - UNLP (Colección BIPA/Biblioteca) |
520 ## - RESUMEN, ETC. |
Sumario, etc. |
El volumen de datos en las aplicaciones de hoy en día ha significado un cambio en la forma de abordar los problemas de Machine Learning. De hecho, el escenario Big Data implica restricciones de escalabilidad que sólo se pueden lograr a través del diseño de modelos inteligentes y el uso de tecnologías distribuidas. En este contexto, las soluciones basadas en la plataforma Spark se han establecido como un estándar de facto. En esta contribución, nos centramos en un marco muy importante dentro de Big Data Analytics, a saber, la clasificación con conjuntos de datos desequilibrados. La principal característica de este problema es que una de las clases está sub-representada y, por lo tanto, generalmente es más complejo encontrar un modelo que la identifique correctamente. Por esta razón, es común aplicar técnicas de preprocesamiento como el sobremuestreo, para equilibrar la distribución de ejemplos en las clases. En este trabajo presentamos SMOTE-BD, un enfoque de preprocesamiento totalmente escalable para la clasificación no balanceada en Big Data. El mismo se basa en una de las soluciones de preprocesamiento más extendidas para la clasificación desequilibrada, a saber, el algoritmo SMOTE, el cual crea nuevas instancias sintéticas de acuerdo con la vecindad de cada ejemplo de la clase minoritaria. Nuestro novedoso desarrollo está hecho para ser independiente de la cantidad de particiones o procesos creados, para lograr un mayor grado de eficiencia. Los experimentos realizados en diferentes conjuntos de datos estándar y de Big Data muestran la calidad del diseño y la implementación propuestos. |
534 ## - NOTA SOBRE LA VERSIÓN ORIGINAL |
Encabezamiento principal del original |
Conference Cloud Computing and Big Data (7ª : 2019 : La Plata, Argentina) |
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento de entrada |
BIG DATA |
9 (RLIN) |
256687 |
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento de entrada |
APRENDIZAJE AUTOMÁTICO |
9 (RLIN) |
247925 |
653 ## - TÉRMINO DE INDIZACIÓN--NO CONTROLADO |
Término no controlado |
clasificación no balanceada |
700 1# - ENTRADA AGREGADA--NOMBRE PERSONAL |
Nombre de persona |
Hasperué, Waldo |
9 (RLIN) |
252494 |
700 1# - ENTRADA AGREGADA--NOMBRE PERSONAL |
Nombre de persona |
Naiouf, Ricardo Marcelo |
9 (RLIN) |
248556 |
700 1# - ENTRADA AGREGADA--NOMBRE PERSONAL |
Nombre de persona |
Fernández, Alberto |
9 (RLIN) |
44523 |
700 1# - ENTRADA AGREGADA--NOMBRE PERSONAL |
Nombre de persona |
Herrera, Francisco |
9 (RLIN) |
258443 |
856 40 - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS |
Identificador Uniforme de Recursos |
<a href="http://sedici.unlp.edu.ar/handle/10915/69464">http://sedici.unlp.edu.ar/handle/10915/69464</a> |
856 40 - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS |
Identificador Uniforme de Recursos |
<a href=" http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2290"> http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2290</a> |
942 ## - ELEMENTOS DE ENTRADA SECUNDARIOS (KOHA) |
Tipo de ítem Koha |
Capítulo de libro |