@conference{Garcia-Gimenez2018, author = "Jose Manuel Garc{\'i}a-Gim{\'e}nez and Alejandro P{\'e}rez-Villegas and Jos{\'e} Camacho", abstract = "El volumen de datos a utilizar en el {\'a}mbito de la ciberseguridad est{\'a} creciendo exponencialmente de la mano de las nuevas tecnolog{\'i}as. Esto est{\'a} motivando la utilizaci{\'o}n de nuevas t{\'e}cnicas que permitan analizar todos estos datos de forma eficiente. La gesti{\'o}n de toda esta informaci{\'o}n es complicada por su disparidad en estructura y formato. En este trabajo se introduce una herramienta, el FCParser, que permite procesar datos basados en texto, reduciendo grandes vol{\'u}menes de informaci{\'o}n a observaciones adecuadas para su an{\'a}lisis con distintas t{\'e}cnicas de machine learning. La eficacia de la herramienta se ha evaluado con un experimento basado en un conjunto de datos de, que contiene dos fuentes de datos de seguridad parcialmente no estructuradas para la detecci{\'o}n y diagnosis de anomal{\'i}as. Este experimento se encuentra en una m{\'a}quina virtual disponible p{\'u}blicamente para su reproducibilidad.", booktitle = "IV Jornadas Nacionales de Investigaci{\'o}n en Ciberseguridad, JNIC 2018", journal = "JNIC 2018", keywords = "Aprendizaje autom{\'a}tico;Big Data;Detecci{\'o}n de intrusos;Diagn{\'o}stico;Parseo;Seguridad en red", pages = "31--38", title = "{E}xtracci{\'o}n de {C}aracter{\'i}sticas en {B}ig {D}ata para la {D}etecci{\'o}n de {A}nomal{\'i}as en {C}iberseguridad", url = "http://2018.jnic.es/assets/Actas_JNIC2018.pdf", year = "2018", }