Skip to content

Download

David Gutierrez edited this page Jan 24, 2018 · 10 revisions

Maquina Virtual

  1. Se necesita una maquina virtual en este caso se utilizo Ubuntu 14.04 LTS y se utilizaron las maquinas que ofrece SciDB para almacenar los datos provenientes de MIMIC-III para en un futuro trabajo almacenar estos en base de datos de arreglos llamada SciDB, No se utilizo SciDB al final porque estaba causando demora en los analisis el usarlo, pero si la maquina virtual

Es una sistema de manejo de datos en forma de arreglos (Array DBMS), que permite almacenar gran cantidad de arreglos del tamaño de big data. para facilitar la instalacion, se utiliza una de las maquinas virtuales que ya se encuentran configuradas con SciDB por los desarrolladores de SciDB (Paradigm4) en google Drive: Version 15.12 y Version 16.9.

Cambiar el Tamaño del Disco Duro

Si se descargara la totalidad de los datos que existen en MIMIC-III serian 3TB y el tamaño del disco con el que vienen esas maquinas es 20GB podemos cambiar el tamaño del disco con los siguientes comandos:

VBoxManage clonehd "source.vmdk" "cloned.vdi" --format vdi
VBoxManage modifyhd "cloned.vdi" --resize 51200
VBoxManage clonehd "cloned.vdi" "resized.vmdk" --format vmdk

y después con Gparted, se puede Crecer el tamaño del DD y incluso generar una partición SWAP

Lenguaje y Librerias

Como lenguaje principal en el desarrollo, se utiliza Python, debido a que existen 2 librerias escritas en este lenguaje:

Libreria que permite conectarse a las bases de datos de physionet y realizar analisis sobre los mismos

Libreria que permite conectarse a SciDB y realizar cargue de los datos.

DOI

Script que permite detectar los picos del QRS.

Librería con herramientas para mineria de datos y analisis de datos

sudo pip3 install sklearn

Librería que sirve de puente de Python a GNU Octave

sudo pip3 install oct2py

No es una librería, pero si son los scripts que permiten llenar la base de datos de MIMIC y hacer análisis sobre los mismos.

Explicacion

En el archivo LoadData.ipynb se ve un Jupyter que contiene la explicacion de los prerequisitos necesarios para la carga de datos y algunos ejemplos de como estos son subidos

En el archivo DataLoad.py esta el codigo que se encarga tanto de descargar la información de Physionet, como de subirla a SciDB.

Clone this wiki locally