Publicaciones

Publicaciones

Artículos



Código

  • StatisCLAS: Methods for Statistical Classification

    • Archivo de ayuda: .pdf
    • Código (el archivo de ayuda está incluido) en diferentes formatos de compresión:
      .tar.gz .tar.gz      .rar: .rar      .zip: .rar

    Última actualización: 29 de mayo de 2013

    Novedades:

    • Se han unido dos paquetes previos, codeDFMforFD y codeRFDforTS, y se ha modificado el código para hacerlo más fácil de mantener y reutilizar: los seis guiones (scripts) principales del nuevo paquete son diferentes pero comparten muchas líneas.
    • Se han identificado con un número los principales pasos o tareas de los algoritmos, lo que permite cambiar sólo estas partes —por ejemplo, distancias o transformaciones de funciones— o diseñar nuevos métodos. Cada método está determinado por unos pocos números y un nombre.
    • El valor del parámetro —número de bloques para series temporales y orden de diferenciación para curvas— puede ser optimizado en cada iteración (run). En este caso, para cada valor se muestra una medida de su poder de minimización.
    • Cuando hay más de un método, en cada iteración puede seleccionarse automáticamente el más apropiado. En este caso, para cada método se muestra una medida de su poder de minimización.
    • Para unas muestras dadas es posible, en el esquema de aprendizaje determinado por la anterior selección de método, seleccionar la transformación de datos, la distancia, el tipo de vector discriminante, el submétodo de clasificación multivariante, etcétera, más apropiados. Algunas de estas ideas fueron esbozadas en mi tesis doctoral.
    • Se han incluido explicaciones teóricas para poder explicar cómo funcionan las metodologías y los guiones: por ejemplo, efectos sobre la calidad de las estimaciones o cuándo son necesarias más iteraciones.
    • Parte del código ha sido escrito para reducir el esfuerzo de computación (lo descrito en los dos puntos anteriores también puede utilizarse con este propósito) o controlar y advertir al usuario.
    • Se ha añadido un nuevo tipo de guión, para obtener etiquetas en vez de tasas de error. El usuario puede asignar nuevos datos aplicando distintos tipos de llamada.
    • Los modelos estocásticos preprogramados, para procesos y funciones, han sido generalizados utilizando coeficientes.
    • Por último, se han incluido varios ejercicios de simulación simplemente como ejemplos o para mostrar algunos conceptos.

  • He colaborado en el desarrollo del código, en el lenguaje de programación R, de algunas herramientas de Bioinformática para el Centro Nacional de Investigaciones Oncológicas (CNIO).


Otros trabajos


David Casado de Lucas

Última actualización: Marzo de 2015