Optimization & Machine Learning: 2012

martes, diciembre 04, 2012

Mini-charla: Aprendizaje artificial de patrones no lineales usando modelos lineales: herramientas y usos en toma de decisiones

El viernes 30/11/2012 dicté un seminario en el Departamento de Procesos y Sistemas de la Universidad Simón Bolívar, titulado como indica arriba, orientado a un público compuesto principalmente por ingenieros, y con un enfoque principalmente a las aplicaciones.

En el seminario, posteriormente a mi ponencia, hubo una interacción muy interesante con los profesores asistentes, entre los cuales estaban los del área de Procesos Químicos, y un par de profesores del área de Optimización, Gestión y Toma de Decisiones.

Haré mención especial sobre la asistencia del Prof. Ubaldo García Palomares, quien prontamente recibirá el nombramiento de profesor emérito de esta casa de estudios.

Aprovecho este post "post-mortem" para invitarles a una próxima mini-charla que estaré dando en el marco del 2do Encuentro de la Red de Jóvenes Investigadores de Venezuela, adscrita a la Academia de Ciencias Físicas, Matemáticas y Naturales.

Mi mini-charla será a las 9:45am del viernes 7, pero les invito a presenciar todas las ponencias del evento.

viernes, mayo 04, 2012

Enfoques basados en optimización convexa para clasificación de patrones

Tal y como lo comenté anteriormente, el próximo martes 8 de mayo de 2012, en la Sala Carlos Aragone, Edf. FEI-256 (segundo piso), de la Universidad Simón Bolívar (USB), a las 2:30pm se dictará un seminario titulado:

ENFOQUES BASADOS EN OPTIMIZACION CONVEXA
PARA LA CLASIFICACION DE PATRONES

El expositor, el Prof. Orestes Manzanilla (del Dpto. Procesos y Sistemas de la USB)

Resumen

En este seminario se mostrará un enfoque novedoso para resolver un problema específico dentro de las áreas de minería de datos, aprendizaje artificial y reconocimiento de patrones: el de la clasificación de patrones. Este es un problema con diversas aplicaciones, entre las cuales se puede mencionar el apoyo en
prognosis médica, otorgamiento de créditos, categorización de textos, prospección petrolera, detección de patrones de fraude, detección de patrones físicos (sonoros, visuales, etc), análisis de perfiles de expresión genética, ADN y proteínas diversas. Se hará un breve repaso de las técnicas más comunes para la resolución de este problema, nacidas de la estadística, y de distintos campos de “máquinas de aprendizaje”, algunos de ellos bio-inspirados, indicando brevemente las ventajas y desventajas de cada método.

Se expondrá un grupo de heurísticas basadas en optimización lineal, y lineal entera-mixta para la generación de clasificadores de patrones de tipo no-lineal (pero lineal por partes), que puede representarse tanto como redes neurales artificiales, como árboles de clasificación, explicando las ventajas y desventajas que comparativamente se observan respecto a los métodos mencionados anteriormente.
Los métodos están orientados hacia la búsqueda de (1) la minimización de la dependencia del “éxito” de la implementación, de la experticia del implementador, cerrando la brecha "tecnológica" que actualmente mantiene a los no-expertos alejados de este tipo de problemas, y (2) la escalabilidad de la técnica, para garantizar su aplicabilidad en bases de datos masivas. Por último, se esboza el posible uso de las estructuras no-lineales generadas en el espacio multi-dimensional, ya no tanto para la predicción de la categoría o patrón de un nuevo
indivíduo de clase desconocida, sino para la visualización de los patrones en el espacio multi-dimensional.

Palabras claves: Programación lineal, Redes neurales artificiales, Máquinas de Soporte Vectorial, Clasificadores de patrones, Máquinas de aprendizaje.

viernes, abril 27, 2012

El reto de los nuevos modelos

Como investigadores nos enfrentamos a un problema: necesitamos que nos publiquen. Necesitamos que los revisores de una revista arbitrada (idealmente buena), vean nuestro trabajo (entre otros 100, si la revista es buena) y lo entiendan, les guste, y lo recomienden para su publicación.

Para que guste, tienen que entenderlo. Para que lo recomienden, dependiendo de la revista, si no tiene un teorema, no lo aceptan. Es decir, las pruebas pueden decir que funciona y que es mejor que otro método cuyas garantías en lo teórico son fantásticas, pero como no tienes una demostración y un teorema por debajo como respaldo, es posible que no lo recomienden (quizá es por esto que la mayoría de los artículos de heurísticas, metaheurísticas y soft-computing en general se publican en congresos, jornadas, etc., y no en revistas de alto impacto).

La manera de publicar con facilidad, parece ser esta:

Publica un teorema que haga un pequeño cambio o aporte teórico.
Publica sobre un problema conocido por todos.

En general, pareciera que el que tiene 100 artículos para revisar, no quiere leer un método del cuál tiene que aprender desde "0". Y pareciera que el éxito en pruebas numéricas no es necesariamente suficiente, y la publicación tiene que aguantarse hasta encontrar una teoría.

En un mundo en que queremos resolver problemas muy grandes, muy complejos, luce como si esta "resistividad" de las revistas a las cosas novedosas "que funcionan", genera un retraso innecesario.

Sería interesante que se estimulara la aparición de nuevos modelos matemáticos y estrategias de resolución de problemas. Estos pueden estar inspirados en la naturaleza, en procesos industriales, en la forma en que se hacen galletas artesanales, o en cómo se comporta un comprador en un centro comercial. La forma en que separamos piedras y sucios en los granos que cocinamos, o la forma en que los cepillos de cabello son mejores para determinado tipo de pelo, pueden ser elementos de inspiración también.

Lo importante es tener los ojos abiertos. Lo importante es que las revistas también abran sus ojos. Tratar de entender el lenguaje de un investigador cuya área base es distinta, puede proporcionar claves para solucionar problemas pendientes por resolver. Aislarnos del que habla con jerga distinta, porque me tendría que poner a estudiar, nos hace hablar solo con los que ya piensan el problema de igual forma que nosotros.

El especialista en redes neurales habla de "velocidad de aprendizaje", mientras el especialista en optimización no-lineal habla de "tamaño de paso", y ambas cosas son idénticas. Son dos chinos que no se entienden porque uno habla mandarín y el otro cantonés. Hasta que no escriben el asunto en forma simbólica, no se entienden.

Por ahora, lo que me sugiere mi cortísima experiencia, es que hay que tratar de escribir "a prueba de flojos" y "a prueba de confusiones".

Más importante aún, no dejar de caminar, no dejar de tomar 5 minutos para poder ver cómo sirve el café el del cafetín, ni como cae una hoja. Este estado "zen" es la materia prima para las ideas nuevas, y para las ideas nuevas para explicar mejor y más fácilmente las ideas que ya tuvimos.

Charla: Enfoques basados en optimización convexa para clasificación de patrones

Este 8 de mayo de 2012 estaré dictando en la sala 254 del edificio de Física y Electrónica 1 de la Universidad Simón Bolívar (la sala usada semanalmente para los coloquios del Departamento de Física), una charla titulada "Enfoques basados en optimización convexa para clasificación de patrones". La misma tendrá lugar de 2:30pm a 3:30pm.