Primero comenzaremos por hablar por los métodos no supervisados. Estos se basan en descubrir agrupaciones de pautas en un espacio de N-dimensiones sin saber a priori a qué clase pertenece cada muestra.
Entre los métodos más comunes de este tipo incluyen el1- Análisis de Categorías (en inglés, CA, Cluster Analysis) [1]
2- Árbol de Mínimo Desarrollo (en inglés, MST,Minimal Spanning Tree) [2]
3- Mapas Auto-organizables (en inglés, SOM, Self-Organizing Maps) de Kohonen. [3]
Por otro lado en los métodos supervisados, la clasificación se basa en un aprendizaje previo del sistema, con conjuntos de calibración o entrenamiento de objetos que permiten definir cada clase, ya que estos objetos son de conocida
pertenencia a una de las clases. La calidad de los resultados de la clasificación vendrá influenciada por la calidad de los conjuntos de entrenamiento. Estos métodos pueden ser divididos a su vez en dos subgrupos: métodos discriminantes y métodos de modelado. [4]
Los métodos discriminantes dividen el espacio en tantas regiones como clases haya en el conjunto de entrenamiento, creando límites compartidos por los espacios; por ello, toda muestra desconocida siempre podrá ser clasificada como perteneciente a una de las clases. Los más comunes son: Análisis Discriminante (en inglés, DA, Discriminant Analysis) y Vecino k más Cercano (en inglés, KNN, k-Nearest Neighbour).[5, 6]
Por su parte, los métodos de modelado se basan en la creación de volúmenes en el espacio, cada uno de los cuales presenta límites para cada una de las clases. Por ello, una muestra puede clasificarse como perteneciente a alguna de las clases o a ninguna de ellas. Entre estos métodos se cuentan el Reconocimiento de Pautas mediante Análisis Independiente Multicategórico (en inglés, PRIMA, Pattern Recognition by Independent Multicategory Analysis), [7] las Clases Desigualmente Dispersas (en inglés, UNEQ, Unequal Dispersed Classes),[8] el Modelado Blando Independiente de Analogías de Clases (en inglés, SIMCA, Soft Independent Modelling of Class Analogy),[9] que es probablemente el más conocido y las Redes Neuronales Artificiales Supervisadas (en inglés, SANN, Supervised Artificial Neural Networks).[9]
Mas adelante trataremos de desarrollar uno a uno estos métodos con algún ejemplo para clarificar su aplicación.
[1] a) Xu, D.; Redman-Furey, N. (2007) “Statistical cluster analysis of pharmaceutical solvents”. Int. J. Pharm. 339:175-188; b) Bratchell, N. (1989) “Cluster analysis”. Chemom. Intell. Lab. Syst. 6:105-125.
[2] Strouf, O. (1986) Chemical Pattern Recognition. Research Studies Press LTD, Letchworth, Hertfordshire, Inglaterra.
[3] a) Bianchi, D.; Calogero, R.; Tirozzi, B. (2007) “Kohonen neural networks and genetic classification”. Math. Computer Mod. 45:34-60; b) Capitán-Vallvey, L. F.; Navas, N.; del Olmo, M.; Consonni, V.; Todeschini, R. (2000) “Resolution of mixtures of three nonsteroidal anti-inflammatory drugs by fluorescence using partial least squares multivariate calibration with previous wavelength selection by Kohonen artificial neural networks”. Talanta 52:1069-1079.
[4] Derde, M. P.; Massart, D. L. (1986) “Supervised pattern recognition: The ideal method?”. Anal. Chim. Acta 191:1-16.
[5] Massart, D. L.; Vandeginste, B. G. M.; Deming, S. N.; Michotte, Y.; Kaufman, L. (1988). Chemometrics: A Textbook. Elsevier, Amsterdam, Holanda.
[6] a) Coomans, D.; Massart, D. L. (1982) “Alternative K-nearest neighbour rules in supervised pattern recognition. Part 1: K-nearest neighbour classification by using alternative voting rules”. Anal. Chim. Acta 136:15-27; b) Coomans, D.; Massart, D. L. (1982) “Alternative K-nearest neighbour rules in supervised pattern recognition. Part 2. Probabilistic classification on the basis of the kNN method modified for direct density estimation”. Anal. Chim. Acta 138:153-165.
[7] Jurickskay, I.; Veress, G. E. (1981) “PRIMA: A new pattern recognition method”. Anal. Chim. Acta 171:61-76.
[8] a) Derde, M. P.; Massart, D. L. (1986) “UNEQ: A disjoint modelling technique for pattern recognition based on normal distribution”. Anal Chim. Acta 184:33-51; b) Ortiz Fernández, M. C.; Herrero Gutiérrez, A.; Sánchez Pastor, M. S.; Sarabia, L. A.; Íñiguez Crespo, M. (1995) “The UNEQ, PLS and MLF neural network methods in the modelling and prediction of the colour of young red wines from the denomination of
origin `Rioja´”. Chemom. Intell. Lab. Syst. 28:273-285.
[9] a) Gemperline, P. J.; Webber, L. D. (1989) “Raw materials testing using soft independent modeling of class analogy analysis of near infrared reflectance spectra”. Anal. Chem. 61:138-144; b) Candolfi, A.; De Maesschalck, R.; Massart, D. L.; Hailey, P. A.; Harrington, A. C. E. (1999) “Identification of pharmaceutical excipients using NIR spectroscopy and SIMCA”. J. Pharm. Biomed. Anal. 19:923-935.
[10] a) Bertran, E.; Blanco, M.; Coello, J.; Iturriaga, H.; Maspoch, S.; Montoliu, I. (2000) “Near infrared spectrometry and pattern recognition as screening methods for the authentication of virgin olive oils of very close geographical origins”. J. Near Infrared Spectrosc. 8:45-52; b) Agatonovic-Kustrin, S.; Beresford, R. (2000) “Basic concepts of artificial neural network (ANN) modeling and its application in pharmaceutical research”. J. Pharm. Biomed. Anal. 22:717-727.





