Date post: | 07-Apr-2018 |
Category: |
Documents |
Upload: | ronald-alex-cy |
View: | 218 times |
Download: | 0 times |
of 222
8/6/2019 Ir en La Petroquimica
1/222
UU NIVERSITATNIVERSITAT RROVIRA IOVIRA I VVIRGILIIRGILIDD epartamentepartament de Qumica Analtica i Qumicade Qumica Analtica i Qumica OrgnicaOrgnica
Tesis DoctoralSantiago Macho Aparicio
Tarragona, 2002
METODOLOGAS ANALTICAS BASADAS ENESPECTROSCOPIA DE INFRARROJO Y
CALIBRACIN MULTIVARIANTE. APLICACINA LA INDUSTRIA PETROQUMICA
8/6/2019 Ir en La Petroquimica
2/222
8/6/2019 Ir en La Petroquimica
3/222
Metodologas analticas basadas en espectroscopia de
infrarrojo y calibracin multivariante. Aplicacin a la
industria petroqumica.
Tesis Doctoral UNIVERSITATROVIRA IVIRGILI
8/6/2019 Ir en La Petroquimica
4/222
8/6/2019 Ir en La Petroquimica
5/222
UNIVERSITATROVIRA IVIRGILI Departament de Qumica Analtica i Qumica Orgnica
rea de Qumica Analtica
METODOLOGAS ANALTICAS BASADAS ENESPECTROSCOPIA DE INFRARROJO Y CALIBRACIN
MULTIVARIANTE. APLICACIN A LA INDUSTRIAPETROQUMICA.
Memoria presentada porSantiago Macho Apariciopara conseguir el grado de
Doctor en QumicaTarragona, 2002
8/6/2019 Ir en La Petroquimica
6/222
8/6/2019 Ir en La Petroquimica
7/222
Dra. MARIA SOLEDAD LARRECHI GARCA, profesora titular delDepartament de Qumica Analtica i Qumica Orgnica de la Facultat deQumica de la Universitat Rovira i Virgili,
CERTIFICA: Que la presente memoria que tiene por ttulo:
METODOLOGAS ANALTICAS BASADAS ENESPECTROSCOPIA DE INFRARROJO YCALIBRACIN MULTIVARIANTE. APLICACIN ALA INDUSTRIA PETROQUMICA, ha sido realizadapor SANTIAGO MACHO APARICIO bajo mi direccinen el rea de Qumica Analtica i Qumica Orgnica deesta Universidad y que todos los resultados presentadosson fruto de las experiencias realizadas por dicho
doctorando.
Tarragona, abril de 2002
Dra. M Soledad Larrechi
UNIVERSITATROVIRA IVIRGILI DEPARTAMENT DEQUMICAANALTICAI QUMICAORGNICA
Plaa Imperial Trraco, 143005 TarragonaTel. 34 977 55 81 37Fax 34 977 55 95 63e-mail: [email protected]
8/6/2019 Ir en La Petroquimica
8/222
8/6/2019 Ir en La Petroquimica
9/222
A GRADECIMIENTOS
Quisiera que las prximas lneas sirvan como reconocimiento a las personas einstituciones que han hecho posible la realizacin de esta tesis. A todas ellas, quieroagradecer de todo corazn la ayuda dispensada:
A mi directora, M Soledad Larrechi Garca, por su gua y sus valiosas aportaciones, sinlas que este trabajo no hubiera sido posible.
Al director del grupo de Quimiometra y Cualimetra, F. X. Rius Ferrs, por laoportunidad que me brind de realizar este trabajo, y lo mucho que me ha enseado.
A los miembros del grupo con los que he trabajado de forma ms estrecha, que tanto me
han aportado: Pili, Antoni, Florenci y Ricard. Al resto de miembros actuales del Grupo, as como a los antiguos miembros, que me hanayudado y ofrecido su amistad, afortunadamente la lista es larga, pero sentira muchodejarme a alguien: Itziar, Jordi, Joan, Jaume, Javi, Angel, Alicia P., Alicia M., Josep Llus, Mari, Enric, Esther, Paquita, Gemma, Nria, Alberto, Pablo, Sara, Barbara...
A los compaeros y laborantes del rea de Qumica Analtica, del resto del Departamento y del Departamento de Fsica i Inorgnica, especialmente a mis compaeros de promocin: Alex, Pere y Ramn.
A la Universitat Rovira i Virgili, a la Fundacin REPSOL y al Departament dUniversitats Recerca i Societat de la Informaci de la Generalitat de Catalunya por el soporteeconmico que ha permitido realizar esta tesis.
Mi ms sincero agradecimiento a todos aquellos miembros de las empresas con las que hetenido contacto en el transcurso de esta tesis: Repsol Petrleo Tarragona yTransformadora de Propileno, muchas son las personas han ayudado a hacer posible estetrabajo, pero quisiera nombrar a E. Moratinos y C. Garca.
A mi familia y amigos, que tambin han puesto su grano de arena y me han apoyadoincondicionalmente.
A Inma, muy especialmente, siempre a mi lado y dispuesta a ayudarme. Gracias por elnimo y el apoyo que me has dado.
8/6/2019 Ir en La Petroquimica
10/222
8/6/2019 Ir en La Petroquimica
11/222
A Inma
8/6/2019 Ir en La Petroquimica
12/222
8/6/2019 Ir en La Petroquimica
13/222
NDICEObjetivo................................................................................................ 1
Objetivo...............................................................................................3 1 Introduccin................................................................................. 5
1.1 Presentacin de los contenidos .....................................................7 1.2 Casos prcticos estudiados .........................................................10
1.2.1 Determinacin de PIONA en nafta ......................................10 1.2.2 Determinacin de etileno, viscosidad e ndice de fluidez en
polipropileno......................................................................12
1.3 Estructura de la tesis ..................................................................15 2 Fundamentos tericos................................................................. 19
2.1 Espectroscopia de infrarrojo .......................................................21 2.1.1 Aspectos fundamentales......................................................21 2.1.2 Regiones espectrales...........................................................22 2.1.3 Tipos de medidas en infrarrojo ............................................22
2.2 Interpretacin de espectros .........................................................28
2.2.1 Asignacin de bandas.........................................................28 2.2.2 Segunda derivada de los espectros.......................................30 2.3 Fundamentos quimiomtricos .....................................................32
2.3.1 Introduccin.......................................................................32 2.3.2 Descomposicin en componentes principales (PCA).............32 2.3.3 Tcnicas de pretratamiento de datos.....................................35 2.3.4 Etapas de la calibracin multivariante ..................................42
3 Parte experimental..................................................................... 69 3.1 Presentacin de los conjuntos de muestras estudiados ..................71
3.1.1 Muestras............................................................................71 3.1.2 Anlisis de referencia .........................................................72 3.1.3 Medidas espectroscpicas...................................................73 3.1.4 Anlisis de los espectros obtenidos ......................................74
8/6/2019 Ir en La Petroquimica
14/222
4 Modelos de calibrado..................................................................79 4.1 Introduccin..............................................................................81
4.2 Modelos de calibracin de polmeros derivados del polipropileno.82 4.2.1 Agrupacin de las muestras.................................................82 4.2.2 Determinacin del porcentaje de etileno en EPR/PP..............83 4.2.3 Determinacin del porcentaje de etileno en EPR...................87 4.2.4 Determinacin del ndice de fluidez en copolmeros de
EPR/PP, EPR y PP y viscosidad en EPR/PP y EPR...............90 4.3 Multivariate determination of several compositional parameters
related to the content of hydrocarbon in naphtha by MIRspectroscopy..............................................................................92
4.4 Ampliacin de aspectos experimentales.....................................108 4.5 Conclusiones...........................................................................109
5 Control y estandarizacin.........................................................113 5.1 Introduccin............................................................................115 5.2 Monitoring ethylene content in heterophasic copolymers by near-
infrared spectroscopy. Standardisation of the calibration model..117 5.3 Ampliacin de resultados .........................................................135 5.4 Conclusiones...........................................................................139
6 Outliers en prediccin...............................................................143 6.1 Introduccin............................................................................145 6.2 Outlier detection in the ethylene content determination in propylene
copolymer by near-infrared spectroscopy and multivariate
calibration...............................................................................147 6.3 Ampliacin de algunos aspectos experimentales ........................163 6.4 Conclusiones...........................................................................166
7 Evaluacin de las posibilidades de esta metodologa................. 169 7.1 Introducin..............................................................................171
8/6/2019 Ir en La Petroquimica
15/222
7.2 Near infrared spectroscopy and multivariate calibration for thequantitative determination of certain properties in the petrochemical
industry...................................................................................173 7.3 Conclusiones...........................................................................189 8 Anlisis espectral para la seleccin de variables ....................... 191
8.1 Introduccin............................................................................193 8.2 Wavelength selection of naphtha near infrared spectra using
conventional spectral analysis and PCA....................................194 8.3 Conclusiones...........................................................................209
9 Conclusiones generales............................................................. 211 9.1 Conclusiones...........................................................................213 9.2 Perspectivas futuras.................................................................217
8/6/2019 Ir en La Petroquimica
16/222
8/6/2019 Ir en La Petroquimica
17/222
OBJETIVO
8/6/2019 Ir en La Petroquimica
18/222
8/6/2019 Ir en La Petroquimica
19/222
Objetivo
3
OBJETIVO
El objetivo general de la presente tesis doctoral ha sido el desarrollo yaplicacin de metodologas analticas basadas en la combinacin de medidasespectroscpicas de infrarrojo medio y cercano con mtodos quimiomtricos deanlisis multivariante. Las aplicaciones desarrolladas estn enfocadas a ladeterminacin cuantitativa de diferentes propiedades fsicas y qumicas de intersen la industria petroqumica.
Este objetivo general, enunciado arriba, se puede desglosar en los siguientesobjetivos ms detallados:
1 Desarrollo de modelos de calibrado multivariantes basados en medidasespectroscpicas.
2 Estudio de la estabilidad en el tiempo de los modelos desarrollados y sutransferencia a nuevas situaciones experimentales.
3 Deteccin de situaciones anmalas, no contempladas en el proceso decalibrado (deteccin de muestras discrepantes).
Las aplicaciones sobre las que se ha trabajado han sido:
a) La determinacin del contenido de las diferentes familias de hidrocarburosque constituyen la nafta.
b) El anlisis del contenido en etileno y otras propiedades mecnicas, como laviscosidad o el ndice de fluidez, de diferentes tipos de polmeros ycopolmeros de polipropileno.
Estos dos tipos de muestras, la nafta y el polipropileno, constituyen dosproblemas industriales diferentes entre s, tanto por el diferente estado fsico de lamuestra como por las diferencias en los procesos industriales involucrados. La
8/6/2019 Ir en La Petroquimica
20/222
Objetivo
4
nafta es una fraccin lquida del petrleo, obtenida por destilacin, cuyacomposicin depende de la procedencia del petrleo de partida as como de las
operaciones de separacin que se han aplicado a este crudo. Los copolmeros depolipropileno son slidos, producto de la polimerizacin de propileno en presenciade otros polmeros, y sus caractersticas finales dependern de la naturaleza yproporcin de los polmeros aadidos.
8/6/2019 Ir en La Petroquimica
21/222
1. INTRODUCCIN
8/6/2019 Ir en La Petroquimica
22/222
8/6/2019 Ir en La Petroquimica
23/222
Introduccin
7
1.1 PRESENTACIN DE LOS CONTENIDOS
Desde el punto de vista industrial existe gran inters en el desarrollo demetodologas analticas que proporcionen gran cantidad de informacin, que stasea de calidad y que adems lo hagan en el menor tiempo posible. Esta idea, que esaplicable a cualquier proceso industrial, cobra especial relevancia en un sectorcomo el de la industria petroqumica, en la que es habitual la monitorizacin ycontrol de los procesos basndose en la informacin que proporciona el laboratoriode anlisis.
Normalmente los mtodos de anlisis utilizados en estos laboratorios sonmtodos normalizados por organismos oficiales, especficos para cada propiedad oanalito a determinar. Frecuentemente tienen ciertas caractersticas que los hacenpoco eficaces en el entorno industrial, como puede ser un elevado tiempo deanlisis o la necesidad de una manipulacin intensiva de la muestra previa alanlisis. Estas caractersticas hacen que sean tcnicas poco adecuadas para un
control en lnea de los procesos industriales, tanto por la demora en obtener elresultado, como porque es tcnicamente difcil acoplarlas a la lnea de produccin.
La espectroscopia de infrarrojo, tanto en la zona del infrarrojo medio como elinfrarrojo cercano, resulta una tcnica atractiva en el mbito industrial porque:
a) Proporciona una informacin qumica muy verstil. La espectroscopia
molecular, como consecuencia del tipo de transiciones propias de estazona, aporta informacin de una gran cantidad de compuestos qumicos.Esta propiedad, combinada a las tcnicas multivariantes, permiteconsiderar la determinacin simultnea de ms de un analito o propiedadde inters a partir del espectro registrado de la muestra.
8/6/2019 Ir en La Petroquimica
24/222
Captulo 1
8
b) La obtencin del espectro se hace de una forma rpida y no es necesario unpretratamiento de la muestra, lo que facilita el acoplamiento de esta tcnica
a la lnea de produccin (anlisis en lnea).
La falta de especificidad de la seal analtica registrada, caracterstica ventajosadesde el punto de vista de la versatilidad, tiene como inconveniente que obliga alempleo de tcnicas de anlisis multivariante, en concreto tcnicas de calibradomultivariante. Estos mtodos extraen eficazmente la informacin de los datos,aunque necesitan un adecuado estudio del problema abordado y una etapa de
desarrollo de la metodologa ms laboriosa que los anlisis clsicos.
En esta tesis doctoral se ha abordado la determinacin del contenido total enparafinas, isoparafinas, naftenos y aromticos, as como del contenido desglosadopor nmero de tomos de carbonos de cada una de estas familias de hidrocarburos,en muestras de nafta, utilizando la seal registrada tanto en la zona del infrarrojomedio como en el infrarrojo cercano. Tambin se ha abordado la determinacin del
contenido en etileno, viscosidad e ndice de fluidez de muestras de polipropileno apartir de la seal registrada en la zona del infrarrojo cercano.
La tcnica de calibracin multivariante que se ha utilizado ha sido la calibracinmultivariante por mnimos cuadrados parciales (PLS). Las diferentes propiedadesde las muestras se han determinado en los propios laboratorios de las industriascolaboradoras, utilizando los mtodos de anlisis habituales y que son la
cromatografa de gases en el caso de la nafta y la espectroscopia IR, as como otrosanlisis fsicos, en el caso de los polmeros. Los resultados de estos anlisis se hanutilizado para construir y comprobar la validez de los modelos de calibracindesarrollados.
En la etapa de validacin de los modelos de calibrado se realiza una estimacindel error de prediccin futuro. Habitualmente esta estimacin consiste en un nico
8/6/2019 Ir en La Petroquimica
25/222
Introduccin
9
valor de error promedio que da una informacin de las caractersticas predictivasglobales del modelo, aunque en algunas situaciones, como por ejemplo el mbito
industrial, puede ser preferible proporcionar un error de prediccin especfico paracada muestra, equivalente a los intervalos de prediccin habituales en la calibracinunivariante. En el campo de la calibracin multivariante por mtodos que utilizanla descomposicin en factores existen varias expresiones propuestas para calcularel error de prediccin especfico, aunque no existe una comnmente aceptada, porlo que se ha estudiado el uso de diferentes expresiones en algunas de lasaplicaciones tratadas en esta tesis.
El establecimiento de esta metodologa analtica no acaba con el desarrollo yposterior validacin del modelo de calibrado propiamente dicho, si no que esnecesario establecer un procedimiento de control de su validez con el tiempo. Conesta finalidad se ha abordado el tema de la deteccin de situaciones anmalas deutilizacin de los modelos, no contempladas en el proceso de calibrado, as como laestabilidad de los sistemas con el tiempo. Estos dos aspectos se han abordado tanto
mediante tcnicas de control de tipo univariante, como los grficos de Shewhart,cmo mediante tcnicas de control de tipo multivariante, como el estadsticoT 2 deHotelling o el estadsticoQ.
Cuando se detecta la perdida de validez del modelo, es posible la aplicacin demtodos de correccin que permiten seguir utilizando el modelo. Esta modificacindel modelo requiere una cierta experimentacin, pero que sera mucho menor de la
que comportara un proceso de recalibrado completo, lo que se traduce en unimportante ahorro de trabajo y tiempo. Con esta finalidad se han aplicadodiferentes tcnicas de transferencias de modelos, como la correccin de lapendiente y el sesgo (slope-bias correction , SBC) o la estandarizacin directa porpartes ( piecewise direct standardisation , PDS).
8/6/2019 Ir en La Petroquimica
26/222
Captulo 1
10
La aplicacin prctica de estas metodologas ha permitido comprobar que enocasiones no se tienen en cuenta algunas consideraciones bsicas que ayudan a
evaluar las posibilidades de xito de la aplicacin propuesta, como por ejemplo larelacin entre el espectro infrarrojo y la propiedad a determinar, la existencia deagrupaciones en las muestras o el hecho de trabajar en intervalos de la propiedad deinters muy estrechos en comparacin con la reproducibilidad de la tcnica dereferencia. Otros aspectos como las distintas estrategias para estandarizar oactualizar el modelo, son de vital importancia en el caso de la aplicacin de lacalibracin multivariante a problemticas industriales y que hay que planificar
desde el mismo momento del desarrollo del modelo. Todos estas consideracioneshan sido aplicadas a las aplicaciones desarrolladas en la presente tesis doctoral.
Otro aspecto importante de la calibracin multivariante es la seleccin devariables, en contraposicin a la utilizacin del espectro completo para construir elmodelo. Cuando el nmero de longitudes de onda es muy grande se puedenintroducir mejoras en el modelo de calibrado reduciendo el nmero de stas,
eliminando las que contienen un mayor grado de ruido, informacin no relevante otrminos no lineales y trabajando nicamente con aquellas que estn directamenterelacionadas con el analito o la propiedad de inters. La seleccin de longitudes deonda que permite construir modelos ms simples y por tanto ms sencillos deinterpretar ha sido aplicada al desarrollo de modelos en naftas.
1.2 CASOS PRCTICOS ESTUDIADOS
1.2.1 Determinacin de PIONA en nafta
La nafta es el producto de partida para la produccin de alquenos (olefinas) quese realiza a travs del proceso decracking (Fig. 1), base de la industriapetroqumica [1]. Como su nombre indica (en ingls rotura,cracking ) consiste enla reduccin del tamao de las molculas del producto de partida, para obtenerproductos ms ligeros. La nafta se introduce en el horno en presencia de vapor para
8/6/2019 Ir en La Petroquimica
27/222
Introduccin
11
evitar la formacin de coque, por lo que estas unidades se denominansteamcrackers (crackers con vapor). Las condiciones de operacin de los hornos de la
unidad deben adaptarse a las caractersticas qumicas de la nafta de alimentacinpara obtener un resultado ptimo. Estas caractersticas qumicas de la nafta varandebido a cambios en el origen del producto, cambios en las etapas productivasprevias (destilacin) o en las condiciones de almacenaje, etc.
olefinasdestilacin
petrleonafta
GLP
queroseno
gas-oil
residuo
steam cracker
etilenopropileno...
olefinasdestilacin
petrleonafta
GLP
queroseno
gas-oil
residuo
steam cracker
etilenopropileno...
Fig. 1.Esquema general de la produccin de olefinas a partir de la nafta del petrleo.
Para caracterizar la nafta de alimentacin se debe determinar el contenido encada una de las familias de los diferentes hidrocarburos presentes. Estoshidrocarburos son alcanos lineales (n-parafinas), alcanos ramificados(isoparafinas), alcanos cclicos (naftenos), alquenos (olefinas) y aromticos. Esteanlisis se conoce comnmente como determinacin de PIONA.
El nmero de constituyentes de la nafta es tan amplio que un sistemacromatogrfico con una nica columna no puede separarlos todos en un tiemporazonable. Para realizar este anlisis, en la mayora de laboratorios de refineras seutiliza un sistema cromatogrfico multicolumna comercial [2]. Este sistema utilizadiversas columnas acopladas mediante vlvulas para separar secuencialmente todos
8/6/2019 Ir en La Petroquimica
28/222
Captulo 1
12
los componentes de la muestra. Un esquema de un sistema de este tipo se puedeobservar en la Fig. 2.
OV-275v
vtrampa
D
olefinas
saturados
OV-101
Pt 5 13X
v
v v
v
trampa
H2He
Fig. 2.Esquema bsico del sistema multicolumna para anlisis de PIONA (Adaptado deBeens y col. [3]).
Este sistema proporciona la composicin (% en peso) de n-parafinas,isoparafinas, naftenos, olefinas y aromticos, segn el nmero de carbonos de cadacomponente. Este anlisis est ampliamente extendido en la industria petroqumicapara el anlisis de composicin de gasolina y nafta. Un importante inconvenienteque presenta esta tcnica es el elevado tiempo de anlisis, ya que son necesarias
entre 3 y 4 horas para llevarlo a cabo. La relativa lentitud del anlisis no permiteuna optimizacin adecuada delcracker , por lo que la posibilidad de emplear unatcnica ms rpida, como la espectroscpica de infrarrojo producira importantesbeneficios en el control y optimizacin de la produccin de olefinas.
1.2.2 Determinacin de etileno, viscosidad e ndice de fluidez en polipropileno
El polipropileno (PP) es uno de los polmeros termoplsticos comerciales ms
importantes del mercado, con una demanda en continua expansin. Se obtiene porpolimerizacin de propileno, obtenido a su vez como subproducto en el proceso deobtencin de etileno por craqueo con vapor, o bien del proceso decracking cataltico para la obtencin de gasolina. Es un producto de coste relativamentebajo, que puede ser fcilmente modificado mediante la copolimerizacin paraadecuar sus propiedades fsicas a diferentes aplicaciones.
8/6/2019 Ir en La Petroquimica
29/222
Introduccin
13
R e a c t o r
B
ReactorA Extrusor
Extrusor
propileno
etilenopropilenohidrgeno
PP granza
PP/EPRgranzaPP/EPRpolvo
PPpolvo
R e a c t o r
B
ReactorA Extrusor
Extrusor
propileno
etilenopropilenohidrgeno
PP granza
PP/EPRgranzaPP/EPRpolvo
PPpolvo
Fig. 3.Esquema de la produccin de polipropileno homopolmero (PP) y copolmero deetileno-propileno (PP/EPR o iPP).
La copolimerizacin ms corriente consiste en aadir un elastmero alpolipropileno para modificar su cristalinidad, ya que se introducen irregularidadesen la macromolcula. El producto resultante de la copolimerizacin tiene unamayor dureza a bajas temperaturas y una menor tendencia a la fractura. El
elastmero ms utilizado es a su vez un copolmero, de etileno-propileno (EPR, delinglsethylene-propylene rubber ). El polipropileno producido se denominaimpact resistant (resistente al impacto), y contiene entre un 10-30% de EPR. Aunque esteproducto se denomina habitualmente copolmero heterofsico, debido a laconvivencia de una fase cristalina y otra amorfa, no existen enlaces qumicos entreel PP y el EPR aadido, por lo que en realidad se trata de una mezcla fsica de losdos polmeros y no de un verdadero copolmero. En la actualidad este copolmero
de PP se produce directamente en un proceso multietapa, consistente en unacopolimerizacinin situ de propileno y etileno en presencia del homopolmero dePP con un sistema cataltico de TiCl3-AlEt3 (Fig. 3).
El copolmero de impacto formado (impact PP o PP/EPR) posee una matriz dehomopolmero de PP en la que se halla disperso el EPR en forma de pequeaspartculas discretas. Estas partculas protegen la matriz contra la propagacin de
8/6/2019 Ir en La Petroquimica
30/222
Captulo 1
14
grietas disipando grandes cantidades de energa en el material que rodea lapartcula [4]. La caracterizacin de la compleja estructura de este material se ha
llevado a cabo por diferentes tcnicas: resonancia magntica nuclear (RMN),fraccionamiento por elucin a temperatura variable cromatografa de exclusinpor tamaos (TREF-SEC, del inglsTemperature rising elution fraction - Size
Exclusin Chromatography ) y la microscopia electrnica (TEM) [5, 6].
En la planta de produccin de polipropileno se llevan a cabo anlisis mssencillos para comprobar la calidad del producto, como por ejemplo la
determinacin del % de etileno aadido, del ndice de fluidez o la viscosidad. En elcaso del % de etileno, el mtodo de determinacin es la espectroscopia deinfrarrojo medio. Para llevar a cabo este anlisis, la muestra debe ser calentada a150 C y prensada para obtener una lmina fina de material, adecuada para unanlisis por transmisin de infrarrojo. El ndice de fluidez (melt flow index , MFI, eningls) se mide por la cantidad (peso en gramos) de polmero fundido y extruidodurante 10 min. a travs de un orificio de longitud y dimetro interno normalizado,
en unas condiciones especficas de presin y temperatura [7] (Fig. 4). Laviscosidad intrnseca (olimiting viscosity number segn la nomenclatura IUPAC)se obtiene extrapolando la viscosidad reducida a concentracin cero y requiere ladisolucin del polmero en tetrahidronaftaleno a 135C [8].
masa M
9.57 mm
8.0 mm
2.09 mm
Fig. 4.Esquema del sistema para la medicin del ndice de fluidez. Adaptado de ref. 9
8/6/2019 Ir en La Petroquimica
31/222
Introduccin
15
Como se puede ver, los diferentes anlisis del polipropileno requierenpretratamientos de la muestra: fundido y prensado para obtener una lmina,
fundido y extrusin o disolucin a altas temperaturas. Estos pretratamientosrepresentan una porcin considerable del tiempo total de anlisis, planteanproblemas de reproducibilidad y son una fuente de errores sistemticos si no serealizan correctamente, ya que pueden alterar fcilmente la muestra y afectar alresultado del anlisis. Por estos motivos, representa una alternativa muy atractiva eluso de un nico anlisis espectroscpico (un solo espectro) por muestra, paradeterminar rpidamente las mltiples propiedades que se analizan rutinariamente
en este tipo de polmeros.
1.3 ESTRUCTURA DE LA TESIS
El trabajo desarrollado en la presente tesis doctoral, ha sido consecuencia de lainteraccin entre el grupo de investigacin en el cual he trabajado con dosempresas del polgono industrial de Tarragona; la empresa Repsol-YPF y la
empresa Transformadora de propileno (TDP), lo que ha permitido un conocimientode los aspectos de carcter prctico que entraa el desarrollo de esta metodologa.La secuencia del trabajo efectuado responde a la necesidad de compaginar las
actividades de organismos tan diferenciados como son la Empresa y laUniversidad. Por este motivo y con la finalidad de exponer de la forma mssencilla posible el trabajo efectuado, la presente tesis se ha estructurado de la formaque se detalla a continuacin:
En primer lugar se describen los principales objetivos de la tesis as comosu justificacin.
En el captulo 1 se presentan los contenidos de la tesis y el inters de lasaplicaciones industriales sobre las que se ha trabajado. Por ltimo seexpone un esquema de la tesis.
8/6/2019 Ir en La Petroquimica
32/222
Captulo 1
16
En el captulo 2 se hace una introduccin a los fundamentos tericos,espectroscpicos y quimiomtricos, utilizados.
En el captulo 3 se presenta la parte experimental de este trabajo. En los captulos 4 a 8 se presentan los resultados obtenidos. En el captulo 9 se presentan las conclusiones generales de la tesis.
El captulo 2, en el que se presentan los fundamentos tericos, y el captulo3, donde se presentan aspectos experimentales, tienen contenidos que tambinse incluyeron en algunas de las publicaciones presentadas, aunque se ha
mantenido esta duplicidad por motivos de claridad y para tener una visinconjunta del trabajo.
Los captulos 4 a 8 tienen una estructura similar: un apartado introductorioque da paso a la publicacin realizada, con una ampliacin de algunos aspectosexperimentales o de los resultados que no estn suficientemente tratados en lapublicacin, para terminar con las conclusiones de cada apartado.
El captulo 4 contiene un apartado introductorio ms extenso que el resto decaptulos de resultados, en el que se presentan los modelos de calibradodesarrollados para el polipropileno, ya que ciertos aspectos de este modelo setratan en sucesivos captulos (cap. 5 y 6). Los modelos de nafta utilizando laespectroscopia de infrarrojo medio, fueron objeto de una publicacin que sepresentada en este captulo.
En los captulos 5 y 6 se trata el tema del control y transferencia (cap. 5) y dela deteccin de muestras discrepantes (cap. 6) del modelo desarrollado paradeterminar el contenido en etileno en muestras de polipropileno. Estos aspectosfueron objeto de sendas publicaciones que se presentan en estos captulos.
8/6/2019 Ir en La Petroquimica
33/222
Introduccin
17
El captulo 7 presenta consideraciones de carcter general y prctico de lautilizacin de la calibracin multivariante y los mtodos espectroscpicos en la
industria petroqumica, que tambin fue objeto de una publicacin.
En el captulo 8 se presenta un aspecto importante de la calibracinmultivariante que no se haba desarrollado antes en esta tesis, como es laseleccin de variables. La seleccin de las variables (longitudes de onda en estecaso) que aportan ms informacin de la propiedad de inters, si bienseguramente no comportar una mejora sensible de la exactitud de los modelos,
puede aportar otras posibles mejoras como podra ser una mayor sencillez,robustez y facilidad de actualizacin y estandarizacin del modelo.
Por ltimo, en el captulo 9 se presentan las conclusiones generales de latesis y las perspectivas de futuro de estas metodologas analticas en el campode la industria petroqumica.
8/6/2019 Ir en La Petroquimica
34/222
Captulo 1
18
BIBLIOGRAFA 1 R. E. Kirk and D. F. Othmer,Kirk-Othmer concise encyclopedia of chemical
technology, Wiley, New York,1985.2 P. van Arkel, J. Beens, J. Spaans, D. Grutterink and R. Verbeek, J.
Chromatogr. Sci. 26 , 1988, 267.3 J. Beens, U.A.Th. BrinkmanTrends Anal. Chem. 19 , 2000,260.4 M. Francis, Jr. Mirabella, J. Appl. Polym. Science: Appl. Polym. Symp. 51,
1992, 117.5 T. Usami, Y. Gotoh, H. Umemoto, and S. Takayama, J. Appl. Polym.
Science: Appl. Polym. Symp. 52 , 1993, 145.6 Z. S. Petrovic, J. Budinski-Simendic, V. Divjakovic, and Z. Skrbic, J. Appl.
Polym. Science 59 , 1996, 301.7 The American Society for Testing and Materials (ASTM), Test Method
D1238-01. ASTM Annual Book of Standards, vol. 08.01, West
Conshohocken, PA, USA,2001.8 The American Society for Testing and Materials (ASTM), Test Method
D2857-95(2001). ASTM Annual Book of Standards, vol. 08.02, WestConshohocken, PA, USA,2001.
9 N.G. McCrum, C.P. Buckey and C. B. Bucknall,Principles of Polymer Engineering , 2nd Ed. Oxford University Press, Oxford,1997.
8/6/2019 Ir en La Petroquimica
35/222
2. FUNDAMENTOS TERICOS
8/6/2019 Ir en La Petroquimica
36/222
8/6/2019 Ir en La Petroquimica
37/222
Fundamentos tericos
21
2.1 ESPECTROSCOPIA DE INFRARROJO
2.1.1 Aspectos fundamentales
La espectroscopia molecular se basa en la interaccin entre la radiacinelectromagntica y las molculas. Dependiendo de la regin del espectro en la quese trabaje y por tanto de la energa de la radiacin utilizada (caracterizada por sulongitud o nmero de onda), esta interaccin ser de diferente naturaleza:excitacin de electrones, vibraciones moleculares y rotaciones moleculares [1]. La
molcula, al absorber la radiacin infrarroja, cambia su estado de energavibracional y rotacional. Las transiciones entre dos estados rotacionales requieremuy poca energa, por lo que solo es posible observarlas especficamente en el casode muestras gaseosas. En el caso del estudio del espectro infrarrojo (IR) demuestras slidas y lquidas slo se tienen en cuenta los cambios entre estados deenerga vibracional [2].
Utilizando la mecnica quntica y el modelo del oscilador anarmnico pararepresentar los enlaces, se demuestra que las bandas en el infrarrojo se producencomo consecuencia de transiciones entre niveles de energa en los que el nmerocuntico vibracional () cambia en una unidad (=1), denominada bandafundamental, o en ms de una unidad (=2, 3, ... ), que se denominansobretonos [3]. Aunque tericamente son posiblesuperiores, en la prctica slose observan estas tres transiciones. Las bandas de absorcin aparecenaproximadamente (existen otros trminos despreciables) a frecuencias: (la bandafundamental), 2 y 3 (los sobretonos) [2]. Estos ltimos tienen una menorintensidad que la banda fundamental. Tambin se producen bandas comoconsecuencia de la interaccin de dos vibraciones diferentes:
...2211 = nncomb
8/6/2019 Ir en La Petroquimica
38/222
Captulo 2
22
Una molcula poliatmica (n tomos) tiene 3n-6 modos de vibracin diferentes(3n-5 si la molcula es lineal). Cada uno de estos modos de vibracin viene
representado por una curva de energa potencial diferente y da lugar a una bandafundamental y sus correspondientes sobretonos en el infrarrojo. Los modos devibracin que se pueden producir incluyen: cambios en la distancia de enlace(elongaciones ostretching , que pueden ser simtricas o asimtricas) y cambios enel ngulo de enlace, obending (simtricas en el plano, asimtricas en el plano,simtricas fuera del plano y asimtricas fuera del plano) [4].
2.1.2 Regiones espectrales
Aunque el espectro infrarrojo se extiende desde 10 a 14 300 cm-1, desde unpunto de vista funcional se divide en tres zonas: IR lejano, donde se producen lasabsorciones debidas a cambios rotacionales, el IR medio (MIR o simplemente, IR),donde tienen lugar las vibraciones fundamentales y el IR cercano (near infrared, NIR), donde se producen absorciones debidas a sobretonos y combinaciones de lasbandas fundamentales.
Tabla 1.Divisin del espectro IR, adaptado de ref. 2, pag 21.
Regin Transicin caractersticaLongitud de onda
(nm)Nmero de onda
(cm-1)Infrarrojo cercano (NIR) Sobretonos y combinaciones 700-2500 14300-4000Infrarrojo medio (IR) Vibraciones fundamentales 2500 5 x 104 4000-200Infrarrojo lejano Rotaciones 5x104 106 200-10
2.1.3 Tipos de medidas en infrarrojo
Cuando la radiacin incide en la muestra (Fig. 5), sta puede sufrir diferentesfenmenos: absorcin, transmisin y reflexin. La intensidad de la luz transmitidaa travs de la muestra (P T ) es menor que la intensidad incidente (P 0). Una parte deesta intensidad incidente se ha reflejado (P R), mientras que otra parte ha sidoabsorbida por la sustancia (P A ).
8/6/2019 Ir en La Petroquimica
39/222
Fundamentos tericos
23
P0
PR PT
1 2PA
RT A PPPP ++=0 Fig. 5 Fenmenos de absorcin, transmisin y reflexin de la radiacinelectromagntica al interaccionar con la materia.
La medida ms comn en el infrarrojo es la que se basa en la absorcin (o laintensidad transmitida), aunque tambin se han desarrollado espectroscopiasbasadas en el fenmeno de la reflexin como son la reflectancia total atenuada y lareflectancia difusa. A continuacin se describen estas tcnicas, que son las que sehan utilizado en el transcurso de la presente tesis.
2.1.3.1 Absorcin/Transmisin
El espectro por transmisin a travs de la muestra determinaP A, ya que estaprdida en la intensidad luminosa incidente est relacionada con la concentracinde la muestra. La transmitancia,T , se calcula como la fraccin de radiacin (P T /P 0)transmitida a travs de la muestra. La intensidad de absorcin de la luz,absorbancia ( A) se calcula como:
T PP
T A 0loglog ==
La representacin de la transmitancia o de la absorbancia como una funcin de
la longitud de onda,, o del nmero de onda , , es lo que conforma el espectro dela muestra. La relacin que existe entre la concentracin y la absorbancia estdescrita por la ley de Lambert-Beer:
lc A =
8/6/2019 Ir en La Petroquimica
40/222
Captulo 2
24
La absorcin de la radiacin por parte de la muestra es proporcional a lalongitud del camino ptico (anchura de la celda,l ) [en cm], a la concentracin de
la solucin [mol/L] y a una constante proporcional especfica de cada muestra,, denominada absortividad molar, [L mol-1 cm-1]. Esta ley lineal se cumplenicamente para disoluciones diluidas (c a 0.1 M), pudindose producirdesviaciones de la linealidad a concentraciones ms elevadas al variar comoconsecuencia de cambios en el ndice de refraccin de la disolucin. Otrasdesviaciones de la linealidad tienen su origen en la propia instrumentacin:presencia de luz reflejada y dispersada, luz no estrictamente monocromtica o
detectores de respuesta no lineal [5].
2.1.3.2 Reflectancia total atenuada (attenuated total relflectance, ATR)
El principio de esta medida se basa en el fenmeno de la reflexin total internay la transmisin de la luz a travs de un cristal con un elevado ndice de refraccin(Fig. 6). La radiacin penetra (unosm) ms all de la superficie del cristal donde
se produce la reflexin total, en forma de onda evanescente [6]. Si en el ladoexterior del cristal se coloca un material absorbente (muestra), la luz que viaja atravs del cristal se ver atenuada (de ah el nombre de la tcnica) y se puederegistrar el espectro de la muestra.
El ngulo de la luz incidente y la geometra del cristal facilitan que seproduzcan sucesivas reflexiones en sus caras internas. El espectro medido tiene una
apariencia similar al espectro de transmisin, excepto por ciertas variaciones en laintensidad en funcin de la longitud de onda que se producen.
8/6/2019 Ir en La Petroquimica
41/222
Fundamentos tericos
25
cristal
(SeZn)muestra
IRE
reflectado
crt
crt
normal
incidente
superficie
aire cristal
(SeZn)muestra
IRE
cristal
(SeZn)muestra
IRE
reflectado
crt
crt
normal
incidente
superficie
aire
reflectado
crt
crt
normal
incidente
superficie
aire
Fig. 6. Reflexin total interna y elemento de reflexin interna (IRE) utilizado en elsistema ATR. Adaptado de ref. 6 pag. 321 y 324.
La profundidad de penetracin [6],d p, depende de la longitud de onda de laradiacin,, del ndice de refraccin del cristal,n p, del ndice de refraccin de lamuestra,n s, y del ngulo de incidencia del haz de radiacin del cristal,, deacuerdo con la ecuacin:
2 / 122 )(2 sp p p
nsennd
=
donde n sp =n s / n p (n s
8/6/2019 Ir en La Petroquimica
42/222
Captulo 2
26
2.1.3.3 Reflectancia difusa
Otra medida que se basa en el fenmeno de la reflexin es la reflectancia difusa.
Cuando la luz incide sobre una muestra opaca y no absorbente tiene lugar elfenmeno de la reflexin especular regido por las ecuaciones de Fresnel (Fig. 7a).
a b ca b c Fig. 7.Procesos de reflexin en un material especular (a) o irregular (b). Fenmeno dereflectancia difusa (c). Adaptado de ref 2, pag. 44-45.
La intensidad reflejada sobre el total incidente depende de los ndices derefraccin del aire y la muestra (n1 , n 2). Para el caso de un ngulo de incidenciaigual a cero la expresin es [2]:
212
212
)()(
nnnn
PP
O
R
+
=
Cuando la luz incide sobre una superficie irregular, se puede considerar que lafrontera entre el medio y la muestra est formado por una serie de pequeasinterfases orientadas en todos los ngulos posibles (Fig. 7b). De esta forma aunquecada una de estas pequeas interfases refleja la luz siguiendo la ley de Fresnel, elefecto global es una reflexin de la luz a cualquier ngulo (reflectancia difusa).
La radiacin que se transmite a travs de la primera interfase (Fig. 7c) puedesufrir absorcin por parte de la muestra, por lo que la intensidad de la luz se veratenuada segn la ley de Beer. Esta radiacin que ha atravesado la primera capa departculas se difunde a las siguientes capas a travs de reflexiones aleatorias,refracciones y dispersin y puede sufrir nuevos fenmenos de atenuacin. Lalongitud de camino ptico seguido por la luz es muy difcil de describir
8/6/2019 Ir en La Petroquimica
43/222
Fundamentos tericos
27
matemticamente, sobre todo si las partculas de la muestra tienen tamaosheterogneos, por lo que no se ha desarrollado una teora rigurosa de la reflectanciadifusa. S que existen teoras basadas en la prctica, la ms conocida la de Kubelka-Munk [7]. Esta teora propone para una capa completamente opaca y de grosorinfinito:
sc
sk
R
R ==
2)1( 2
donde
R es la reflectancia de la capa infinitamente gruesa, yk y s son las
constantes descattering y absorcin, respectivamente. El coeficiente de absorcin(k ), es igual a la concentracin multiplicada por la absortividad definida en la leyde Beer ( c).
En la prctica la reflectancia difusa se mide respecto a un estndar noabsorbente y a continuacin se calcula el logaritmo para llegar a una relacin lineal
con la concentracin [8]:
sc
R R R
R += standstand log
1loglog
R y stand R representan la reflectancia de la muestra y del estndar respectivamente
(siendo mayor la reflectancia del estndar que la de la muestra). Para la luz
monocromtica standlog R es constante y puede ser ignorado. Si se cumple la
condicin de aditividad del espectro, la expresin anterior puede ser reescritacomo:
Rs
k c1log
+=
8/6/2019 Ir en La Petroquimica
44/222
Captulo 2
28
Con lo que, cmo en el caso de la ley de Beer, existe una relacin entre laconcentracin y la radiacin medida en el espectro. Aunque existe el inconveniente
de ques no es constante y depende de varias propiedades de la muestra, como eltamao de partcula y el contenido de humedad. Al aumentar el tamao medio de
partcula ( d s / 1 ) se produce una reduccin delscattering y la radiacin penetrams profundamente en la muestra, con lo que el log(1/R) aumenta. El efecto es undesplazamiento a lo largo del eje de ordenadas como funcin del tamao departcula. Adems elscattering de las partculas pequeas depende de la longitudde onda, lo que provoca que el desplazamiento debido al tamao de partcula no
sea constante en todo el espectro.
La presencia de agua en el espectro provoca la aparicin de bandascaractersticas, y adems afecta a la totalidad del espectro debido a la variacin quese introduce en el ndice de refraccin del medio (no), provocando un aumento delog(1/R). Puesto que el grado de humedad puede variar entre muestras, en laprctica la constante descattering (s) se convierte en una incgnita para cada una
de las nuevas muestras, por lo que no se puede llevar a cabo el anlisis cuantitativo.
2.2 INTERPRETACIN DE ESPECTROS
2.2.1 Asignacin de bandas
En el espectro infrarrojo medio, entre 4000 y 1300 cm-1 (regin de frecuenciasde grupo) se observan una serie de bandas asignadas a vibraciones de slo dos
tomos de la molcula. En este caso la banda de absorcin se asocia nicamente aun grupo funcional y a la estructura molecular completa, aunque hay influenciasestructurales que provocan desplazamientos significativos en la frecuencia de lavibracin. Esta vibraciones derivan de grupos que contienen hidrgeno (C-H, O-H,y N-H) o grupos con dobles y triples enlaces aislados. Entre 1300 y 400 cm-1 ( fingerprint region ) la asignacin a grupos funcionales determinados es ms difcildebido a la multiplicidad de bandas, pero es una zona de espectro muy til para la
8/6/2019 Ir en La Petroquimica
45/222
Fundamentos tericos
29
identificacin de compuestos especficos [9]. La Fig. 8 muestra un cuadro resumende las frecuencias de absorcin de los grupos funcionales ms comunes en el IRmedio. En el espectro de infrarrojo cercano, predominan las bandas debidas asobretonos y combinaciones de enlaces en los que participa el hidrgeno (debido aque aumenta el grado de anarmonicidad de la vibracin), en la Fig. 9 se muestra uncuadro resumen de las absorciones ms habituales en el infrarrojo cercano.
2 4 6 8 10 12 14 16
Regin de frecuenciasde grupo
Fingerprint region
flexin C-H
flexin N-H
tensin C-C
tensin C-N
tensin C-O
flexin O-H
flexin C-H
flexin N-H
tensin CC
tensin C=N
tensin C=O
tensin CC, CN
tensin C-H
tensin O -H, N-H
4004000 2000 1500 1000 800
25
Nmero de onda (cm-1)
Long. de onda (m)2 4 6 8 10 12 14 16
Regin de frecuenciasde grupo
Fingerprint region
flexin C-H
flexin N-H
tensin C-C
tensin C-N
tensin C-O
flexin O-H
flexin C-H
flexin N-H
tensin CC
tensin C=N
tensin C=O
tensin CC, CN
tensin C-H
tensin O -H, N-H
4004000 2000 1500 1000 800
25
Nmero de onda (cm-1)
Long. de onda (m) Fig. 8.Frecuencias de vibracin en el infrarrojo medio. Adaptado de ref. 9, pag. 556.
1000 1500 2000 2500
CH3
CH
C-H aromtico
CH2
CH
C=CH
R CH CH2CH2
Long. de onda (nm)1000 1500 2000 2500
CH3
CH
C-H aromtico
CH2CH2
CHCH
C=CH
C=CH
R CH CH2CH2
R CH CH2CH2
Long. de onda (nm) Fig. 9.Frecuencias de vibracin en el infrarrojo cercano. Adaptado de ref. 2, pag. 28.
En el NIR las bandas de absorcin no estn tan bien definidas como en elinfrarrojo medio, apareciendo en forma de bandas ancha y solapadas entre si, por lo
8/6/2019 Ir en La Petroquimica
46/222
Captulo 2
30
que es ms difcil realizar una asignacin a un componente o grupo funcionalconcreto de la muestra. Las bandas tienen una menor intensidad (la absortividad de
la muestra es menor), por lo que se debe trabajar con caminos pticos ms largos,de 0.5 a 10 mm, frente a los 10-50m utilizados en el infrarrojo medio.
50010001500200025003000350040000
0.5
1
nmero de onda (cm-1)
a b s o r b a n c i a
70008000900010000110000
0.5
1
nmero de onda (cm-1)
a b s o r b a n c i a IR cercano
IR medio
Fig. 10.Comparacin entre el espectro IR y NIR del ciclohexano.
2.2.2 Segunda derivada de los espectros
Una aproximacin alternativa al problema de la superposicin de picos y a la
correccin de la lnea base es el uso de la segunda derivada del espectro. Laprimera derivada del espectro se puede calcular muy fcilmente restando lasabsorbancias a longitudes de onda adyacentes (en el caso de longitudes de ondaequidistantes). La segunda derivada se obtiene aplicando de nuevo este proceso. Lasegunda derivada tiene ciertas caractersticas muy interesantes: tiene mnimos en laposicin de las bandas de absorcin del espectro original, facilitando en granmedida la resolucin de los picos solapados. Adems, tambin elimina problemas
8/6/2019 Ir en La Petroquimica
47/222
Fundamentos tericos
31
en la lnea de base. Sus principales desventajas son que disminuye la relacinseal/ruido y aumenta la complejidad del espectro. Debido a que la diferenciacines una operacin lineal, la ley de Lambert-Beer sigue siendo vlida en el espectroderivado, por lo que ste puede ser utilizado para determinaciones cuantitativas.
longitud de onda
a b s o r b a n c i a
longitud de onda
2 a d e r i v a
d a
Fig. 11.Resolucin de dos bandas solapadas a travs de la segunda derivada.
8/6/2019 Ir en La Petroquimica
48/222
Captulo 2
32
2.3 FUNDAMENTOS QUIMIOMTRICOS
2.3.1 Introduccin
El progresivo aumento de la complejidad de la instrumentacin analtica hapermitido obtener volmenes de datos cada vez mayores. La conversin de estosdatos en informacin til requiere del uso de herramientas matemticas yestadsticas, que se han agrupado en la disciplina denominada Quimiometra [10,11, 12, 13, 14]. Este apartado presenta brevemente la base terica de lasherramientas quimiomtricas utilizadas en la presente tesis.
En primer lugar se introduce la descomposicin en componentes principales (oPCA, del ingls principal components analysis ) ya que es una tcnica conmltiples aplicaciones quimiomtricas, como la calibracin (regresin sobrecomponentes principales, PCR), el preprocesado de la respuesta, el anlisis deagrupaciones, etc. Despus se hace un repaso de los pretratamientos de losespectros utilizados a lo largo de la tesis y por ltimos se presentan losfundamentos as como otros aspectos de carcter ms prctico de la calibracinmultivariante, como el control estadstico o la estandarizacin de los modelosdesarrollados.
2.3.2 Descomposicin en componentes principales (PCA)
Al utilizar mtodos espectroscpicos se obtienen respuestas de cada muestrapara cientos o miles de variables, en este caso longitudes de onda. La matriz,R I x J ( I filas por J columnas) representa las respuestas de I muestras analizadas a J longitudes de onda diferentes. El elevado nmero de variables J que caracterizancada muestra impiden un anlisis y representacin grfica sencillos de las muestras.
En este caso, el mtodo de descomposicin en componente principales [15] esmuy til, porque permite representar la variabilidad presente enR, en unos pocos
8/6/2019 Ir en La Petroquimica
49/222
Fundamentos tericos
33
factores (o componentes principales) que son combinaciones lineales de lasvariables originales.
Variable 1
Variable 2
PC 2PC 1
Fig. 12.Representacin grfica de la descomposicin en componentes principales de unconjunto de muestras definidas por dos nicas variables. En este sencillo ejemplo ladescomposicin consiste en un simple cambio de ejes (componentes principales).
El anlisis en componentes principales proporciona una aproximacin a lamatrizR como un producto de dos matrices: la matriz descores , T y la matriz deloadings , P, que capturan la estructura de los datos deR. Losscores capturan laestructura de las filas o lo que es lo mismo, las relaciones entre objetos (muestras)y losloadings retienen la relacin existente entre las variables.
ETPR += T
8/6/2019 Ir en La Petroquimica
50/222
Captulo 2
34
= +R T E
I I I
J J J
PT
A
A
= +R T E
I I I
J J J
PT
A
A
Fig. 13.Notacin matricial de la descomposicin en componentes principales.
El anlisis de componentes principales (PCA) se aplica frecuentemente cuandose trabaja con datos colineales. Esta colinealidad en los datos significa que lainformacin principal de las variablesR se puede condensar en un conjunto mspequeo de A variables. Cada una de estas nuevas A variables se denominacomponente principal o factor. El conjunto de factores se puede ver ms
claramente si se representa el producto TTP como la suma de A trminos de la
forma Taa pt , que corresponden a cada una de las A columnas de las matricesT y
P.
EptptptR ++++= TT22T11 ... A A
= ++R
p1T
t At1 E
I I I I
J J J J
t2
I
J
+...+
p2T p AT
= ++R
p1T
t At1 E
I I I I
J J J J
t2
I
J
+...+
p2T p AT
Fig. 14. Notacin matricial extendida de la descomposicin en componentesprincipales.
El primer componente principal es aqul que explica una mayor cantidad de la
informacin contenida enR (maximiza 1T11TT1 ttRpRp = ). El siguiente factor
2p , explica la mxima informacin deR no contenida enp1 (maximiza
8/6/2019 Ir en La Petroquimica
51/222
Fundamentos tericos
35
2T22
TT2 ttRpRp = y es ortogonal al primer componente principal, esto es
02T1 =tt ). Los sucesivos factores explican cada vez menos informacin y son
ortogonales a los anteriores. Las condiciones de ortogonalidad descores y loadings se pueden resumir como:
IPP =T )(diagT a=TT o bien Aaaaa ...2,1T == tt
Si la matrizR est centrada, entoncesa representa los valores propios de la
matriz RRT , y los vectores ap representan sus vectores propios. Esto significa
que losloadings satisfacen la ecuacin:
aaa pRpR T =
La magnitud de los valores propios indica la cantidad de variabilidad(informacin) que retiene cada uno de los componentes principales.
El anlisis en componentes principales es muy til para la interpretacin dedatos multivariantes. Por un lado, la representacin de losscores permite establecerrelaciones entre las muestras, permitiendo as la deteccin de muestras discrepantesy agrupaciones. Por otra parte, losloadings permiten comparar y estudiar lainfluencia de las distintas variables (longitudes de onda en este caso).
2.3.3 Tcnicas de pretratamiento de datos
El pretratamiento de la seal es uno de los primeros pasos que se lleva a cabo enel anlisis de datos multivariantes. Consiste en manipulaciones matemticas que seaplican antes de cualquier otro tipo de anlisis y tratan de anular o, al menosreducir, fuentes de variabilidad en la seal, ya sea de carcter aleatorio (como el
8/6/2019 Ir en La Petroquimica
52/222
Captulo 2
36
ruido) o de carcter sistemtico (variaciones en la lnea base, etc.), que no estnrelacionadas con el analito o la propiedad de inters.
2.3.3.1 Centrado
El centrado de una variable consiste en la sustraccin del valor medio a todossus elementos. En el caso de los datos espectrales el centrado consiste en restar alespectro de cada una de las muestras el espectro medio. Este pretratamiento ponede relieve las diferencias entre espectros, al haber eliminado la tendencia comn (elespectro medio). Se utiliza tanto en PCA como en PCR o PLS.
-1 0 1-1
0
1
-1 0 1-1
0
1
1500 2000 2500-2
0
2
long. de onda (nm)
l o g
( 1 / R )
1500 2000 2500-0.2
0
0.2
long. de onda (nm)
l o g
( 1 / R ) dc
ba
Fig. 15.Centrado por columnas. a) Objetos definidos por dos variables. b) Los mismosobjetos centrados. c) Espectro de 12 muestras de alcohol polivinlico (PVA). d) Los
mismos espectros de PVA centrados.
2.3.3.2 Suavizado
La aplicacin de tcnicas de suavizado tienen el objeto de reducirmatemticamente el ruido aleatorio que acompaa a la seal analtica. Aunqueexisten otros mtodos ms sencillos como el de la media mvil, en esta tesis se ha
8/6/2019 Ir en La Petroquimica
53/222
Fundamentos tericos
37
utilizado una herramienta basada en un ajuste polinmico mvil, como es el filtrode Savitzki-Golay [16]. Este suavizado consiste en interpolar un polinomio degradon cada serie dem puntos de la seal, de forma que el valor de la respuesta encada punto se reemplaza por una combinacin lineal de los puntos vecinos. Estemtodo, al requerir el uso de 2m+1 valores para el clculo de cada valor de la sealcorregida, provoca el truncamiento del espectro en sus extremos, perdiendo 2m+1valores en cada aplicacin. Este problema se resuelve en la generalizacinpresentada por P. A. Gorry [17], que es el mtodo utilizado en el transcurso de estatesis.
long. de onda
s e a l
seal originalseal suavizada
Fig. 16. Suavizado de una seal espectroscpica utilizando una ventana de 21puntos y un polinomio de 3er grado.
2.3.3.3 Correccin de la lnea base
Aparte de fuentes de variabilidad de alta frecuencia, como sera el ruido, laseal medida puede contener fuentes de variabilidad de baja frecuencia, norelacionadas con la propiedad de inters, y que se denominan variaciones de lalnea base. A continuacin se presentan las diferentes herramientas que se hanutilizado en la presente tesis para corregir la variacin de la lnea base.
8/6/2019 Ir en La Petroquimica
54/222
8/6/2019 Ir en La Petroquimica
55/222
Fundamentos tericos
39
la Fig. 18 se muestra un ejemplo esquemtico de una correccin utilizando unpolinomio de 1er grado.
sealcorregida- =
sealmedida
lnea base
y = bo + b1 xseal
corregidaseal
corregida- =sealmedida
lnea base
y = bo + b1 x
lnea base
y = bo + b1 x
Fig. 18. Esquema del proceso de correccin de la lnea base utilizando un modeloexplcito lineal (detrendig ).
Derivadas
El uso de derivadas [20] consigue diferenciar mejor picos solapados y eliminadesplazamientos lineales y cuadrticos de la lnea base. La primera derivada seobtiene como la diferencia entre las absorbancias, A, a dos longitudes de onda
consecutivas (1 y 1+):
= +11 A AdA
La derivada reduce la correlacin entre variables y el efecto la dispersindebido al tamao de las partculas. Presenta el inconveniente de magnificar el ruidoen la seal, por lo que habitualmente se utiliza en combinacin con mtodos de
suavizado de la seal, como el del ajuste polinmico mvil, presentado en elapartado 2.3.3.2. Derivadas de orden superior se obtienen aplicando sucesivamentela derivada, aunque no suelen utilizarse superiores a orden 2 (segunda derivada), yaque decrece la relacin seal-ruido (S/N).
8/6/2019 Ir en La Petroquimica
56/222
Captulo 2
40
1150 1200 1250 1300 1350 1400 1450 1500 1550-0.02
0
0.02
long. de onda (nm)
S G - d e r
i v a d a
1150 1200 1250 1300 1350 1400 1450 1500 15500
0.20.4
0.6
A b s o r b a n c i a
1150 1200 1250 1300 1350 1400 1450 1500 1550-0.02
0
0.02
D e r
i v a d a
Fig. 19. Ejemplo de la derivada de un espectro de nafta (arriba), sin utilizar unsuavizado (en medio) y utilizando un suavizado de Savitzki-Golay (abajo).
2.3.3.4 Correccin del ligth scatteingEn la familia de preprocesados que corrigen los efectos multiplicativos (ligth
scatteing ), que se producen en la espectroscopia por reflectancia comoconsecuencia de la variacin en el tamao de partcula, se encuentran dostransformaciones, lastandard normal variate (SNV) [21] y lamultiplicative scatter correction (MSC) [22, 12,23, 24]. La principal diferencia entre ambos mtodos esque el SNV se aplica a cada espectro independientemente, mientras el MSC
requiere que se defina un espectro de referencia. La transformacin SNV estdefinida como:
1)( 2,
,,
= J
r r
r r r
ji ji
i jiSNV ji
8/6/2019 Ir en La Petroquimica
57/222
Fundamentos tericos
41
donde jir , representa la respuesta (absorbancia) de la muestrai a la longitud de
onda j , ir , representa la media de las respuestas de la muestrai, J el nmero totalde longitudes de onda ySNV jir , representa el espectro corregido.
La transformacin MSC se basa en el hecho emprico que, para un conjunto demuestras similares, el valor de la absorbancia est linealmente relacionado con lamedia de los valores espectrales (con la media tomada sobre todas las muestras).Primero se realiza una regresin de la respuesta de cada muestra a la longitud de
onda j , jir , , sobre la respuesta media de todas las muestra a esa longitud de onda,
jr :
ji jii ji er bcr ,, ++= con =i
ji j
I
r r ,
Y la seal transformada final, MSC ji
r ,
, se obtiene como:
i
i ji MSC
b
cr r
ji ,
,
=
Hellandet al. [25] realizan una comparacin de estos dos mtodos y concluyen
que estn ntimamente relacionados, y que los resultados de aplicar una u otracorreccin son muy similares en trminos de habilidad de prediccin.
8/6/2019 Ir en La Petroquimica
58/222
Captulo 2
42
1200 1400 1600 1800 2000 2200 2400-0.2
0
0.2
long. de onda (nm)
S N V + D T
l o g
( 1 / R )
1200 1400 1600 1800 2000 2200 2400-0.1
0
0.1
long. de onda (nm)
M S C + D T l o g
( 1 / R )
Fig. 20. Comparacin de las transformaciones SNV (arriba) y MSC (abajo), en lasmuestras de alcohol polivinlico.
2.3.4 Etapas de la calibracin multivariante
Entre los mtodos quimiomtricos que mayor xito han tenido en lasaplicaciones industriales se encuentra los dirigidos a cuantificar (calibracinmultivariante). Las etapas para llevar a cabo una regresin multivariante a partir dedatos espectroscpicos propuestas por la ASTM en sus prcticas estndar [26] son:
1. Seleccin del conjunto de muestras de calibracin.2. Establecimiento del modelo.3. Validacin del modelo de calibracin.4. Prediccin de muestras desconocidas.5. Monitorizacin y transferencia.
2.3.4.1 Seleccin del conjunto de calibracin
El conjunto de calibracin, tambin denominado conjunto de entrenamientodebe contemplar todas las fuentes de variabilidad del sistema [27], tanto fsicascomo qumicas. Para conseguir este objetivo de una forma rigurosa, se ha
8/6/2019 Ir en La Petroquimica
59/222
Fundamentos tericos
43
propuesto el uso de estrategias de diseo de experimentos [27], aunque lacomplejidad de las muestras reales raramente permite aplicar esta aproximacin.
La situacin ms comn es contar con un amplio conjunto de muestrascandidatas a las que se ha medido el espectro y la propiedad de inters. En estecaso se han propuesto tcnicas de seleccin de muestras basadas en el anlisis deagrupaciones (cluster analysis ) [28], o algoritmos de seleccin de muestras como elde Kenard-Stone [29], para decidir qu espectros NIR representan mejor lapoblacin total.
La presencia de agrupaciones destacadas en el conjunto de calibracin puedeconducir a errores, por lo que es importante analizar los datos y si se detecta unaagrupacin severa se debe evaluar si es ms adecuado construir un modelo globalpara todas las muestras, o bien es necesario dividir en grupos las muestras y crearmodelos diferentes para cada grupo. La deteccin de agrupaciones se puederealizar mediante una simple inspeccin visual de losscores PCA. Tambin se hanpropuesto criterios grficos para detectar agrupaciones, como las curvas dedistancias (distance curves ) [30] o criterios numricos, como el estadstico deHopkins, H , [31, 32], que se aplica a losscores de la descomposicin PCA y sebasa en la comparacin de la distancia euclidiana entre un objeto y su vecino msprximo (W ) y la distancia entre un objeto artificial, distribuido aleatoriamente enel espacio, y el objeto real ms prximo (U ). La eleccin del objeto real y artificialse realiza varias veces (iteraciones) para un porcentaje de la poblacin total deobjetos.
==
=
+= N
ee
N
ee
N
ee
W U
U H
11
1
8/6/2019 Ir en La Petroquimica
60/222
Captulo 2
44
El valor de H oscila entre 0.5 para un conjunto de objetos distribuidoshomogneamente (las distancias U y W son muy parecidas) hasta 1 para un
conjunto con agrupaciones muy marcadas (U>>W).
-1 -0.5 0 0.5 1-1
-0.5
0
0.5
1H=0.50 (0.45-0.55)
-1 -0.5 0 0.5 1-1
-0.5
0
0.5
1H=0.91 (0.89-0.92)
Fig. 21.Estadstico de Hopkins en el caso de un conjunto de muestras homogneo(H=50) y en el caso de un conjunto de muestras agrupadas H prximo a 1.
2.3.4.2 Establecimiento del modelo
En los modelos multivariantes inversos, la concentracin (o cualquier otrapropiedad de la muestra) se modela en funcin de la respuesta (en este caso elespectro IR) de la forma:
k
J
jk j jk ebr c +=
=1,
donde k c es la concentracin del analitok en la muestra, jr es la respuesta de la
muestra en la variable j , k jb , es el coeficiente que relaciona la variable j con laconcentracin del analitok y k e es el trmino del error no modelado por el
modelo. Utilizando una notacin matricial, en la etapa de calibracin con I muestras, este modelo se puede escribir como:
eRbc +=
8/6/2019 Ir en La Petroquimica
61/222
Fundamentos tericos
45
= +c R
I I
1 J
b
J
1
e
I
1
dondec es el vector de las concentraciones del analito para las I muestras decalibracin,R es la matriz de las respuestas de las I muestras en las J variables,b
el vector de los coeficientes de regresin ye el vector de los errores o residuales.
El vector de coeficientes de regresin se obtiene en la etapa de calibracincomo:
cRb +=
dondeR+ es la matriz pseudoinversa deR. La forma en la que se calcula estamatriz pseudoinversa difiere segn el mtodo de calibracin utilizado. Por ejemplo,en el caso de la calibracin multivariante inversa (ILS),R+ se obtiene por la
solucin de mnimos cuadrados clsicos, T1T RR)(RR + = .
Los mtodos de descomposicin sobre factores o componentes principales,como la regresin por mnimos cuadrados parciales (Partial Least Squares , PLS),
solucionan el problema de la colienealidad en los datos (muy habitual en datosespectroscpicos) ya que descomponen la matriz de respuestas,R, en una serie defactores ortogonales entre s, lo que evita los problemas de la inversin de la matrizRTR.
8/6/2019 Ir en La Petroquimica
62/222
Captulo 2
46
A continuacin se presenta muy brevemente el algoritmo de obtencin delmodelo PLS, la forma en que se selecciona el nmero ptimo de factores as como
las herramientas para detectar observaciones anmalas (deteccin deoutliers ).
Regresin por mnimos cuadrados parciales (PLS)
La regresin por mnimos cuadrados parciales realiza una descomposicin enfactores, como el anlisis de componentes principales (PCA), pero utiliza lainformacin de la concentracin en la descomposicin de la matriz de respuestas,R. El primer factor describe la direccin de mxima varianza enR, que al mismo
tiempo se correlaciona con la concentracin.
El procedimiento para realizar la descomposicin de la matriz de las respuestas,consta de los pasos siguientes:
1) Calcular los,loadings y scores ,:
cRcR
p TT
1h
h
h =+
1
11
+
++ =
hh
hhh pR
pRt
donde representa la norma del vector.
2) Calcular la matriz residualRh+1 segn:
)()( T 11T 111 +++++ = hh J hhh I h ppIRttIR
dondeI es la matriz identidad de dimensin I .
8/6/2019 Ir en La Petroquimica
63/222
Fundamentos tericos
47
Estos dos pasos iniciales se calculan desdeh = 0 hasta el nmero decomponentes principales que se quiere calcular. Para el casoh = 0 , R0 es la matrizde datos original.
Los vectorest y p calculados para cada valor deh forman, respectivamente, lascolumnas de las matrices ortonormalesT y P, que se utilizan a continuacin parainvertir la matrizR.
3) Calcula una nueva matriz,Q, de la forma siguiente:
Q = TT R P
a la que se le aplica la descomposicin en valores singulares (SVD) [33], demanera que:
Q = U VT
ComoT y P son ortonormales se cumple tambin que:
R = T Q PT
Por tanto, la matriz originalR se puede reconstruir como:
R = TUT VPT
y la pseudoinversa se obtiene a partir de la ecuacin siguiente:
R+ = PV -1 (TU)T
8/6/2019 Ir en La Petroquimica
64/222
Captulo 2
48
Factores a incluir en el modelo
Se debe decidir el nmero de factores o componentes principales que ser
utilizado en el modelo final, o lo que es lo mismo, determinar el tamao ptimo delmodelo. Esta eleccin se basa en el clculo de un error de prediccin medio paramodelos que incluyen cada vez ms factores (1, 2 ... A) y en el estudio de laevolucin de este error de prediccin medio. Si se dispone de un conjuntoindependiente de muestras, no utilizado en la calibracin, se puede calcular la razcuadrada del error medio de prediccin ( Root-Mean-Square Error of Prediction ,RMSEP), para el conjunto de I P muestras que no han participado en la calibracin:
P
1
2)(
I
cc RMSEP
I
iii
=
=
donde ic y ic representan la concentracin determinada de forma independiente y
la concentracin predicha por el modelo respectivamente. Si no se dispone de unconjunto independiente de muestras se puede utilizar el mtodo de la validacincruzada ocross-validation [34, 35], en la que sucesivamente se va dejando unaparte de las muestras fuera del conjunto de calibracin, se realiza el modelo con lasmuestras restantes y se predicen las muestras descartadas.
Este proceso permite obtener predicciones independientes sin renunciar al usode toda la informacin (muestras) disponible en el conjunto de calibracin. En estecaso se obtiene un error de prediccin similar al RMSEP, que se denomina razcuadrada del error medio de validacin cruzada (o Root-Mean-Square Error of Cross-validation , RMSECV) :
8/6/2019 Ir en La Petroquimica
65/222
Fundamentos tericos
49
I
cc
RMSECV
I
iii
=
=1
2)(
Existen en la literatura diferentes criterios para la seleccin del nmero ptimode factores en los modelos de calibracin. Un primer criterio muy simple consisteen representar el RMSEP (o el RMSECV) frente al nmero de factores del modeloy tomar como ptimo el primer mnimo local o el mnimo absoluto. Este es un
criterio que puede conducir fcilmente a sobreajustes y subajustes, por lo que no esrecomendable usarlo. Existen otros criterios de seleccin ms formales [36]basados en comparacionesF [37, 38] que proporcionan una base ms fiable para laseleccin del nmero de factores a incluir en el modelo.
Deteccin de outliers
Una de las ventajas de los mtodos multivariantes sobre los tradicionales
univariantes, es la capacidad que tienen de detectar la observacin u observacionesinconsistentes con el resto de los datos [39]. En la etapa de establecimiento delmodelo se puede utilizar informacin de la influencia de los objetos en el conjuntode calibracin (leverage ) y de los residuales, tanto en la propiedad de inters comoen la respuesta instrumental [12]. La deteccin de losoutlier en esta etapa esimportante porque la inclusin de estas muestras discrepantes en el modelo degradasu capacidad predictiva.
Leverage . Es una medida de la posicin (o influencia) de una muestra en relacinal modelo. Muestras con un elevado valor deleverage estn muy alejadas delcentro del modelo, por lo que tendrn una influencia muy alta sobre el mismo. Estevalor se calcula como:
iii I
h tTTt 1TT )(1 +=
8/6/2019 Ir en La Petroquimica
66/222
Captulo 2
50
dondeti representa el vector descores de la muestrai, T, la matriz descores delmodelo y I el nmero de muestras de calibracin. Se proponen diferentes niveles
umbral, los ms aceptados son dos o tres veces elleverage medio de calibracin,que es igual a 1+ A / I [12], siendo A el nmero de componentes principales ofactores utilizados en el modelo.
Residuales en la respuesta instrumental. Los residuales en la respuesta (oresiduales espectrales) reflejan la falta de ajuste entre las respuestas experimentalesutilizadas en la calibracin,R, y las respuestas reconstruidas por el modelo con A
factores (T
TPR = ).
TTPRE =
long. onda
a b s o r b a n c i a
espectro real
long. onda
a b s o r b a n
c i a
reconstruido con 4 factores
-4
0
4
8x 10 3
long. onda
a b s o r b a n c i a
residuales espectrales
Fig. 22.Ejemplo del clculo del residual de un espectro NIR. Al espectro original se leresta el espectro reconstruido con 4 factores para obtener el residual espectral.
Los residuales en la respuesta se pueden utilizar de diferentes formas. La ms
habitual es, para el error en la respuesta de la muestrai, ei, realizar una suma decuadrados extendida a las J longitudes de onda y dividir por los grados de libertad
(df) adecuados, para obtener una desviacin estndar de la muestrai, 2)( is e .
8/6/2019 Ir en La Petroquimica
67/222
Fundamentos tericos
51
I
e
s
J
j ji
i / df
)(1
2
2
=
=e con df = I J J A (max ( I , J ))
Tambin se utilizan los residuales en la respuesta para realizar distintos testF ,que comparan la suma de cuadrados de los residuales para el conjunto decalibracin y para la muestrai [37,14]
Residuales en la concentracin. En la etapa de establecimiento del modelo sedispone del valor de la concentracin (o la propiedad de inters) determinado por elmtodo de referencia. Los residuales en la concentracin comparan el valorpredicho por el modelo multivariantec con el valor considerado verdadero,c, queproporciona el mtodo de referencia.
ccf =
Muchas veces la deteccin deoutliers se realiza combinando estasherramientas, como en el grfico que se representa el residual (espectral o deconcentraciones) frente alleverage de las muestras [40, pag. 114].
8/6/2019 Ir en La Petroquimica
68/222
Captulo 2
52
0 0.25 0.5 0.75 10
0.25
0.5
0.75
1
leverage
v a r . r e s i
d u a l
c
ba
Fig. 23. Grfico del residual frente alleverage . (a) Objetos con una varianza residualelevada se consideranoutliers , (b) si adems tienen unleverage alto son outliers peligrosos para el modelo, debido a que tienen mucha influiencia sobre l. Las muestrascon unleverage alto (c) son muestras influyentes y no necesariamenteoutliers .
2.3.4.3 Validacin del modelo
Los mtodos de calibracin sesgados, como PCR o PLS, no se apoyandirectamente en un modelo terico y pueden incorporar variabilidad de los datos nonecesariamente relacionada con la propiedad de inters, por lo que deben sercuantitativa o cualitativamente validados.
La validacin consiste en el anlisis de un grupo de muestras independiente alutilizado en la calibracin y comprueba que no existe un error sistemtico (bias )entre las predicciones que realiza el modelo y los valores proporcionados por elmtodo de referencia. Tambin se mide el grado de concordancia entre laspredicciones del modelo y los valores del mtodo de referencia.
8/6/2019 Ir en La Petroquimica
69/222
Fundamentos tericos
53
Test de la ausencia de sesgo
La presencia de error sistemtico se comprueba mediante una regresin linealentre las concentraciones (u otra propiedad) reales, medidas por la tcnica dereferencia y las concentraciones predichas por el modelo multivariante. Si no existeerror sistemtico el resultado de esta regresin debera ser una recta de pendiente(b1) igual a 1 y ordenada en el origen (bo) igual a 0. Debido a la existencia de loserrores aleatorios se obtendrn valores deb1 y b0 ligeramente diferentes a losesperados. El test conjunto de la pendiente y la ordenada en el origen [41]comprueba si hay diferencia significativa entre los valores deb1 y b0 encontrados ylos valores esperados (1 y 0). Como tanto la concentracin determinada por elmtodo de referencia como la determinada por el modelo de calibracin est sujetaa un cierto error se puede modificar el test conjunto para que tenga en cuenta lapresencia de errores en ambos ejes [42].
0 5 10 150
5
10
15
conc. real
c o n c . p
r e d i c h a
y = 1.02 x -0.33
-1.5 -1 -0.5 0 0.5 10.9
0.95
1
1.05
1.1
1.15
ordenada en el origen
p e n d
i e n t e
(0.0,1.0)
(-0.33,1.02)
Fig. 24.Test conjunto de la pendiente y ordenada en el origen.
Concordancia con el mtodo de referencia
En la prctica, esta comparacin se realiza a travs de un error medio deprediccin, como el RMSEP. En caso de no disponer de un conjunto independientede muestras se puede utilizar el error obtenido por validacin cruzada, RMSECV.El valor de RMSEP o el RMSECV proporciona una estimacin de la exactitud
8/6/2019 Ir en La Petroquimica
70/222
Captulo 2
54
(accuracy ) del modelo. Tanto el RMSEP como el RMSECV proporcionan unaestimacin del error que se comete al predecir muestras futuras [43].
Error de prediccin individual o especfico
Aunque en la mayora de aplicaciones se utiliza un nico valor de error(RMSEP o RMSECV) para representar la habilidad predictiva global del modelo,en la prctica, es interesante poder proporcionar una estimacin del error especficode cada determinacin, tal como se hace en la calibracin nivariante con losintervalos de prediccin. Se han propuesto diferentes aproximaciones para el
clculo de este error especfico, como la utilizada en el programa Unscrambler [40,pag. 436, 44], que fue corregida por De Vries y col. [45] o la propuesta por Faber[46]:
( ) 2222222 1 uuu A Auc h I RRc bb ++++
+=
donde I es el nmero de muestras de calibracin,uh el leverage de la muestradesconocida. La varianza del anlisis de referencia (2c ), la varianza de la
respuesta en calibracin (2R ) y para la nueva muestra (2
uR ) se pueden calcular
a partir de repeticiones; Ab es la norma euclidiana del vector de regresin para el
modelo PCR o PLS de A factores; 2 y2u
representan la varianza de la parte no
modelada dec (los residuales del modelo) para la calibracin y la prediccin denuevos objetos respectivamente, y que pueden ser determinados a partir del error alcuadrado medio de calibracin (MSEC):
2222MSEC Rc b ++= A
8/6/2019 Ir en La Petroquimica
71/222
Fundamentos tericos
55
con
1)(MSEC 1
2
==
A I
cc
I
iii
Faber y col. [47] utilizan esta expresin en una aplicacin prctica para ladeterminacin de compuestos oxigenados en gasolina. Algunos autores hancriticado esta expresin, planteando problemas como la falta de trminos
especficos de la muestra (slo el leverage,uh , lo es) [44], o que no tiene en cuenta
el sesgo [48]. Estas crticas han sido rebatidas por Faber [49].
2.3.4.4 Prediccin de muestras desconocidas
Una vez el modelo ha sido aceptado, ya puede ser utilizado para el anlisis denuevas muestras. En esta etapa se deben seguir utilizando los test para detectarmuestras discrepantes,outliers , con el fin de detectar la presencia deextrapolaciones al modelo, presencia de nuevos interferentes, fallos instrumentales,etc. En este caso se pueden utilizar medidas delleverage de las muestras, y delresidual espectral. Herramientas para el control estadstico multivariante, como elestadsticoT 2 de Hotelling y el estadsticoQ, que sern introducidas a continuacinpara su uso en el control estadstico del modelo multivariante, se pueden utilizartambin para la deteccin deoutliers , ya que proporcionan una informacin similaral leverage (el T 2) y al residual espectral (el estadsticoQ). Los residuales de laconcentracin (u otra propiedad de inters) no estn disponibles ya que estasmuestras no han sido analizadas por el mtodo de referencia. La deteccin de losoutliers en esta etapa es muy importante porque la prediccin de estas muestraspuede diferir significativamente del valor verdadero.
2.3.4.5 Monitorizacin y transferencia
Control de la estabilidad con el tiempo
Para que este mtodo proporcione resultados vlidos no es suficiente con
8/6/2019 Ir en La Petroquimica
72/222
Captulo 2
56
asegurar la exactitud del modelo en el momento de su desarrollo, sino que esnecesario controlar su estabilidad con el tiempo. Para llevar a cabo este control,
una posible estrategia es realizar peridicamente comparaciones entre laspredicciones del modelo y los valores de referencia determinados por la tcnica dereferencia.
Se pueden utilizar otras estrategias, que no requieren utilizar el mtodo dereferencia, si se dispone de una muestra estable. En ese caso se puede analizarperidicamente una muestra de control [50] y utilizar herramientas de control
estadstico de procesos (statistical process control , SPC) [51] en el caso demedidas univariantes o de control estadstico de procesos multivariantes(multivariate statistical process control , MSPC) [52] en el caso de mltiplesmedidas.
La base de cualquier grfico de control es la representacin del valor medido(directamente o despus de algn tipo de transformacin) respecto al tiempo. La
decisin de si el sistema est bajo control estadstico o no, se realiza con la ayudade unos lmites de control, representados tambin en el grfico.
SPC. Grficos de control de Shewhart
Un grfico de control muy sencillo para respuestas univariantes es el grfico Xde control de Shewhart [53]. En este grfico se representan las observaciones ( xi)en el orden que se obtienen, el valor verdadero () o el x en una lnea central, y
los lmites de control y aviso se sitan en3 y 2 respectivamente, donde representa la desviacin estndar de la poblacin . Este grfico puede ser utilizado,por ejemplo, para monitorizar la prediccin de una muestra de control por elmodelo multivariante.
8/6/2019 Ir en La Petroquimica
73/222
Fundamentos tericos
57
MSPC. Estadsticos T 2 y Q
Los grficos de control univariantes no aprovechan la potencialidad de lainstrumentacin analtica ya que no sirven para monitorizar al mismo tiempomltiples respuestas. Los grficos de control multivariante proporcionaninformacin adicional y son capaces de detectar situaciones de fuera de controldonde los grficos univariantes no pueden hacerlo. Esta metodologa dispone lasrespuestas multivariante de los sucesivos anlisis de la muestra en forma de matriz(X), cada fila representa una muestra y las columnas son las variables. Esta matrizse descompone mediante un anlisis de componentes principales (PCA). A partirde las matrices de losscores y losloadings se calculan diferentes estadsticos paracada muestra.
Estadstico T 2 de Hotelling . Fue propuesto originariamente por Hotelling [54] ymide la variacin de cada muestra dentro del modelo PCA. Se calcula como lasuma de los cuadrados de losscores segn la ecuacin siguiente:
TT-1ik k i
2iT xPPx =
dondexi es el vector de respuestas para la muestrai,Pk es la matriz deloadings y es una matriz diagonal que contiene los valores propios asociados a los vectorespropios incluidos en el modelo PCA. El lmite de control del grficoT 2 se calculasegn:
( )T
k m
m k F k m k m k , , , , 2 1
=
dondem es el nmero de anlisis de la muestra de control que se han utilizado paraconstruir el modelo PCA,k el nmero de componentes principales o factoresincluidos en el modelo PCA yF k,m-k, el valor de la distribucinF para k y m-k gados de libertad y una probabilidad de cometer un error de tipo I.
8/6/2019 Ir en La Petroquimica
74/222
Captulo 2
58
El grficoT 2 monitoriza la distancia de una nueva medida al valor de referenciaen el espacio reducido de los factores PCA. Permite detectar si la variacin incluidaen los componentes principales considerados es ms grande que la que lecorrespondera si solo influyeran variaciones aleatorias. La interpretacin de estegrfico es la misma que cualquier grfico univariante; las muestras fuera de controlposeen un valor deT 2superior al lmite, y aparecen ms all de la lnea de control.
Estadstico Q . Mide la falta de ajuste de la nueva muestra al modelo PCAdesarrollado. Se calcula mediante la ecuacin siguiente [55]:
TTT )( ik k iiiiQ xPPIxee ==
donde ie es la filai de la matriz de los residuales (E), I es la matriz identidad,Pk lamatriz de losk vectores deloadings incluidos en el modelo PCA yxi es el vectorfila de la respuesta de la muestrai.
El lmite de control del grficoQ [56] se calcula segn:
( )Q
c h h h h
= + +
1
2 02
1
2 0 0
12
1
21
1 0
donde
3,2,1para1
== +=
in
k j
i ji
y
22
310 3
21=h
8/6/2019 Ir en La Petroquimica
75/222
Fundamentos tericos
59
k es el nmero de componentes principales retenidos en el modelo, j el valorpropio asociado al componente principal j , n el nmero total de componentesprincipales yc la desviacin estndar normal correspondiente a un error de tipo I() fijado. El valor deQ indica el grado de ajuste de cada muestra al modelo PCAy da una medida de la variacin de la muestra no incluida en el modelo.
Algoritmo de identificacin de sensores por eliminacin en sentido inverso
(BESI). Una desventaja de la monitorizacin multivariante frente a la univariante esla dificultad que existe para determinar, en caso de una muestra fuera de control,que respuestas han sido las responsables de este comportamiento. Una posiblesolucin es el estudio de grficos de contribucin [57] o del vector de residuales. Elmtodo BESI, publicado por Stork y col. [58], es un algoritmo que detecta lasvariables con respuesta anmala que provocan el fuera de control en la variacinno explicada por el modelo. Este mtodo calcula una relacin entre valores deQ eliminando las variables sospechosas y el valorQ del lmite de control. Lasvariables sospechosas son eliminadas secuencialmente hasta que la muestra vuelvea estar bajo control estadstico.
Mantenimiento de los modelos multivariantes
El desarrollo de modelos de calibracin multivariantes supone un esfuerzoexperimental muy grande, ya que se requiere un elevado nmero de muestrasrepresentativas que deben ser analizadas por el mtodo instrumental y por el dereferencia. Por este motivo el periodo de validez y la sensibilidad a los cambios enlas condiciones experimentales de un modelo son parme