+ All Categories
Home > Documents > Curso Geodatabase ArcGis93 Indice

Curso Geodatabase ArcGis93 Indice

Date post: 07-Apr-2018
Category:
Upload: mavering5g
View: 223 times
Download: 0 times
Share this document with a friend

of 49

Transcript
  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    1/49

    NORMAS Y ESTNDARES PARADATOS GEOESPACIALES

    JORGE FALLAS

    Laboratorio de Teledeteccin y Sistemas de Informacin GeogrficaPrograma Regional en Manejo de Vida Silvestre y Escuela de Ciencias ambientales

    Universidad Nacional, Heredia, Costa [email protected] www.una.ac.cr/ambi/telesig

    2002

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    2/49

    2INDICE

    Introduccin............................................................................................................................1Normas y estndares: Porqu? y Para qu? ..........................................................................2Qu entendemos por calidad? ................................................................................................2

    Estndares: Criterios y procedimientos utilizados para certificar la calidad de los datos ..........2Qu se debe evaluar y documentar?.......................................................................................3Exactitud geomtrica horizontal y vertical...............................................................................3

    Probabilidad de error circular (CEP)....................................................................................4Error horizontal en X y Y ....................................................................................................5Error radial..........................................................................................................................6

    Cmo obtener el valor de referencia?.....................................................................................8Limitaciones operacionales del estndar y soluciones prcticas ...........................................8

    Estndar planimtrico basado en el procedimiento utilizado para compilar el producto ...........8Estndares de cartografa analgica de los Estados Unidos de Amrica...................................8

    Mapas con escalas mayores a 1:20.000................................................................................9Mapas con escalas inferiores a 1:20.000..............................................................................9

    Exactitud vertical..................................................................................................................11Estndares propuestos por el Comit Federal de Datos Geogrficos de los Estados Unidos deAmrica ................................................................................................................................11

    Caso 1: Error en ambos ejes es igual (error radial).............................................................12Caso 2: Error en ambos ejes es diferente (Aproximacin del error estndar circular) .........12

    Exactitud vertical..................................................................................................................13Comunicar la exactitud del producto .....................................................................................13Ejemplo ................................................................................................................................14Verificacin independiente del error del mapa georeferenciado............................................. 15Veracidad en la clasificacin de los atributos ........................................................................19El estimador Kappa (K): Cuantificacin de la exactitud de clasificaciones multivariadas ...... 22Estimacin del tamao de muestra ........................................................................................23Factores a considerar en la evaluacin de la exactitud de la clasificacin...............................26

    Muestreo de campo ............................................................................................................26Sistema de clasificacin .....................................................................................................26Auto correlacin espacial de los errores..............................................................................27Tamao de la muestra ........................................................................................................27Esquema de muestreo.........................................................................................................28

    Diseos de muestreo con ArcView GIS.................................................................................32Muestreo aleatorio.............................................................................................................32Muestreo sistemtico.........................................................................................................38Muestreo en transeptos......................................................................................................39

    Consistencia lgica ...............................................................................................................41Totalidad de informacin ......................................................................................................41Reporte de los resultados.......................................................................................................41Errores, estndares y calidad de la informacin : Que hacer?............................................... 42Documentacin de los geodatos ............................................................................................42Bibliografa...........................................................................................................................43

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    3/49

    1Introduccin

    Los Sistemas de Informacin Geogrfica pueden traer grandes beneficios a sus usuarios porsu capacidad de manipular informacin georeferenciada en una forma precisa, rpida ysofisticada. Sin embargo, hasta el momento la mayara de los datos que han ingresado a las basesde datos de los SIGs provienen de mapas analgicos (papel). En ausencia de informacin

    actualizada y de mayor calidad, la tecnologa SIG puede estar promoviendo el uso de dichosdatos en aplicaciones que obtenidos y mapeados con dichos requerimientos en mente. Al igualque cualquier otro dato, la informacin espacial tiene diferentes niveles de exactituddependiendo del instrumento utilizado para obtenerla. Por ejemplo, el sensor ETM+ de Lansat(www.landsat7.usgs.gov) tiene una resolucin de 15m en su modo pancromtico, en tanto que elSpot5 en el mismo modo tiene una resolucin de 5 metros (www.spot.com) y el satliteQuickBird posee una resolucin de 70cm (www.digitalglobe.com). De igual manera laresolucin espacial de un mapa depender de la tecnologa utilizada para producirlo. Porejemplo, en la mayora de los casos es imposible dibujar una lnea inferior a 0,2mm de grosor yprevenir la deformacin del papel debido a cambios en la humedad relativa del ambiente. Sinembargo, en el dominio digital, estas limitaciones pueden desaparecer al utilizar dgitos con 6 oms cifras significativas, aun cuando la informacin original no justifique dicha exactitud. Lasbases de datos geoespaciales en formato digital no tienen una escala explcita y en la mayora delos casos no se informa a los usuarios de su exactitud.

    Los errores e inconsistencias de los mapas fuente no eran evidentes antes de que utilizramoscomputadoras para procesar, analizar y tomar decisiones basados en dicha informacin. Sinembargo, ahora el procesamiento digital a travs de los SIGs ha puesto al descubierto lasdebilidades de nuestros datos y la necesidad de utilizar normas y estndares para documentartanto su calidad como la de los productos que obtenemos a partir de ellos.

    Entre los usuarios de informacin espacial los trminos exactitud, precisin, resolucin,deteccin y escala son utilizados prcticamente en forma intercambiable y normalmente hacenreferencia a la calidad o contenido de informacin de los datos. An cuando los trminos estnasociados entre s, no son intercambiables pues se refieren a diferentes propiedades ocaractersticas de los datos.

    La exactitud o fidelidad expresa la diferencia entre el valor de la realidad y la medicinrealizada. La precisin expresa el grado de detalle utilizado para realizar la medicin o el gradode repetibilidad entre mediciones sucesivas. La resolucin se refiere al objeto ms pequeo quese puede representar en los datos. La deteccin expresa la capacidad del usuario(a) paradistinguir dos objetos en un producto analgico o digital; con frecuencia se asume como dosveces el valor de la resolucin (Fisher, 1991). Finalmente la escala representa la relacin entre eltamao de los objetos en el mundo real y su tamao en un mapa analgico. La resolucin y laescala estn ntimamente relacionadas pues el objeto o elemento ms pequeo que se puederepresentar estar determinado por la escala a la cual se representa. Por ejemplo, si asumimosque no es posible representar un elemento con un tamao inferior a 0.5mm a la escala del mapa,entonces esto implica que la resolucin efectiva de una mapa a escala 1:10.000 es de 10m y queel rea mnima que puede dibujarse es de 10*10 m o sea 10m2.

    Como se mencion anteriormente las geobases de datos digitales no tienen una escalaexplcita y por tanto tiende a pensarse que pueden imprimirse o utilizarse para generar

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    4/49

    2informacin a cualquier escala. Sin embargo, el usuario(a) debe recordar que la misma fuecreada utilizando informacin en papel digital y por lo tanto tendr la escala y resolucininherente de los datos originales. Por ejemplo, si la base de datos se elabor digitando mapas1:200.000 su escala de automatizacin ser 1:200.000; si por el contrario se deriv del anlisis deimgenes TM su resolucin ser 30metros.

    El objetivo de todo documento analgico digital es representar la realidad tan fielmentecomo sea posible. En este sentido el concepto de exactitud puede utilizarse para evaluar lacalidad de la informacin contenida en un mapa analgico o digital. Dado que en el pas noexisten normas al respecto, en el presente documento se analizan los criterios propuestos por elGrupo de Trabajo en Estndares para Datos Cartogrficos Digitales del Comit Nacional de losEstados Unidos (DCDSTF,1988) y se propone adoptarlos como criterios tcnicos en laelaboracin de bases de datos georeferenciadas. De acuerdo a estos principios el estndar onorma debe documentar cuatro aspectos: exactitud geomtrica, veracidad en la clasificacin,consistencia lgica y totalidad de la informacin.

    Normas y estndares: Porqu? y Para qu?Las normas y estndares son importantes por las siguientes razones:

    Ofrecen confiabilidad en los datos generados y utilizados.Facilitan el intercambio de informacin.Aumentan el potencial de comercializar las bases de datos digitales.Evitan la duplicidad y aumentan la eficiencia en la comunidad de usuarios del SIG en el

    pas.Mejoran la calidad de los productos generados utilizando el SIG.Permiten editar y mantener la calidad de las bases de datos en el futuro.

    Qu entendemos por calidad?La palabra calidad es un trmino de uso comn tanto en el lenguaje coloquial como en eltcnico; en el presente documento se define como:

    La calidad de un producto es aquella requerida por el usuario para un determinado uso.

    En un SIG esta definicin puede operacionalizarse a travs del concepto de exactitud ofidelidad; el cual expresa el grado de similitud o disimilitud del producto (mapa analgico odigital) con respecto al mundo real que representa. En estadstica esto es igual al valor realmenos el valor estimado y se conoce como error.

    Estndares: Criterios y procedimientos utilizados para certificar la calidad de los datosEl uso de normas y estndares en un SIG es necesario porque como puede observarse en elcuadro 1, no es posible generar informacin sin errores y por lo tanto se requiere de una escala yun procedimiento para valorar dicho grado de error. Esto nos llevar a evitar errores del pasadotales como por ejemplo asegurar que una base de datos est plagada de errores y por tanto "nosirve.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    5/49

    3Cuadro 1: Errores comunes en el uso de un Sistema de Informacin Geogrfico.

    Etapa del proceso Fuentes de errorAdquisicin de informacin Errores de campo, errores existentes en los mapas fuente, errores

    en el anlisis de imgenes derivadas de sensores remotos.

    Insumo de los datos Errores de digitalizacin (error de mquina y error humano).

    Errores de generalizacin en los elementos a digitar (Ej. lmitesque aparecen como exactos en el mapa pero que en la realidadson difusos).

    Almacenamiento de losdatos

    Precisin numrica inapropiada para los datos en uso. Ej. utilizarprecisin simple (7 cifras significativas) Versus doble precisincon 16 cifras significativas.

    Resolucin espacial no apropiada para representar la

    variabilidad de la superficie en estudio.Manipulacin de lainformacin

    Propagacin de errores al combinar dos o ms mapas.

    Errores en la delimitacin de los bordes de los polgonos.

    Uso inadecuado de las escalas de medicin.Generacin de productos Seleccin de escalas inapropiadas para imprimir mapas.

    Errores asociados al medio utilizado para imprimir los mapas.

    Errores asociados al equipo utilizado para imprimir mapas.

    Aplicacin de resultados Interpretaciones incorrectas de los datos.

    Uso inadecuado de los resultados por desconocimiento o falta deformacin de los usuarios.

    Qu se debe evaluar y documentar?A continuacin se listan los aspectos que se sugiere documentar en toda base de datos Federal

    (Geographic Data Committee, 1998a):Exactitud geomtricaVeracidad en la clasificacinConsistencia lgica de la base de datos, y

    Totalidad de la informacin

    Exactitud geomtrica horizontal y verticalEl proceso de automatizacin utilizado para convertir datos analgicos a digitales debe

    asegurar la integridad de los datos originales o sea que en su paso del formato analgico aldigital no se introducen distorsiones significativas con respecto a la calidad del material original.Tambin es importante asegurar que los clculos u operaciones realizadas utilizando dichos datos

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    6/49

    4no introducen errores mayores a los de los datos originales como consecuencia de la falta deprecisin de la computadora.

    Bajo las condiciones normales de trabajo de cualquier laboratorio de SIG moderno, el equipode computo y los perifricos utilizados cumplen con las condiciones estipuladas en el prrafo

    anterior. Por ejemplo, la resolucin tpica de cualquier mapa (0,5mm) es aproximadamente laresolucin con que un digitador puede ubicar un punto en la mesa digitadora. La mesa en smisma tiene resoluciones en el orden de 0,25mm y por lo tanto nos asegura que no introducenuevos errores. Por otra parte, los clculos son ejecutados utilizando 7 u 8 decimales (precisinsimple) 15 decimales (precisin doble) y por lo tanto es posible resolver diferencias enposicin (X,Y) ms all de las utilizadas en la cartografa contempornea. Utilizando unaprecisin simple (7 decimales) es posible resolver objetos separados por aproximadamente unmetro uno del otro. Dado que el proceso de conversin de material analgico a digital no imponefuertes limitaciones a la exactitud de las geobases de datos digitales (Chen and Finn, 1994), no sediscutir este tema en ms detalle.

    La exactitud geomtrica relativa o precisin es aquel valor que expresa un sesgo en lamedicin realizada aun cuando los resultados preservan las relaciones espaciales locales. Laexactitud relativa puede expresarse como la desviacin estndar con respecto al promedio delconjunto de puntos evaluados. Esta exactitud relativa no es aceptable para aquellos usuarios querequieren de una exactitud basada en un registro geodsico (Chrisman, 1991).

    Probabilidad de error circular (CEP)Esta medida de precisin se define como el radio de un crculo en el cual se encontrar el 50%

    de los valores (Fig.1). Por ejemplo, un valor de CEP de 25 metros indica que de 100 lecturasrealizadas con un geoposicionador para un mismo punto solo 50 se encontraran en un radioigual o inferior a 25m. Dado que este nivel de certeza en la posicin de un punto es poco tilpara la mayora de los uauarios(as) de geodatos, dicha medida se ha transformado en R95 oCEP95; la cual indica que al menos un 95% de las lecturas realizadas con el receptor estarndentro del radio especificado. Si usted es un usuario(a) de ArcViw GIS puede utilizar laextensin DNR_garmin.avx (www.dnr.state.mn.us).para calcular el CEPs para 50, 90, 95 y 98%de confianza .

    Figura 1: Probabilidad de error circular. El 50% de lasobservaciones se encuentran en el rea indicada por elcrculo.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    7/49

    5

    10m

    10m

    00

    EJe

    Y

    Eje X

    Error en X= 10m

    Error en Y= 10m

    Posicin real

    Posicin estimada

    Error horizontal en X y YEl error horizontal se determina restando los valores obtenidos para X y Y de los

    respectivos valores conocidao (Ej. Obtenidos de un mapa de lecturas de un geoposicionador demayor exactitud) (Fig. 2).

    Figura 2: Estimacin del error horizontal en X y Y.

    El error en posicionamiento es igual a:

    Error X (m): Ex= Xreal - Xestimado con el geoposicionador (1)Error Y (m): Ey = Yreal - Yestimado con el geoposiciondor (2)

    Si usted dispone de n puntos de muestreo puede estimar la raz cuadrada del error mediocuadrtico (REMC) para su set de datos (en los textos en ingls se utilizan la siglas RMS paradesignar a dicho valor). Para esto, simplemente eleve al cuadrado cada error, smelos, obtenga elpromedio y luego extrigale la raz cuadrada. El intervalo de confianza (IC) para el error en Xes igual a:

    IC: t 1-? /2, n-1 * REMCX /(n)0.5 (3)

    en donde 1-? es el nivel de confianza y n-1 los grados de libertad.RCEMCX (Error medio de posicionamiento en X) = [suma (Ex)

    2 / n] 0.5

    El intervalo de confianza para el error en Y es igual a:

    IC: t 1-? /2, n-1 * REMCY /(n)0.5 (4)

    en donde 1-? es el nivel de confianza y n-1 los grados de libertad.REMCY (Error medio de posicionamiento en Y) = [suma (Ey)

    2 / n] 0.5

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    8/49

    6Error radial

    El error radial es el resultado de combinar el error de posicionamiento tanto en la direccinhorizontal (Eje X) como en la vertical (Eje Y). El error en posicionamiento es igual a:

    Error radial (Exy) = [(error en x)2 + (error en y)2 ] 0.5 (5)

    Por ejemplo, un punto con un error de 10m tanto en X como en Y tendr un error radial de14.1m (Fig. 3). El desplazamiento entre los puntos puede medirse utilizando el programaArcView GIS o cualquier otro programa.

    Figura 3 : Estimacin del error radial.

    La medida de error denominada dos veces la raz del error medio cuadrtico de la distancia(2drms) es la que se utiliza con mayor frecuencia en la actualidad e indica que el error enposicionamiento es igual a dos veces la raz del error radial medio cuadrtico. En este caso elerror se define como la distancia entre la posicin real del punto y la posicin estimada elprodcuto. La probabilidad asociada a la estimacin del error depende del grado de elipticidad dela distribucin de los errores. Si se asume que los errores en posicionamiento tienen unadistribucin normal dicho error tendr una probabilidad de 95.4% a 98.2%.

    Si usted dispone de n puntos de muestreo puede estimar la raz del error medio cuadrtico(REMC) para su set de datos. Para esto, simplemente eleve al cuadrado cada error radial, obtengael promedio y luego extrigale la raz cuadrada. El intervalo de confianza para el error radial esigual a:

    REMC= [ suma (Exy)2/ n ] 0.5 (6)en donde: Exy representa el error de posicionamiento radial del punto y n el nmero de puntosmedidos. Asume una distribucin normal bivariables en el set de datos.

    La exactitud geomtrica absoluta del producto depender de la resolucin del mapa o deimagen utilizada para crearlo. Es comn aceptar como resolucin mnima un objeto con unadimensin de 0.5mm (Chrisman, 1991). Esto representa, por ejemplo, para un mapa a escala1:10.000, un objetos cuyo tamao en el terreno es superior o igual a 5m. La figura 4 ilustra la

    10m

    10m

    Error: 14.1m

    00

    EJe

    Y

    Eje X

    Posicinestimada

    PosicinReal

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    9/49

    7seleccin de 4 puntos bien definidos en un ambiente urbano y el cuadro 2 el clculo de la raz delerror medio cuadrtico (REMC).

    REMC x,y: [Sum {(Xi Xi)2 +(Yi Yi)

    2 }/n]0.5 (7)

    Donde Xi y Yi son las posiciones del objeto en el producto y X i y Yi su posicin real en lasuperficie terrestre; n es el nmero de muestras.

    A continuacin se muestra un ejemplo hipottico para ilustrar el clculo de la raz del errormedio cuadrtico.

    Para el clculo se asume que el evaluador puede identificar las esquinas de las cuadrastanto en el producto digital como en la realidad.

    Los datos de referencia deben ser ms exactos que los datos digitales a evaluar.El nmero de puntos utilizados (4) es muy limitado para un caso real, recuerde que se

    recomienda utilizar al menos 20 puntos bien distribuidos en el rea a evaluar.

    Figura 4: Seleccin de puntos bien definidos para evaluar la exactitud geomtrica.Cuadro 2: Clculo de la raz del error medio cuadrtico (REMC) para 5 puntos bien definidos.

    CoordenadasMapa GPS Error (m)

    Punto

    X (m) Y(m) X (m) Y(m) X (m) Y(m) Planimtrico1

    Punto 1 512 490 510 487 2 3 3.60Punto 2 250 350 248 352 2 -2 2.82Punto 3 130 160 133 163 -3 -3 4.24Punto 4 450 290 452 289 -2 1 2.23

    Punto 5 640 160 644 161 -4 -1 4.121 Tambin se le conoce como error radial

    REMC x,y = 3.49 mDesviacin estndar del error planimtrico: (SREMC x,y): 0,86 mPara X el REMC es : [Sum (X - X)2/n]0.5 = 2.72mPara y el REMC es : [Sum (Y - Y)2/n]0.5 = 1.94mError esperado para un nivel de confianza dado = (Valor de tabla Z * S/Raiz (n) + error promedio

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    10/49

    8Para un nivel de confianza del 95% el valor de Z es 1.96 y el error mximo esperado sera de4.96 m. Este clculo asume una distribucin normal bivariada y un tamao de muestra igual osuperior a 30; de lo contrario debe utilizar un tabla t. de Estudiante.

    Cmo obtener el valor de referencia?

    Los estndares propuestos por la Sociedad de Fotogrametra y Sensores Remotos de losEstados Unidos (DCDSTF, 1988) establecen que el error absoluto de aquellas localizacionesutilizadas para evaluar la exactitud de un producto (Ej. mapa) debe ser al menos un tercio de laexactitud esperada del producto a ser evaluado. En la actualidad los Sistemas de PosicionamientoGlobal por Satlite son utilizados frecuentemente para proveer este valor de referencia; tambines posible utilizar; las redes geodsicas del pas (mtodo tradicional).

    Limitaciones operacionales del estndar y soluciones prcticasEl estndar asume que los puntos a evaluar estn bien definidos tanto en el mapa como en el

    terreno (Ej. esquina de una cuadra en un rea urbana). En reas rurales no siempre es posiblecumplir con este requisito. Algunas soluciones a esta limitacin son:

    1. Asumir que el error calculado para los puntos bien definidos aplica a la totalidad delmapa/producto.

    2. El error total ser igual al error mnimo determinado utilizando los puntos bien definidos msel error de aquellos puntos con dificultades de ubicacin tanto en el mapa como en el terreno.

    Estndar planimtrico basado en el procedimiento utilizado para compilar el productoA continuacin se presentan tres criterios utilizados para definir la exactitud planimtrica

    (X,Y) requerida para productos analgicos de diferentes escalas; dada la ausencia de criterios anivel nacional para datos digitales, el autor sugiere utilizar alguno de ellos para documentar laexactitud de las geobases de datos digitales. En los mapas analgicos, el error enposicionamiento horizontal (X,Y) est asociado a la escala del mapa. Por ejemplo, en comnasumir que la marca ms pequea discernible en un mapa impreso es 0.5mm; o sea 25m para unmapa escala 1:50.000 y 12.5m para un mapa escala 1:25.000. El cuadro 3 ilustra la relacin entreresolucin y deteccin para mapas con escalas entre 1:10.000 y 1:200.000 asumiendo que serequiere de un par de lneas para detectar un elemento en el mapa (Fisher, 1991).

    Cuadro 3: Resolucin y deteccin de elementos en mapas a diferentes escalas asumiendo unalnea con un ancho mnimo de 0.5mm.

    Escala mapa Resolucin (m) Deteccin (m)1:10 000 5 101:25 000 12.5 251:50 000 25 501:200 000 100 200

    Estndares de cartografa analgica de los Estados Unidos de AmricaEstos estndares fueron emitidos por la Oficina de Presupuesto de los Estados Unidos de

    Amrica en 1947 y son todava utilizados en dicho pas (Bureau of the Budget, 1947). El

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    11/49

    9estndar considera dos casos; el primero para cartografa con una escala mayor a 1:20.000 y elsegundo para cartografa con una escala inferior a 1:20.000.

    Mapas con escalas mayores a 1:20.000Para aquellos mapas con una escala mayor a 1:20.000 (Ej. 1:10.000) no ms de un 10% de los

    puntos evaluados deben exceder un error horizontal de 0,846mm a escala del mapa. Los puntosque se seleccionen para la evaluacin deben estar claramente definidos tanto en el mapa como enel terreno (Ej. esquina de una cuadra). Si aplicramos este estndar a los mapas 1:10.000 deCosta Rica, de 100 puntos seleccionados slo 10 podran tener un error horizontal superior a los8.46 metros.

    Mapas con escalas inferiores a 1:20.000Para mapas con una escala inferior a 1:20.000 (Ej. 1:50.000) un mximo de 10% de los puntos

    evaluados pueden tener un error superior a 0,508mm a escala del mapa (Fig.5). Para la serie1:50.000 de Costa Rica esto equivale a 25.4m y para la serie 1:200.000, 101.6m.

    Figura 5: Representacin grfica del estndar propuesto en Estados Unidos en 1947 (Bureau ofthe Budget, 1947).

    A continuacin se ilustra el uso del estndar con dos grficos. En el primero caso se observael efecto del error medio en el nmero de observaciones esperadas con un valor superior a 25.4mcuando se mantiene constante la variabilidad del set de datos. La simulacin indica que solo en

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    12/49

    10los primeros tres casos se cumple con el estndar. En el cuarto caso, an cuando el error medioes de 25m, el set de datos contiene 49 observaciones con un error superior a 25.4m. La segundagrfica ilustra el efecto de la variabilidad del set de datos en el nmero de observaciones con unerror superior a 25.4m cuando se mantiene constante el error medio. En este caso el error serasuperior al establecido cuando el set de datos tiene un coeficiente de variacin igual al 20%.

    Figura 6: Relacin entre el error medio (REMC) y el nmero de observaciones esperadas con unvalor superior a 25.4m. Se mantiene constante la variabilidad del set de datos.

    Figura 7: Nmero de observaciones esperadas con un error superior a 25.4m en funcin de lavariabilidad del set de datos. Se mantiene constante el error medio (REMC). La lnea roja indicael valor establecido por el estndar para cartografa escala 1:50.000.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    13/49

    11Exactitud vertical

    El estndar propuesto por La Oficina de Presupuesto de los Estados Unidos de Amrica en1947 y todava utilizados en dicho pas (Bureau of the Budget, 1947) establece que no ms del10% de las elevaciones evaluados podrn tener un error superior a 0,5 del intervalo de la curvade nivel. Por ejemplo, para los mapas 1:50.000 de Costa Rica con curvas de nivel cada 20

    metros, el error permisible sera de 10 metros. No se emiti criterio en cuanto a la exactitud de laposicin horizontal de la curva de nivel ya que es variable y depender de la topografa. Parareas con topografa relativamente plana la ubicacin real de la curva de nivel se encontrar enun rea mayor. Por el contrario, para un rea de topografa muy escarpada la posicin de la curvade nivel deber poseer una mayor exactitud. Dependiendo del equipo y de la tecnologa utilizadapara elaborar los mapas topogrficos, la ubicacin de las curvas de nivel en reas muyescarpadas ser menos precisa que aquella ubicada en reas ms planas.

    Estndar propuesto por la Sociedad de Fotogrametra y Sensores Remotos de los EstadosUnidos de Amrica

    Los estndares sugeridos por dicha sociedad para mapas de gran escala se muestran en elcuadro 4 (ASPRS, 1990; Merchant, 1987). Observe que el estndar asume que la marca mspequea discernible a escala del mapa es 0.25mm.

    Cuadro 4: Errores planimtricos mximos permisibles para mapas de escalas 1:100 a 1:20.000.

    Escala del mapa REMC limitante1 (m) Equivalente mm a escaladel mapa

    1:50 0.015 0.251:100 0.025 0.251:200 0.050 0.251:500 0.125 0.25

    1:1000 0.250 0.251:5000 1.250 0.251:10000 2.500 0.251:20000 5.000 0.25Fuente: Merchant, 1987.

    1 En este caso el error en X y en Y se determina en forma separada y se compara con elvalor del estndar. Ninguno de los errores puede superar dicho valor.

    Para la exactitud vertical, el estndar establece que la raz del error medio cuadrtico no debeexceder un tercio del intervalo de la curva de nivel del producto evaluado y que para valorespuntuales de elevacin dicho valor no debe exceder un sexto del intervalo de la curva de nivel.

    Estndares propuestos por el Comit Federal de Datos Geogrficos de los Estados Unidosde Amrica

    El Comit Federal de Datos Geogrficos de los Estados Unidos de Amrica propuso elsiguiente estndar para evaluar la exactitud geomtrica o planimtrica de los geodatos (FederalGeographic Data Committee, 1998):

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    14/49

    12Se debe utilizar la raz del error medio cuadrtico (REMC) para estimar el error enposicin del geodato.La evaluacin debe estar basada en el uso de una fuente de mayor exactitud que elmaterial que se evala.La exactitud debe reportarse en unidades de terreno (metros para el caso de Costa

    Rica) y con un nivel de confianza del 95%. Esto indica que en promedio un 95% delas veces que se evalu la exactitud del producto sta deber tener un error inferior oigual al reportado por el autor de los geodatos. El estndar asume que el errorreportado es una sntesis de todas las posibles fuentes de error que pueden afectar algeodato (Ej. errores de compilacin, control geodsico, calculo de coordenadasterrestres, etc.)

    Se recomienda que se utilice un mnimo de 20 puntos bien definidos para determinarla raz del error medio cuadrtico (REMC). Estos puntos deben estar bien distribuidosen el rea a evaluar. El nivel de confianza del 95% indica que solo un punto puedetener un error superior al especificado por el producto. Si usted no puede identificar 20puntos bien definidos para realizar la evaluacin puede utilizar los siguientes mtodos

    para documentar la exactitud geomtrica de los geodatos (ANSI-NCITS, 1998):o Estimacin deductivao Evidencia internao Comparar producto con la fuente

    El clculo del intervalo de confianza para el error (REMC) depende del grado deexcentricidad del error en X y en Y.

    Caso 1: Error en ambos ejes es igual (error radial)El clculo de nivel de confianza asume que los errores tienen una distribucin bivariable

    normal; que son independientes en la direccin de los ejes X y Y y que adems los datos se

    encuentran libre de errores sistemticos. Bajo estas circunstancias y para un nivel de confianzadel 95% la exactitud es igual a (Greenwalt and Schultz, 1968, citado por Federal GeographicData Committee, 1998):

    Exactitud = 2.4477 * REMCx = 2.4477 * REMCy (8)Exactitud = 2.4477 * REMCxy /1.4142 (9)Nota: la expresin REMCxy /1.4142 corresponde al error promedio en X y error en Y.Exactitud 95% = 1.7308 * RMSExy (10)

    Caso 2: Error en ambos ejes es diferente (Aproximacin del error estndar circular)En la mayora de los casos, el error en X y en Y ser diferente; sin embargo el estndar solo

    considera el caso en que la razn de la diferencia entre el error ms pequeo y el ms grande (Yasea en X en Y) se encuentra en el mbito 0.6-1.0. Bajo estas condiciones el error estndarcircular para un nivel de confianza de 39.95% puede aproximarse como (Greenwalt and Schultz,1968, citado por Federal Geographic Data Committee, 1998):

    (REMCx + REMCy )/2 (11)

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    15/49

    13Dado que los errores tengan una distribucin bivariable normal; sean independientes en la

    direccin de los ejes X y Y y que adems los datos se encuentran libre de erroressistemticos; la exactitud del producto para un nivel de confianza del 95% puede aproximaseutilizando al siguiente ecuacin (Federal Geographic Data Committee, 1998).

    Exactitud ~ 2.4477 *{(REMCx + REMCy)/2} (12)En donde:REMCx: raz del error medio cuadrtico en XREMCy: raz del error medio cuadrtico en Y

    Exactitud verticalEl estndar recomendado por el Comit Federal de Datos Geogrficos de los Estados Unidos

    de Amrica para la exactitud vertical de los geodatos sigue la misma filosofa del estndarutilizado para el error planimtrico; con la diferencia de que en este caso la incertidumbrecorresponde al eje Z (Federal Geographic Data Committee, 1998). El estndar le asegura alusuario de los geodatos que la ubicacin real del punto se encuentra a una cantidad de metrosun 95% del tiempo. El error medio (REMC) se calcula con la siguiente frmula:

    REMC z: [S(Z Z)2/n]0.5 (13)

    Donde Z y Z corresponden a la altura del objeto en el producto y en el terreno, respectivamentey n al nmero de puntos evaluados.

    El estndar parte del supuesto que el material se encuentra libre de errores sistemticos o queestos son mnimos. Dado que la distribucin del error vertical sea normal y que el tamao demuestra sea superior o igual a 30, el intervalo de confianza de 95% para el set de datos es igual a:

    Exactitud z = 1.960 *REMCz (14)

    Comunicar la exactitud del productoEl Comit Federal de Datos Geogrficos de los Estados Unidos de Amrica propone utilizar

    el siguiente procedimiento para reportar el resultado de la evaluacin de la exactitud de losgeodatos (Federal Geographic Data Committee, 1998b):

    Si usted ha evaluado la exactitud vertical y horizontal de sus datos debe reportar elresultado de la siguiente manera:

    o Los datos evaluados tienen la siguiente exactitud:Horizontal _________metros con una confianza del 95%Vertical ___________ metros con una confianza del 95%

    Cuando usted no pueda utilizar la metodologa sugerida por el estndar (verificacinindependiente de errores) para evaluar la exactitud de su producto pero ha utilizadoprocedimientos que han demostrado generar productos con un determinado grado deexactitud debe reportar la exactitud del producto de la siguiente manera:

    o Este producto ha sido compilado utilizando tcnicas de trabajo, procedimientosy equipo que permiten asegurar una exactitud horizontal y vertical de:

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    16/49

    14Horizontal _________metros con una confianza del 95%Vertical ___________ metros con una confianza del 95%

    Si usted puede evaluar la exactitud horizontal de los datos en forma independienteutilizando una fuente de mayor exactitud y adems puede especificar el error vertical

    esperado de sus procedimientos de trabajo debe citar la exactitud del producto de lasiguiente manera:

    o Este producto ha sido evaluado y compilado utilizando tcnicas de trabajo,procedimientos y equipo que permiten obtener una exactitud horizontal yvertical de:Exactitud horizontal evaluada _________metros con una confianza del 95%Compilado para un error vertical de______ metros con una confianza del 95%

    EjemploCon el objetivo de aclarar el uso de los estndares a continuacin se presenta un ejemplo de la

    evaluacin de la exactitud del registro de dos segmentos de la hoja Tilarn 3247 III del IGN-CRpublicada en 1982. Los segmentos fueron escaneados en un EpsonPerfection 1250 a unaresolucin de 300dpi. Posteriormente fueron registrados utilizando la extensin ImageWarp yAnalista Espacial de ArcView GIS. En el proceso de registro se utilizaron 7 puntos de controlpara el primer segmento y 5 para el segundo y en ambos casos se utiliz una ecuacin desegundo grado.

    Cuadro 5 : Puntos de control y error para el primer segmento.

    GCP ID InputX InputY OutputX (m) OutputY(m) Xerror (m) Yerror (m) Error XY (m)_________________________________________________________________________009 7.885 -2.125 454000 269000 0.566 -0.058 0.6010 7.927 -10.757 454000 258000 0.681 -0.070 0.7011 0.847 -0.542 445000 271000 1.197 -0.123 1.2012 5.554 -6.832 451000 263000 -2.976 0.307 3.0013 0.808 -10.755 445000 258000 -1.681 0.173 1.7014 0.819 -3.684 445000 267000 -4.496 0.463 4.5015 1.593 -6.827 446000 263000 6.708 -0.691 6.7_________________________________________________________________________Total X RMS Error = 3.4m (REMCx)Total Y RMS Error = 0.3m (REMCy)Error radial (REMCxy): 3.4mEstndar recomendado por NSSDA (USA) RCEMC*.1.7305Nota: Si lo desea puede utilizar el archivo adjunto error_horizontal.xls para el clculo delRCEMC.IC: t 1-? /2, n-1 * REMC/(n)

    0.5 en donde 1-? es el nivel de confianza y n-1 los grados de libertad.

    Nota: Observe que los errores individuales en Y son muy pequeos (inferiores a 1m); sinembargo en X existen dos puntos con un error superior a 5 metros. El error radial o planimtricomedio fue de 3.4m; lo cual es un valor aceptable para un mapa original a escala 1:50.000. Una

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    17/49

    15forma de reducir el error de registro es eliminar los puntos con mayor error; sin embargo y amenos que exista un error real en la ubicacin del punto esto no mejora en realidad la exactituddel producto final. Por ejemplo, en el presente caso se pudo eliminar el punto 015 y de estamanera reducir el error radial a 2.2m y si se eliminara adems el punto 014 el error se reduce a1.4m; sin embargo esto no mejorara la exactitud de la imagen georeferenciada. Para que la

    exactitud de la nueva imagen se mejorara sera necesario reemplazar dichos puntos por otrospuntos en la misma vecindad pero con un error menor. En este caso, el error posiblemente es elresultado del proceso de escaneo (Ej. Los ejes del mapa no estaban orientados paralelos a los ejesdel escner la tasa de error del escner no es constante). Si desea mayor informacin sobre eltema de los escneres lo remito al documento Escaneo, georeferenciacin y vectorizacin dematerial cartogrfico y de fotos areas utilizando ArcView GIS (Fallas, 2001).

    Cuadro 6 : Puntos de control y error para el segundo segmento.

    GCPID InputX InputY OutputX (m) OutputY (m) X error (m) Y error (m) Error XY (m)______________________________________________________________________________002 7.653 -2.107 444000 270000 3.366 -1.395 3.6003 7.790 -10.761 444000 259000 -6.443 2.673 7.0005 0.635 -6.132 435000 265000 -2.487 1.033 2.7007 4.569 -6.082 440000 265000 -2.372 0.980 2.6008 4.643 -11.583 440000 258000 7.934 -3.291 8.6______________________________________________________________________________Total X RMS Error = 5.0m (REMCx)Total Y RMS Error = 2.1m (REMCy)Error radial: 5.5m

    Nota: Observe que los errores individuales en Y son pequeos aunque mayores que para elsegmento anterior; sin embargo los errores en X son aun mayores que para el segmento anterior.El error radial o planimtrico medio fue de 5.5m; lo cual es todava un valor aceptable para unmapa con una escala original de 1:50.000.

    Verificacin independiente del error del mapa georeferenciadoPara la verificacin independiente del error se seleccionaron 41 puntos correspondientes a

    la intercepcin de la cuadrcula del mapa georeferenciado. Luego se determin las coordenadasplanas (Lambert Norte) para cada uno de los puntos y finalmente se calcul la raz del errormedio cuadrtico. La figura 8 muestra la ubicacin de los puntos elegidos para la validacin delerror de georeferenciacin del mapa escaneado. Los puntos se han distribuido de tal forma quecubran toda el rea a evaluar. Observe que se ha ubicado un mayor nmero de puntos en elextremo inferior izquierdo del segmento uno para verificar que efectivamente el error es superioral resto de la imagen. El error promedio (REMCXY ) para los dos segmentos es de 16.7m; entanto que para el eje X es de 16.3m y para el eje Y de 3.4m. Si se evalan dichos errores enforma independiente podra concluirse que en promedio son muy pequeos (inferiores a0.33mm) y si aceptamos que la marca ms pequea que puede distinguirse en un mapa impresoes de 0.5mm (Fisher, 1991); entonces el producto tendra un error promedio inferior al esperadopara un mapa 1:50.000. Por otra parte, si aplicamos los estndares mencionados en las seccionesprevias, el resultado sera el siguiente:

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    18/49

    161. Estndar propuesto en Estados Unidos en 1947 (Bureau of the Budget, 1947).

    Este estndar establece que no mas de un 10% de los puntos seleccionados pueden tenerun error superior a 0.508mm a escala del mapa; lo que equivale a 25.4m para un mapa1:50.000. De los 41 puntos elegidos, 5 tienen un error superior a 25.4m y por tanto elmapa georeferenciado no cumplira con el estndar. Para cumplir con el estndar se

    requiere que un mximo de 4 puntos tengan un error superior a 25.4m. Note sin embargoque en este caso los errores superiores a 25.4m tienden a concentrarse en la esquinainferior izquierda del mapa georeferenciado, por cuanto puede concluirse que el error nose debe a un proceso aleatorio sino ms bien a un error localizado. Bajo estascircunstancias si se elimina dicha seccin del mapa, el resto cumplira con el estndar. Enun caso como el analizado, el usuario debe tener mucho cuidado al utilizar el productogeoreferenciado; ya que si se aumenta el tamao de la muestra, es posible que productocomo un todo cumpla con el estndar; aun cuando una seccin del mismo posea una errorsuperior al especificado por el estndar. Una forma de evitar esta distorsin en el uso delestndar es asegurarse que los errores son similares a lo largo y ancho del mapa. Otraalternativa es evaluar el error para cada uno de los segmentos por separado. Por ejemplo,para el segundo segmento, de los 17 puntos elegidos solo uno sobrepasa el errorestipulado por el estndar y por ende cumple con el estndar. Sin embargo, el error de35m se ubica en el extremo inferior del mapa, lo que podra indicar un error diferencial olocalizado atribuible al escner.

    2. Estndares propuestos por el Comit Federal de Datos Geogrficos de los Estados Unidosde Amrica Caso 2: Error en ambos ejes es diferente (error forma una elipse).En este caso el error en X y en Y no el mismo y por se aproxim el valor del la exactitudcon una confianza de 95% utilizando la formula 12:Exactitud ~ 2.4477 *{(REMCx + REMCy)/2}Exactitud ~ 2.477 * (16.3+3.4)/2Exactitud ~24.2mLos datos evaluados tienen una exactitud horizontal de 24.2 metros con una confianza del95%.

    Bajo este estndar, el autor del producto reporta el valor de exactitud y le corresponde alusuario(a) decidir si dicho producto cumple con su requerimiento de calidad. Elcomentario realizado en la seccin anterior sobre la distribucin espacial de los errorestambin aplicable a esta seccin. Si aceptamos que la marca ms pequea que puededistinguirse en un mapa impreso es de 0.5mm (Fisher, 1991); entonces el productotendra un error promedio inferior (0.484mm) al esperado para un mapa 1:50.000. Otraforma de analizar los resultados es determinar cuntos puntos tienen un error superior alespecificado en el estndar; en este caso 6 puntos tienen un error superior 24.2m; lo querepresenta un 14.6% de la muestra.

    Las figuras 10 y 11 muestran la distribucin espacial de los errores en los ejes X y Y. Esevidente del anlisis de estas figuras que el error en X es mucho mayor que en Y y que es elresponsable de que el mapa no cumpla con el estndar (en el primer caso) y de que la exactitudsea de 24.2m en el segundo caso. Si se eliminaran los errores superiores a 30m, el error medio(REMCXY ) sera de 13.7m; el error en X (REMCX) sera de 13.4m y el error en Y (REMCy)sera de 2.9m.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    19/49

    17

    Figura 8: Distribucin de puntos de muestreo con sus respectivos errores (m). El color magentaindica error en eje X, el color azul error en eje Y y el color rojo error en XY. Los nmeros enrojo indican puntos de muestreo que sobrepasan el mximo estipulado el estndar.

    Figura 9: Distribucin de puntos de muestreo con sus respectivos errores (m). El color magentaindica error en eje X, el color azul error en eje Y y el color rojo error en XY. Los nmeros enrojo indican puntos de muestreo que sobrepasan el mximo estipulado el estndar.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    20/49

    18

    Figura 10: Distribucin de los errores en X (Oeste-Este)

    Figura 11: Distribucin de los errores en Y (Sur-Norte).

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    21/49

    19La figura 12 muestra la distribucin espacial de los errores; es evidente de la grfica que el

    valor de los mismos no se distribuye en forma aleatoria; como se esperara si el resultado de losmismos fuese el producto de un proceso aleatorio que afectara por igual a todos los puntosmuestreados en el mapa georeferenciado. La conclusin final es que es el comportamiento noaleatorio del error se debe a una combinacin de factores ajenos al mapa original y que estn

    asociados ms bien al proceso de automatizacin del mismo (Ej. escaneo).

    Figura 12: Distribucin de los errores en X y en Y.

    Veracidad en la clasificacin de los atributosLos atributos son propiedades que poseen un determinado elemento geomtrico del mapa (Ej.

    lnea, punto, polgono). Por ejemplo, una lnea en el mapa puede representar un ro permanente,una lnea de ferrocarril una carretera. Estas variables se cuantifican a un nivel de medicinnominal (Ej. clases de uso-cobertura del suelo) y de intervalo (Ej. grados de erosin) y por lotanto el error no puede evaluarse en trminos de la desviacin estndar de la raz del errormedio cuadrtico (REMC).

    Los sistema de clasificacin utilizados deben ser mutuamente excluyente y comprender la

    totalidad de las categoras presentes en el rea de estudio. Cuando sea posible debe utilizarse unsistema de clasificacin jerrquico. Este sistema permite reagrupar categoras con gran facilidady a la vez mantener la lgica de la clasificacin. El reagrupar o generalizar clases es una formade cumplir con un estndar de clasificacin preestablecido. Se deben utilizar indicadoresnaturales para definir las clases. Por ejemplo, es fcil diferenciar en el terreno entre pasto conarbustos y pasto sin arbustos; sin embargo es ms difcil separar pasto con cobertura de arbustosentre 0-25% y pasto con cobertura de arbustos entre 26 y 50%. Recuerde que para asegurar datosde alta calidad es necesario definir claramente cada una de las categoras antes de iniciar el

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    22/49

    20proceso de clasificacin. Cuanto ms compleja sea el sistema de clasificacin mayor ser elesfuerzo requerido para su verificacin en el campo y mayor ser el nivel de error de laclasificacin.

    Los estndares cartogrficos de los Estados Unidos no hacen referencia al nivel de veracidad

    requerido por los atributos representados en el mapa (Fisher, 1991). Por ejemplo, el estndar norequiere que al menos un 90% de las carreteras que aparecen como asfaltadas en el mapa poseanrealmente dicha caracterstica o que un 85% de los nombres de las localidades sean los correctos.Las categoras clasificadas errneamente pueden ordenarse posteriormente de acuerdo a su gradode disimilitud con respecto a la identidad verdadera de la clase. Por ejemplo, es ms graveclasificar pasto como bosque que bosque secundario temprano como bosque secundarioavanzado. Para evaluar la exactitud de una clasificacin es necesario, al igual que en el casoanterior, utilizar una fuente de informacin de mayor exactitud que el material a evaluar.

    El resultado es presentado como una matriz de confusin. Esta matriz muestra en su diagonallas categoras clasificadas correctamente; en las columnas las categoras deducidas por el autorde la clasificacin y en las filas las clases de referencia (verdad de terreno). El error asociado acada una de las columnas se denomina error de inclusin o comisin y representa aquellas reasque fueron asignadas a dicha categora sin pertenecer a ella. En las filas se presentan lascategoras verdaderas; el error asociado a cada fila se denomina error de exclusin u omisin yrepresenta aquellas reas que no fueron asignadas a dicha categora an cuando pertenecan a ella(Aronoff, 1975; Story y Congalton, 1986).

    La exactitud del usuario (error de comisin o de inclusin) es importante pues le indica alusuario el error esperado al utilizar el mapa en el campo. El cuadro 7 presenta una matriz deconfusin hipottica utilizada en el anlisis de la exactitud de la clasificacin de un mapatemtico. La exactitud global de la clasificacin fue de un 85.9%; la cual puede considerarsecomo satisfactoria. Si nos interesara analizar con mayor detalle la exactitud con que hemosclasificado a los cultivos, el cuadro indica que el analista acert en un 80%, lo cual puedeconsiderarse nuevamente como satisfactorio. Tanto la exactitud de la clasificacin general(85.9%) como la de los cultivos (80%) nos indican que los atributos o clases del mapa son muyconfiables. Sin embargo, si se analiza la exactitud del usuario para la categora cultivos seobserva que es de un 86.9%; esto indica que aunque 80% de las reas de cultivos han sidoidentificadas correctamente, en realidad existe un 86.9% del rea dedicada a cultivos. Esteejemplo nos ilustra la importancia de analizarse tanto la exactitud global del mapa, como laexactitud del analista y del usuario. La exactitud del usuario (error de comisin o de inclusin)es importante pues le indica al usuario el error esperado al utilizar el mapa en el campo. Laexactitud global de la clasificacin slo considera los aciertos en diagonal y descarta lainformacin suministrada por los errores de comisin y omisin. Esta limitante puede eliminarseutilizando un estadstico multivariado discreto como el ndice de concordancia Kappa o unanlisis normalizado de la matriz de confusin.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    23/49

    21Cuadro 7 : Matriz de confusin hipottico utilizado para evaluar la exactitud de la clasificacin.

    Categoras deducidas de la clasificacin Valores %Clases dereferencia Bosque Cultivo Pasto Urbano Total Ex. Prod. Err. Om.Bosque 19 0 1 0 20 95.0 5.0

    Cultivo 2 20 3 0 25 80.0 20.0Pasto 1 2 30 1 34 88.2 11.8Urbano 0 1 2 10 13 76.9 23.1Total 22 23 36 11 92Ex. Usu. 86.4 86.9 83.3 90.9Err. Com. 13.6 13.1 16.7 9.1

    Exactitud global(19+20+30+10)/92=85.9%

    Ex. Prod.: Exactitud del productorEx: Usu.: Exactitud del usuarioErr. Om.: Error de omisinErr. Com. : Error de comisin.

    Exactitud del Usuario Exactitud del Productor Bosque: 19/22= 86.4% 19/20= 95.0%Cultivo: 20/23= 86.9% 20/25= 80.0%Pasto: 30/36= 83.3% 30/34= 88.2%Urbano 10/11=90.9% 10/13= 76.9%

    Bajo el supuesto de una distribucin binomial para cada categora y utilizando unaaproximacin normal de la distribucin binomial puede calcularse un intervalo de confianza paracada categora utilizando las siguientes ecuaciones:

    = (1/n) S xi (15)

    en donde : representa la probabilidad (p) de que cada muestra haya sido correctamenteclasificada y xi las muestras correctamente clasificadas del total de las observaciones (n).

    La varianza de p es S2= p(1-p); en donde p es la proporcin de muestras correctamenteclasificadas y 1-p denominado q representa la proporcin de muestras clasificadasincorrectamente. Entonces, el intervalo de confianza para p es:

    Z(1-a/2) * [((p* q)/n)] 0,5 (16)

    Por ejemplo, para los datos de la tabla 10, del total de sitios de muestreo (92) solo 79 fueron

    asignados correctamente (19+20+30+10); lo que representa una exactitud del 85.9%. Aplicandola frmula 12, el error de muestreo para una confianza del 95% sera:

    Error de muestreo = 1.96 * ((0.859*0.141)/92)0.5 = 0.071

    Y por tanto el intervalo de confianza es igual a 85.9% 0.071%; lo que indica que la fiabilidadreal promedio esperada para la clasificacin se encuentra entre 85.83% y 86.04%.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    24/49

    22La tcnica de anlisis anterior es esencialmente descriptiva; por lo que a continuacin se

    describe el uso del estimador Kappa (K) para evaluar la exactitud de la clasificacin de losatributos en el mapa (Congalton et. al., 1983). El estimador K considera tanto la informacinsobre la concordancia global de la clasificacin como los errores de comisin y omisin.

    El estimador Kappa (K): Cuantificacin de la exactitud de clasificaciones multivariadasEl estimador K incluye tanto informacin sobre la concondancia global de la clasificacincomo sobre los errores de omisin y comisin indicados por el producto de los subtotalesmarginales de las columnas e hileras. El ndice mide la diferencia entre la exactitud de laclasificacin y aquella esperada por razones de azar.

    _ NSxii - S(xi+ * x+i)K = --------------------------- (17)

    N2 - S (xi+ * x+i)

    en donde:

    S indica la sumatoria desde la hilera 1 hasta la n en la matriz;xii indica el nmero de observaciones en hilera i y columna I;xi+ y x+i indican las sumas marginales de la hilera i y la columna I, respectivamente, yN nmero total de observaciones

    El intervalo de confianza para K puede estimarse utilizando la aproximacin de la varianzapara muestras grandes (Bishop et. al. 1975):

    1 ?1 (1- 21) 2 (1- ? 1) (2 ? 1 (? 2 - ? 3)) (1- ? 1)2 (? 4-4* ? 2

    2)S( K) = --- - ---------------- + -------------------------------- + --------------------------- (18)

    N (1- ? 2)2 (1- ? 2)

    3 (1- ? 2)4

    donde:xii

    ? 1 = S -------- sumatoria desde i=1 hasta i=r (filas) (19)N

    xi+ * x+i? 2 = S ------------- sumatoria desde i=1 hasta i=r (filas) (20)

    N2

    xii xi+ x+i? 3 = S ----- (------ + ------) Sumatoria desde i=1 hasta i=r (filas) (21)

    N N N

    xij xj+ x+i? 4 = S ----- (------- + -----)

    2 Sumatoria desde i=1 hasta i=r filas) (22)N N N

    y desde j=1 hasta j=c (columnas)

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    25/49

    23El promedio y la varianza de K,? nos permiten realizar las siguientes inferencias estadsticas:

    1. Probar por la significancia estadstica de la clasificacin; o sea para un nivel de significanciadado es la clasificacin mejor que una asignacin aleatoria de clases a los polgonos o pixelesde una imagen o mapa?.

    2. Dadas dos estimaciones independientes de K Son las dos matrices de clasificacinestadsticamente diferentes a un nivel de significancia dado?.

    K1 - K2Z ~ ------------------------ (23)

    (S12 + S2

    2)0,5

    La prueba se realiza bajo el supuesto de que el tamao de la muestra es grande (normalmenteN >=30) y de que K es asintticamente normal. EL valor crtico de Z se obtiene de la tabla dedistribucin normal estandarizada. Utilizando esta aproximacin normal es posible comparar unconjunto de matrices de confusin y determinar Cul mtodo de clasificacin (Ej. supervisadaVersus no supervisada; uso de fotos a color Versus blanco y negro, etc.) es superior o Cul setde datos (Ej. poca seca Versus poca lluviosa) provee una mayor exactitud en la clasificacin?.

    Cuando la matriz de confusin presenta muchas categoras se requiere de un gran nmero demuestras para evaluar su exactitud. Por ejemplo, para una matriz de 20 columnas por 20 hilerasse requieren al menos 400 muestras para obtener al menos una observacin por celda. Dadas laslimitaciones de las frmulas estadsticas, recomienda obtener al menos 50 muestras (pixeles) portipo de cobertura o categora de uso del suelo. Y cuando el rea sea muy grande (superior a350.000ha) o el nmero de categoras sea superior a 12 el tamao de muestra por categora debeincrementarse a 75 o 100 Congalton (1991). Es vlido aumentar el tamao de la muestra enaquellas reas de mayor variabilidad o de mayor importancia en detrimento de reas menosvariables o menos importantes.

    Estimacin del tamao de muestraEl tamao de muestra requerido para un error dado puede estimarse utilizando la

    aproximacin normal de la distribucin binomial (Snedecor y Cochran, 1980) para calcular eltamao de la muestra.

    n = Z2 (p*q) / E2 (24)

    en donde: p: proporcin esperado de aciertosq: proporcin esperado de errores (100-p)E: error mximo permisible (fraccin)Z: es el valor de la distribucin normal estandarizada para un alfadeterminado. Por ejemplo, para un nivel de confianza del 95% (a =0,05) elvalor de Z es 1,96.

    p = (nc / N) (25)en donde nc: nmero de puntos con un error inferior o igual al mximo permitido, y

    N: nmero total de observaciones

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    26/49

    24La varianza de p es:

    S2= (p*q) / n (26)

    en donde q: 1-p, proporcin de desaciertos

    Por ejemplo para un mapa con un error esperado de 10% (0.1), un error mximo permisible de5% (0.05) y un nivel de confianza del 95% (Z= 1,96), tenemos que el tamao de la muestra debeser:

    n = (1,96)2 * (0.90*0.10) / (0.05)2 = 138 puntos de observacin

    Una vez realizado el muestreo el intervalo de confianza para p puede calcularse utilizando lasiguiente ecuacin:

    p Z(1-a/2) * ((p*q) / n)) 0,5 (27)

    Cuando se desee calcular el lmite de confianza inferior debe utilizarse la siguiente frmula:

    PI =p - Z(1- a) * ((p*q)/n))0,5 + 1/(2n) (28)

    en donde p = proporcin de puntos que cumplen con el estndarq = proporcin de puntos que no cumplen con el estndar (1-p)n = tamao de la muestra

    El valor 1/(2n) se denomina correccin por continuidad y su uso es recomendado porSnedecor y Cochran (1980) para mejorar la exactitud de la aproximacin normal.

    El esquema de muestreo utilizado es otro aspecto importante a considerar. El muestreo simpleal azar (sin reemplazo), el estratificado al azar y el de conglomerados han brindado resultadossatisfactorios (Congalton, 1991). Cuando se utilicen conglomerados dicho autor sugiere unamuestra formada por 5 a 25 pixeles por conglomerado. Otra consideracin prctica en elesquema de muestreo es que en la mayora de los casos no es posible realizar el trabajo de campodos veces. La primera vez para entrenar al clasificador (Ej. fotointrprete o computadora) y lasegunda para obtener la informacin necesaria para evaluar la exactitud de la clasificacin.

    Al igual que para la exactitud horizontal y vertical tampoco existe en Costa Rica un estndarque establezca cul debe ser la exactitud de los atributos indicados en el mapa. Por esta razn ya modo de ejemplo se presentan los cuadros 8 y 9 los cuales resumen los estndares utilizadospor el Servicio Geolgico de los Estados Unidos y por el Servicio de Conservacin de Suelos delDepartamento de Agricultura de los Estados Unidos para sus mapas de cobertura/ocupacin delsuelo y edafolgicos, respectivamente.

    Para Costa Rica, el decreto No. 23214 del MAG-MIRENEM establece que debe utilizarse laMetodologa para la determinacin de la capacidad de uso de las tierras de Costa Rica (MAG-MIRENEM, 1995) en la evaluacin, clasificacin y planificacin de las tierras a nivel nacional.En el anexo 4 de dicha metodologa se presenta el nmero de muestras requeridas y las unidades

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    27/49

    25mnimas mapeables para diferentes tipos de levantamientos. Para beneficio del lector dichosvalores se reproducen en el cuadro 10. Al referirse el decreto a la metodologa como un todopuede asumirse que dichos valores representan una norma o estndar que debe cumplir cualquierestudio de capacidad de uso de la tierra realizado en el pas.

    Cuadro 8 : Estndar utilizado para los mapas de cobertura y ocupacin del suelo por el ServicioGeolgico de los Estados Unidos (Fuente Anderson, 1976).______________________________________________________________________________

    1. La exactitud en la clasificacin de categoras de uso y cobertura del suelo debe ser de almenos un 85%.

    2. Las categoras mapeadas deben tener un nivel de exactitud similar.3. La exactitud debe mantenerse entre interpretes y periodos de anlisis.

    ______________________________________________________________________________

    Cuadro 9 : Estndar utilizado para los mapas de suelos del Servicio de Conservacin de Suelosdel Departamento de Agricultura de los Estados Unidos (SCS 1984, Citado por Fisher,P.F.,1991)______________________________________________________________________________

    1. Hasta un 25% de los pedones pueden pertenecer a una categora diferente a laespecificada en el mapa, siempre y cuando esto no imponga mayores riesgos al manejode suelo.

    2. Hasta un 10% de los pedones pueden pertenecer a una categora diferente a laespecificada en el mapa, cuando el error de clasificacin imponga riesgos severos almanejo de suelo.

    3. Ninguna categora de suelo debe ocupar ms de un 10% del rea en la unidad mapeada.______________________________________________________________________________

    Cuadro 10: Densidad de muestreo y unidades mnimas mapeables (UMM) para diferentes tiposde levantamientos de capacidad de uso de la tierra.

    Levantamiento No. Obsev./km2 UMP (ha) Escala mapaEsquemtico No definido 2.500 1:200.000 o MenorGeneral 0,2 200 1:100.000 a 1:200.000Reconocimiento 1 25 1:50.000 a 1:100.000Semidetallado 10 4 1:20.000 a 1:50.000Detallado 60 1 1: 5.000 a 1:10.000Muy detallado 200 0,25 1: 5.000 o menorAdaptado de MAG-MINAE, 1995.

    A pesar de existir estndares la gran mayora de los mapas publicados no incluyeninformacin al respecto. Esto es vlido tanto para los mapas producidos en pases en vas dedesarrollo (Ej. Costa Rica, Uganda, Kenia, Tailandia) como en pases desarrollados (Ej. planoscatastrales y mapas en Estados Unidos e Inglaterra) (Fisher, 1991). Los principales factores queimpiden el uso de los estndares no son de ndole tcnica sino ms bien de naturaleza econmicay de logstica. La mayora de los proyectos de mapeo disponen de recursos limitados y por lo

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    28/49

    26tanto se da mayor nfasis en cubrir el rea de estudio y en producir el mapa en el tiemporequerido que en la evaluacin de la exactitud del material producido.

    En ausencia de estndares explcitos en la mayora de los mapas se recurre a convencionespara expresar cualitativamente la incertidumbre asociada a la informacin mapeada. Por ejemplo,

    en los mapas 1:50.000 de Costa Rica el sistema de drenaje se muestra como lneas continuas decolor azul para indicar ros permanentes y como lneas discontinuas para indicar rosintermitentes. Los mapas geolgicos y geomorfolgicos tambin utilizan lneas discontinuas paraindicar que no se tiene certeza total sobre la ubicacin del atributo o elemento del paisajemapeado.

    Factores a considerar en la evaluacin de la exactitud de la clasificacinLa matriz de confusin o el ndice K nos permiten evaluar la exactitud de nuestra

    clasificacin, sin embargo no nos brindan informacin sobre la calidad y veracidad de lainformacin utilizada en el proceso. A continuacin discutimos cinco aspectos que debenconsiderarse al evaluar la exactitud de la clasificacin (Congalton, 1991):

    Muestreo de campoLos datos de campo se consideran como el estndar o valor real con el cual comparamos la

    clasificacin. De esta afirmacin se desprende que si los datos no son de suficiente calidad yresolucin la evaluacin ser sesgada. Por ejemplo, si utilizamos categoras derivadas de fotosareas como informacin real, debemos asegurarnos que la clasificacin realizada a partir de lasfotos est libre de errores. En algunos casos tambin es posible utilizar mapas previamenteelaborados como material de referencia; e igualmente en este caso la evaluacin depender de laveracidad del autor del mapa. Esta es un rea compleja y que hasta la fecha ha recibido limitadaatencin en el pas. Cada evaluacin de exactitud es particular y por lo tanto para asegurar suxito el investigador debe conocer su rea de trabajo y determinar, basado en las limitaciones ofacilidades de que disponga, la tcnica de trabajo que le permita obtener la informacin de msalta calidad, al menor costo y en los plazos requeridos por el proyecto.

    El detalle con que se colecta la informacin de campo depender del detalle de la clasificacinque se desee verificar. Por ejemplo, para evaluar la exactitud de una clasificacin que distingueentre bosque, pasto, cuerpos de agua y reas urbanas slo es necesario determinar s lospolgonos seleccionados en la muestra poseen o no dichas caractersticas. Por el contrario, sideseamos clasificar los bosques por su cobertura de copa es necesario medir dicha variable enuna serie de parcelas para determinar un valor medio de cada rea muestreada y posteriormentecompararla con el valor indicado en el mapa.

    Sistema de clasificacin

    El sistema de clasificacin utilizado para subdividir el rea de estudio en unidades de menortamao responde a los objetivos del estudio y puede partir de sistemas preestablecidos como elde Anderson et. al (1976), o disearse para responder a las caractersticas del rea de estudio. Acontinuacin se presentan algunos criterios que deben utilizarse al disear o seleccionar unaclave de clasificacin:

    1. El sistema de clasificacin debe ser mutuamente excluyente y comprender la totalidad delas categoras de uso y cobertura presentes en el rea de estudio.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    29/49

    272. Cuando sea posible debe utilizarse un sistema de clasificacin jerrquico.

    3. El sistema jerrquico permite reagrupar categoras con gran facilidad y a la vez mantenerla lgica de la clasificacin. El reagrupar o generalizar clases es una forma de cumplircon un estndar de clasificacin preestablecido. Por ejemplo, si no fuera posible separar

    Jaragua con arbustos de jaragua con vegetacin herbcea, ambas clases se reagruparancomo jaragua con arbustos y vegetacin herbcea.

    4. Utilizar indicadores naturales para distinguir entre clases. Por ejemplo, es fcildiferenciar en el terreno entre pasto con arbustos y pasto sin arbustos; sin embargo es msdifcil separar pasto con cobertura de arbustos entre 0-25% y pasto con cobertura dearbustos entre 26 y 50%. Finalmente, recordar que antes de iniciar el proceso declasificacin se debe tener una clara definicin de cada una de las categoras. Cuanto mscompleja sea la clasificacin mayor ser el esfuerzo requerido para su verificacin en elcampo y mayor ser el nivel de error de la clasificacin.

    Auto correlacin espacial de los erroresLa auto correlacin espacial es equivalente a la auto correlacin en series estadsticas no

    espaciales (Ej. en la estacin lluviosa es muy probable que un da lluvioso sea seguido por otroda lluvioso). En el caso de una variable de naturaleza espacial la presencia, ausencia o valoresperado de una variable afecta la presencia, ausencia o valor esperado de la misma variable enun rea vecina. Congalton (1988) obtuvo para un rea agrcola, una de pastos y otra de bosquesauto correlaciones estadsticamente significativas en el patrn de errores a distancias inferiores oiguales a 30 pixeles (240 metros) para imgenes MSS de Landsat. El patrn de auto correlacinde los errores en el terreno agrcola exhiba grandes bloques a consecuencia del gran tamao delos campos agrcolas; en el caso de los pastos, la mezcla de grandes extensiones de pasto y depequeas reas de bosques generaron un patrn de errores lineal y finalmente en los bosques elpatrn fue el menos compacto y el ms lineal. El patrn lineal es causado por errores declasificacin en los bordes de las diferentes categoras de uso-cobertura. La implicacin prcticade estos resultados es que la auto correlacin en los errores afectan tanto el tamao de la muestracomo el mtodo utilizado para su seleccin.

    Tamao de la muestraLa definicin del tamao de la muestra es un tema clsico en el anlisis estadstico tradicional

    y es un rea que ha recibido gran atencin en el anlisis de clasificaciones derivadas de sensoresremotos. Cada observacin tiene un costo y por lo tanto su nmero debe ser el mnimo quesatisfaga los requerimientos estadsticos y a la vez sea econonmicamente viable.

    Diversos autores (van Genderen and Lock, 1977; Hay, 1979; Hord and Brooner, 1976;Congalton, 1988b) han publicado ecuaciones y guas para la seleccin del tamao de la muestra.La ecuaciones propuestas estn basadas en la distribucin binomial o en la aproximacin normalde la distribucin binomial y se basan en la proporcin de muestras correctamente clasificadas(Ej. pixeles, conglomerados o polgonos) y un error permisible. Cuando la matriz de confusinpresenta muchas categoras se requiere de un gran nmero de muestras para evaluar su exactitud.Por ejemplo, para una matriz de 20 columnas por 20 hileras se requieren al menos 400 muestraspara obtener al menos una observacin por celda. Las ecuaciones tambin pueden utilizarse paraestimar el tamao de muestra requerido para evaluar la exactitud de la clasificacin de una

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    30/49

    28determinada categora. La principal limitante de las ecuaciones es que no fueron diseadas paraconsiderar la confusin entre categoras.

    Dadas las limitaciones de las frmulas estadsticas, Congalton (1991) recomienda obtener almenos 50 muestras (pixeles) por tipo de cobertura o de uso del suelo. Y cuando el rea es muy

    grande (Ej. superior a 350000 hectreas) o el nmero de categoras sea superior a 12, el tamaode muestra por categora debe incrementarse a 75 o 100. Dado que el objetivo del tamao de lamuestra es reflejar la importancia y complejidad del rea a muestrear es perfectamente vlidoaumentar el tamao de la muestra en aquellas reas de mayor variabilidad o de mayorimportancia en detrimento de reas menos variables o menos importantes. Por ejemplo, puedenubicarse menos muestras en plantaciones forestales, cuerpos de agua o pastos(reas menosvariables).

    Esquema de muestreoUna vez determinado el nmero de muestras requerido para lograr un error predeterminado

    debemos decidir cul esquema de muestreo utilizar para asignar las muestras. Existen mltiplesdiseos de muestreo que pueden utilizarse para investigar la distribucin espacial de fenmenosnaturales y socioeconmicos. Las figuras 13 y 14 y el cuadro 11 ilustran los posibles esquemasdisponibles al investigador, entre los cuales tenemos: simple al azar, estratificado, sistemtico,estratificado, sistemtico no alineado, anidado o multifsico (Fig.15) y multifactor (Haggett,Cliff y Frey, 1977). La investigacin realizada por diversos autores (Hord and Brooner, 1976;Ginevan, 1979; Rhode, 1978; Fitzpatrick-Lins, 1991, Congalton, 1988b) indica que el muestreosimple al azar (sin reemplazo) y el estratificado al azar brindan resultados satisfactorios. Engeneral, el muestreo simple al azar tiende a submuestrear aquellas reas pequeas a menos que eltamao de la muestra sea muy grande y por lo tanto es preferible utilizar un muestreoestratificado al azar; o en su defecto seleccionar el nmero de puntos de muestreo por tipo decobertura en forma independiente.

    Al seleccionar el esquema de muestreo debemos considerar los supuestos bajo los cualesopera el ndice que se desea evaluar. Por ejemplo, el ndice Kappa asume un modelo de muestreomultivariado y slo el muestreo simple al azar cumple con este supuesto. El efecto de otrosesquemas de muestreo sobre la veracidad de los datos es desconocido.

    Otra consideracin prctica en el esquema de muestreo es que en la mayora de los casos noes posible realizar el trabajo de campo dos veces. La primera vez para entrenar al clasificador(Ej. foto intrprete o computadora) y la segunda para obtener la informacin necesaria paraevaluar la exactitud de la clasificacin. Sin embargo, cuando esto sea posible, se puede utilizaren la primer fase un muestreo sistemtico para colectar informacin que pueda utilizarse tanto enla fase de entrenamiento como en la de evaluacin de errores de clasificacin. Una vez elaboradoel mapa se realiza una segunda fase de muestreo estratificado al azar para obtener muestrasadicionales para cada estrato.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    31/49

    29

    Figura 13: Diseos estadsticos para la colecta de datos. Adaptado de Haggett, Cliff y Frey,1977.

    Figura 14: Diseos de muestreo. A. Aleatorio. B. Estratificado al azar. C. Sistemtico. D.Sistemtico estratificado no alineado.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    32/49

    30

    Figura 15: Diseo de muestreo anidado. A. rea de muestreo. B. Nivel 1. C. Nivel 2 D. Nivel 3E. Nivel 4: Muestreo aleatorio en reas seleccionadas en el nivel 3.

    Cuadro: 11 : Caractersticas de los diseos de muestreo.

    Diseo Mecanismo de seleccin de la muestraAleatoriosimple

    Un grupo de n elementos es seleccionado al azar de entre una poblacin de Npuntos definidos por un par de coordenadas.

    Tiende a subestimar el rea de los atributos poco representados en la poblacin.

    Es un mtodo de seleccin probabilstica que permite el clculo del error demuestreo.

    Puede resultar imprctico en reas de difcil acceso.

    Estratificadoconseleccinaleatoria de

    muestras

    La poblacin a muestrear es dividida en estratos o segmentos naturales ( Ej.Pasto, bosque, manglar, etc.) y los elementos a muestrear son seleccionados alazar en cada estrato.

    Es un mtodo muy utilizado para la validacin de clasificacin de imgenes yen general en el muestreo de fenmenos de naturaleza espacial.

    Es un mtodo de muestreo probabilstico y por lo tanto tambin permite estimarel error asociado al muestreo.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    33/49

    31Cuadro 11: Caractersticas de los diseos de muestreo. Cont.

    Diseo Mecanismo de seleccin de la muestraDiseo basadoen factores

    El rea es dividida en estratos basados en una combinacin de los factoresrelevantes para el patrn de uso de la tierra en el rea de estudio. Un diseo de

    muestreo simple al azar es utilizado para seleccionar las muestras en cadaestrato.Muestreosistemtico

    En este caso el rea a muestrear es dividida en n intersecciones utilizando unacuadrcula regular. El origen de la cuadrcula es definida en forma aleatoria.Una vez definido dicho punto se seleccionan las reas a muestrear.

    Es un mtodo de muestreo no probabilstica y por lo tanto no es posible utilizarla teora estadstica tradicional para calcular el error de muestreo.

    Cuando la variable de inters muestra una distribucin aleatoria puedenutilizarse las frmulas del muestreo simple al azar para estimar el error de

    muestreo.Diseoanidado,jerrquico omultifsicos

    En este caso la poblacin es dividida en sub muestras que a su vez sesubdividen en otras unidades de muestreo ms pequeas. Una tabla denmeros al azar es utilizada para seleccionar las unidades a muestrear en cadanivel.

    Este diseo es til para investigar el efecto de la escala en el fenmeno enestudio; su costo es bajo pero su error de muestreo es alto.

    Estratificadosistemtico noalineado

    Este es un diseo de muestreo compuesto que incluye una subdivisin previade la poblacin a muestrear y luego la seleccin de muestreas utilizando undiseo de muestreo sistemtico no alineado. El rea se divide en cuadrados o

    subreas (estratos); luego utilizando una tabla de nmeros al azar se seleccionael primer punto de muestreo para el cuadrado de la esquina inferior izquierdadel rea de estudio. Luego se seleccionan los otros puntos a muestrear en losotros cuadrados de la hilera inferior del rea de estudio. Esto se logramanteniendo el eje Xconstante y seleccionando valores para el eje Y. Una vezcompletado el muestreo en la hilera inferior se realiza el mismo procedimientopero para la primer columna. En este caso se mantiene constante el valor deleje Y y se seleccionan valores para el eje X. Una vez definidos los puntos amuestrear tanto en la primer columna como en la primer hilera debeseleccionarse el punto de inicio del cuadrante No.2. Esto se hace utilizando elvalor de Y del primer punto seleccionado en la hilera y el valor de X de lacolumna. El procedimiento se repite hasta completar el rea a muestrear.El diseo ofrece las ventajas del diseo estratificado con la facilidad de trabajodel diseo sistemtico.

    El diseo sistemtico no alineado elimina los errores derivados de un factorperidico en los datos a muestrear.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    34/49

    32Diseos de muestreo con ArcView GIS

    Existen varias extensiones que permiten realizar un muestreo aleatorio; sin embargo en estaocasin he decidido ilustrar el uso de la extensin NR Random Sampling Toolscreada porTimothy N. Loesch del Departamento de Recursos Naturales de Minnesota, USA(www.dnr.state.mn.us, 2002). Al activar la extensin usted observar un nuevo men (Sampling

    Tools) con las siguientes opciones:

    Random Point Sample: Esta opcin permite crear puntos de muestreo al azar para un tema depolgonos.

    Systematic Point Sample: Esta opcin permite crear un muestreo sistemtico para un tema depolgonos.

    Transects: Esta opcin permite crear transeptos aleatorios para un tema de polgonos.

    Muestreo aleatorioPara el muestreo aleatorio usted debe definir los siguientes parmetros:

    ?? Number of Sample Points: nmero de puntos de muestreo.?? Point Sample Radius (m): Radio de cada punto?? Sample Spacing (Min = Radius(2): Espaciado mnimo entre puntos

    Una vez definidos estos parmetros el programa crear untema de puntos aleatorios utilizando como rea de muestreoel polgono activo. Si usted desea realizar un muestreo

    aleatorio estratificado, primero divida el rea de estudio enestratos y luego utilice la opcin de muestreo aleatorio conlos polgonos de cada estrato.

    A continuacin se ilustra el uso de la extensin en laseleccin de sitios de muestreo para un rea de 5*4Km(2000ha) ubicada al norte del pueblo de Santa Elena,Guanacaste.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    35/49

    33

    Figura 16: Distribucin de 100 puntos de muestreo al azar. Extensin dnrsample.avx.

    Figura 17: Ubicacin de los 100 puntos de muestreo al azar sobre una imagen del ETM+ deLandsat de junio del 2001. Los polgonos achurados indican el rea de bosque reportada por elestudio del CCT-CIEDES para 1996-97.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    36/49

    34

    Figura 18 : Ubicacin de los 100 puntos de muestreo al azar sobre el mapa de cobertura forestalpara 1996-97 realizado por el CCT-CIEDES (1998).

    Figura 19: Ubicacin de los 100 puntos de muestreo al azar sobre el mapa de uso-cobertura delsuelo para 1996-97 realizado por el SINAC (2000).

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    37/49

    35

    Figura 20: Puntos de muestreo ubicados en bosque en el mapa de uso cobertura del SINAC(2000). El 52% de los puntos corresponde a bosques.

    Figura 21: Puntos de muestreo ubicados en pasto en el mapa de uso cobertura del SINAC (2000).El 20% de los puntos corresponde a pasto.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    38/49

    36

    Figura 22: Puntos de muestreo ubicados en reas sin datos (nubes, sombras) en el mapa de usocobertura del SINAC (2000). El 28% de los puntos corresponde a no datos .

    Figura 23: Puntos de muestreo ubicados en bosque en el mapa de cobertura forestal del CCT-CIEDES (1998). El 91% de los puntos corresponde a bosques.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    39/49

    37

    Figura 24 : Puntos de muestreo clasificados como bosque por el autor para una imagen ETM+ deLandsat de junio del 2001. El 81% de los puntos corresponde a bosques.

    Figura 25: Coordenadas planas (Lambert Norte) para cada uno de los puntos de muestreo. Elusuario(a) puede utilizar dichos valores para navegar hasta los puntos de muestreo en el rea deestudio. Si desea mayor informacin sobre este tema se le remite al documento Navegacin conel geoposicionador: Practica (Fallas, 2001a).

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    40/49

    38Muestreo sistemticoPara el muestreo sistemtico usted debe definir los siguientes parmetros:

    ?? Spacing X (m): Espaciamiento en el eje X (Oeste-Este)?? Spacing Y (m): Espaciamiento en el eje Y (Norte-Sur)?? Minimum distance from polygon Boundary: Distancia mnima que desea dejar como

    borde (esta rea no ser muestreada). Puede considerarse como el rea bajo el efecto deborde en el rea de estudio.

    Una vez definidos estos parmetros el programa crear un tema de puntos con un espaciamientouniforme utilizando como rea de muestreo el polgono activo. Si usted desea realizar unmuestreo sistemtico estratificado, primero divida el rea de estudio en estratos y luego utilice laopcin de muestreo sistemtico con los polgonos de cada estrato.

    En este caso se configur el programa para que seleccionara puntos con una separacin de 300mpor 300m. A continuacin se muestra el diseo de un muestreo sistemtico con una separacinde 500m entre puntos.

    Figura 26 : Muestreo sistemtico con una separacin de 500m entre puntos. Total de puntos demuestreo 63.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    41/49

    39Muestreo en transeptosPara el muestreo por transeptos aleatorios usted debe definir los siguientes parmetros:

    Min Transect Length: Longitud mnima que puede tener un transepto.Max Transect Length: Longitud mxima que puede tener un transepto.Sample Width: Area a cada lado de la lnea de muestreo; el rea total a muestrear es igual

    a dos veces el ancho del transepto.Min. Transect Spacing: Distancia mnima entre dos transeptos; el programa utiliza poromisin el valor 2*Radio de muestreo

    Allow transect Overlap: Transeptos pueden traslaparse.

    La intensidad de muestreo puede definirse como un porcentaje del rea como un nmero de

    transeptos.

    Una vez definidos estos parmetros el programa crear un tema de lneas con las caractersticasdefinidas por el usuario(a) para el rea de muestreo definida por el polgono activo. Si usted

    desea realizar un muestreo estratificado, primero divida el rea de estudio en estratos y luegoutilice la opcin de muestreo por transeptos con los polgonos de cada estrato.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    42/49

    40

    Figura 27: Transeptos aleatorios de 30 metros de ancho y de largo entre 100 y 200m con unaseparacin mnima entre transeptos de 500m.

    Figura 28: Transeptos aleatorios de 500m por 60metros de ancho con una separacin mnima de500m entre transeptos.

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    43/49

    41Consistencia lgica

    En la seccin anterior se ha discutido los procedimientos utilizados para evaluar la exactitudde los atributos en un mapa temtico. Sin embargo tambin es necesario evaluar su consistencialgica una vez que se ha incorporado a la base de datos digital (cuadro 12). Las bases de datos enun SIG pueden originarse a partir de informacin digital (Ej. imgenes de satlite) de digitar

    informacin analgica (Ej. mapas); y por lo tanto es necesario utilizar un procedimiento quedetecte errores topolgicos (Ej. polgonos que se traslapan); de atributos (Ej. elementos sinetiquetas) y similares. Por ejemplo, en la cartografa tradicional esta labor la realiza el cartgrafoo un evaluador independiente quien colorea cada polgono o lnea para verificar que no existenerrores. En un SIG esta labor la realiza una rutina de computacin basada en la informacintopolgica de cada polgono. Sin embargo siempre es necesario que el responsable de la base dedatos realice pruebas independientes para asegurar la consistencia lgica de las capas de datos.Por ejemplo, puede realizarse una prueba de punto en polgono para asegurarse que los ros seencuentren en sus planicies de inundacin o que los manglares se encuentran en reas de costa.

    Cuadro 12: Evaluacin de la veracidad de los atributos en un sistema analgico y en uno digital.

    Cartografa analgica Cartografa digitalLa evaluacin es realizada por el cartgrafo oun evaluador independiente quien coloreacada polgono o lnea para verificar que noexisten errores

    Proceso de impresin de mapas por niveles ocapas de datos.

    Uso de tcnicas estadsticas de muestreo (Ej.censo, muestras)

    Labor realizada por una rutina decomputacin basada en la informacintopolgica de cada polgono.

    Es necesario que el responsable de la base dedatos realice pruebas independientes paraasegurar la consistencia lgica de las capas dedatos.

    Uso de tcnicas estadsticas de muestreo (Ej.censo, muestras)

    Totalidad de informacinLa totalidad de informacin es el tercer componente en los estndares para datos cartogrficos

    digitales propuestos para los Estados Unidos (DCDSTF, 1988). Este componente del estndarverifica que la totalidad de la informacin contenida en el material fuente haya sido incluido enla base de datos digital. Por ejemplo, al digitar un mapa con 100 parcelas, se crear una base dedatos con 100 registros, uno por parcela. Para asegurarse que la totalidad de las parcelas han sidoregistradas puede observarse el nmero de registros totales en la base de datos. Cualquierdiferencia entre el nmero de parcelas reales y las reportadas por la base de datos se catalogacomo un error. Otro aspecto a evaluar como parte de este componente del estndar es laveracidad de las unidades mnimas mapeables y los anchos mnimos estipulados en ladocumentacin que acompaa el mapa temtico.

    Reporte de los resultadosCuando el mapa ha sido evaluado y cumple con los estndares horizontales y verticales debe

    indicarse en la leyenda del mapa. Si el mapa es evaluado pero no cumple con los estndares debe

  • 8/3/2019 Curso Geodatabase ArcGis93 Indice

    44/49

    42omitir todo informacin al respecto en la leyenda. En el caso de mapas temticos debe indicarseel valor de Kappa y la matriz de confusin. El principio de Reporte de calidadfue adoptado en1988 por el Grupo de Trabajo del Comit Nacional de Estndares en Datos CartogrficosDigitales de los Estados Unidos y fue incluido en los estndares nacionales para el intercambiode datos cartogrficos digitales (DCDSTF, 1988). El concepto de reporte de calidad tambin se

    encuentra presente en las propuestas de estndares de los Britnicos y los Franceses, entre otrospases (Chrisman, 1991).

    Errores, estndares y calidad de la informacin : Que hacer?A pesar de los avances logrados en el rea de los SIG's todava el concepto de error no est

    presente en la mayora de sus usuarios(as) ni en sus bases de datos (Chrisman, 1991). La utilidadde la informacin digital depender cada vez ms de su calidad y por lo tanto es esencialestablecer normas y procedimientos que le permitan al usuario determinar s un conjunto dedatos cumple con las normas de calidad que requiere su proyecto o uso particular. Losprincipales factores que impiden el uso de los estndares no son de ndole tcnico sino ms biende naturaleza econmica, logstica y de cultura de trabajo. Todo usuario(a) de un SIG debepromover el uso de estndares en su institucin y a la vez tratar en la medida de lo posible deadherirse al principio deReporte de calidad.

    Documentacin de los geodatosLa elaboracin de una geobase de datos digital es una tarea que consume un alto porcentaje

    del tiempo y de los recursos humanos en cualquier proyecto. Por esta razn su documentacindebe ser tan detallada como sea posible para asegurar su confiabilidad y valor en el futuro. Acontinuacin se ofrece, a manera de ejemplo, una lista de los aspectos que diversos autoressugieren documentar (Chang, et. al., 1992; Fulton, 1992; Hewitt, et. al. 1992; Wright and Yee,1992).

    Tema: Indica el nombre que recibe la capa de datos. Se sugiere elaborar previamente una listanormalizada de capas temticas; esto facilitar la comunicacin tanto entre instituciones comoentre usuarios de una misma institucin.

    Descripcin: Breve descripcin de la capa de datos.

    Referencia: De dnde se obtuvo la capa de datos? Debe proveerse suficiente informacin paraque cualquier otra persona puede tener acceso a los datos originales. Esta es una informacinsimilar a una ficha bibliogrfica.

    Fuente de informacin: Indicar persona y direccin de la institucin que puede contactarse paraadquirir una copia del dato original. Incluir nmero de telfono, fax, email, etc.

    Revisin: Cdigo que expresa la ltima fecha en que fu


Recommended