+ All Categories
Home > Documents > Pressupostos teoricos e metodolgicos - RUN

Pressupostos teoricos e metodolgicos - RUN

Date post: 29-Jan-2023
Category:
Upload: khangminh22
View: 0 times
Download: 0 times
Share this document with a friend
369
Maria Rute Vilhena Costa Pressupostos teoricos e metodolgicos para a extracgo automtica de unidades terminolgicas multilexmicas Universidade Nova de Lisboa Faculdade de Cincias Sociais e Humanas LiSboa Agosto 2001
Transcript

Maria Rute Vilhena Costa

Pressupostos teoricos e metodolgicos

para a extracgo automtica

de unidades terminolgicas multilexmicas

Universidade Nova de Lisboa Faculdade de Cincias Sociais e Humanas

LiSboa Agosto 2001

Title
Creator
Type
Publisher
Date
Language
Description
Subject

Mana Rute Vilhena Costa

Pressupostos tericos e metodolgicos

para a extrac?o automtica

de unidades terminologicas multilexmicas

V

Dissertaco para obtengo do grau de Doutor

em Linguistica. especialidade de Lexicologia- Terminologia

realizada sob a onentaco da

Professora Doutora Mana Teresa Rijo da Fonseca Lino

'O '.::

Universidade Nova de Lisboa Faculdade de Cincias Sociais e Humanas

Lisboa. Agosto 2001

55300

Aos meus pais

Agradecimentos

Ao terminar este trabalho no posso deixar de agradecer a todos os que contribuiram

para a sua realizago, cujo contnbuto foi essencial. dentro e fora do mbito acadmico.

Professora Doutora Mana Teresa Rijo da Fonseca Uno. pela orientago da

dissertago. pela oportumdade de discutir ideias obtendo sugestes e esclarecimentos de

grande valor. pela total confianga e a liberdade de escolha cientfica que sempre me concedeu;

pela aposta que um dia fez em mim; pelos seus ensinamentos ao longo da minha progresso

universitna e pela ligo de humamsmo que quotidianamente me transmite, o meu muito

obngada.

Professora Doutora Maria Francisca Xavier e Professora Doutora Maria de Lourdes

Crispim agradego-lhes o apoio incondicional candidatura a uma Bolsa PRODEP.

Ao Professor Doutor Didier Bourigaut agradego ter aceite deslocar-se a Lisboa com o

intuito de debater questes cientificas de grande importncia para o desenvolvimento desta

dissertago.

Ao Eng Pedro Santos agradego a grande disponibilidade para o apoio ao nivel da

programago informtica.

Dr3. Helena Manuelito. pela leitura minuciosa que fez deste trabalho, os meus muito

snceros agradecimentos

Dr3. Raquel Silva agradego: para alm da amizade, todo o apoio. disponibilidade e

vontade incansvel para ajudar.

Dr* Ftima Ferreira agradego a atengo sempre demonstrada, nomeadamente para

colaborar nas obrigages comuns de relages universitnasinternacionais.

Ao Dr. Paulo Morgado Sousa e ao Dr Jos Carlos Ferreira reconhego e agradego o

esprito de solidariedade que sempre demonstraram.

Mana Joo Patinha agradego o precioso e contnuo apoio demonstrado em todas as

circunstncias da vida.

Esta dissertaco foi elaborada ao abngo da Medida 5-Acco 5.2. Concurso PUblico n1 PRODEP/96

NDICE

Introduco

1 . Objectivos

2. Apresentaco da dissertago

Capitulo I - Corpora

5

12

16

45

48

1. Lingusticas de corpora16

1 . 1 Definico de lingustica de corpora1 6

1.2 Arquivo e corpus19

2. Tipologia de corpora26

2.1 Corpora de textos integrais e corpora de extractosde textos 28

2.2 Corpora comparativos e corpora paraielos29

2.3 Monitor corporaou

2.4 Corpora de referncia31

2.5 Corpora de especialidade e corpora especiais35

3. Corpora anotados37

3.1 SGML39

3.2 TEI

3.3 CES

3.4 Etiquetagem gramaticalJU

Captulo II - Constituico de corpus57

1 . Comunidade cientifica, produtora de textos de especialidade57

2. Texto de especialidade60

2.1 Texto e discurso

2.2 Contextos67

70

2.3 Intervenientes

3. Tipologia de tipos ou tipologia de gneros^

4. Constituigo do corpus em Detecgo Remota

4.1. Definigo da rea de especialidade em anlise: Detecco Remota

4.2. Constituigo de tipologias

4.2.1 . Tipologia de tipos de discurso

4.2.2. Tipologia de gneros de discurso

90

90

96

96

102

1

Captulo III - Denominaco: expresses nominais multilexmicas107

1071. Denominagao

2. Expresses nominais multilexmicas113

1132.1. Lexias

1172.2. Sinapse

2.3. Nomecomposto

2.4. Colocago128

2.5. Frasemas145

1 df\

3. Fraseologia

Captulo IV - Etiquetador gramatical automtico: EtiqueLex156

1 . Tratamento do corpus informatizado1 56

2. Tabela de etiquetas158

3. Constituigo dos dicionrios166

3.1. Dicionrio de formas simples flexionadas1 66

3.1.1. Desdobramento de formas166

3.1.2. Variantes ortogrficas

3.2. Dicionrio de locuges

3.3. Dicionrio de unidades terminolgicas multilexmicas da Detecgo Remota 175

4. Etiquetadorgramatical: EtiqueLex178

5. Tipologia de matrizes terminognicas1 82

5.1. Tipologia elementar182

5.2. Anlise da composigo das unidades terminolgicas multilexmicas 186

1 Q7

5.3. Tipologia de base

168

171

5.4. Dicionrio de estruturas tipo200

Captulo V - Extractor automtico de unidades terminolgicas

multilexmicas: ExtracTerm203

203

203

1 . Concepgo do ExtracTerm

1.1. Aplicago do dicionrio de tipologias

907

1 .2. Anlise dos resultados

9 1 R

2. Regras de desambiguago

2.1. Preposigo, artigo definido femmmo singular e pronomes219

2

2.1.1. Regras lingusticas de aprendizagem221

2.2. Adjectivo e particpio passado ps-nominal. 224

2.2.1. Regras lingusticas de aprendizagem226

2.3. Nome e adjectivo 236

2.3.1. Regras lingusticas de aprendizagem238

3. ExtracTerm: utilizago das regras de aprendizagem 240

3.1. Anlise dos resultados 244

3.2. Teste do ExtracTerm sobre um corpus alargado 247

3.2.1. Anlise dos resultados 248

Concluso 251

Bibliografa 258

Anexos 301

Anexo 1 - Dicionrio de formas flexionadas 303

Anexo 2 - Dicionrio de locuges 314

Anexo 3 - Dicionrio de unidades terminolgicas da detecgo remota 323

Anexo 4 - Texto etiquetado com o EtiqueLex, sem a aplicago de regras de 326

desambiguago

Anexo 5 - Sequncias extradas com ExtracTerm a partir de texto etiquetado 332

no desambiguado

Anexo 6 - Texto etiquetado com o ExtracTerm. com a aplicago de regras de 339

desambiguago

Anexo 7 - Sequncias extradas com ExtracTerm a partir de texto etiquetado 345

desambiguado

Anexo 8 - Texto etiquetado com ExtracTerm, a partir de novo corpus, com 351

aplicago de regras de desambiguago

Anexo 9 - Sequncias extradas com ExtracTerm a partir de texto etiquetado 358

desambiguado

3

Introdu^o

1. Objectivos

2. Apresentago da dissertago

Introdugo

1. Objectivos

0 tratamento automtico da lngua produzida em contexto de especialidade

o pano de fundo que subjaz reflexo terica e metodolgica apresentada

nesta dissertago.

0 objectivo da nossa investigago consiste, desta forma. na formulago dos

pressupostos tericos da Lexicologia e da Terminologia que esto na base da

concepgo de um programa informtico destinado ao levantamento automtico

a partir de descriges de anlises de carcter linguistico de unidades

terminolgicas multilexmicas.

Com efeito, desenvolvemos neste trabalho uma investigago que, baseada

em critrios exclusivamente lingusticos permite a identificago automtica de

unidades terminolgicas multilexmicas da rea de especialidade da Detecgo

Remota.

No momento da concepgo do extractor, tommos conscincia da

necessidade da criago de um etiquetador que est na base do primeiro. Deste

modo, concebemos dois programas: o EtiqueLex e o ExtracTerm. O primeiro

atribui etiquetas gramaticais aos lexemas do corpus. Funcionando sobre o

corpus etiquetado, o ExtracTerm extrai unidades terminolgicas multilexmicas,

partindo de regras de reconhecimento e de regras de aprendizagem,

concebidas e fundamentadas a partir da observago do corpus.

5

0 EtiqueLex uma componente indispensvel do ExtracTerm, sem a qual

este ltimo no funciona. No obstante. o EtiqueLex pode ser utilizado

exclusivamente para a etiquetagem, sem que seja necessrio proceder-se ao

levantamento automtico de termos, gozando, assim, de autonomia face ao

extractor.

A emergncia e o desenvolvimento de uma abordagem lexicolgica

Terminologia coloca-nos no centro dos debates actualmente em curso. Neste

mbito, levantam-se questes como as seguintes: o que distingue uma palavra

de um termo? Que metodologia(s) adoptar em Terminologia?

Actualmente, a Terminologia uma rea de especialidade no seio da

Lingustica que estuda o comportamento lingustico das unidades

terminolgicas, recorrendo aos contextos e, de forma mais abrangente, aos

textos em que ocorrem.

Neste debate entram em confronto duas ideias distintas: por um lado, a

perspectiva que defende uma abordagem normativa terminologia, por outro, a

que encara a terminologia numa perspectiva descritiva.

A doutrina wsteriana apologista da normalizago terminolgica, porque a

univocidade dos termos uma condigo necessria comunicago entre

especialistas, sendo a redugo da sinonmia e da ambiguidade um dos

principais objectivos.

Foi nos anos trinta que Wuster levou a cabo trabalhos terminolgicos dando

especial relevo organizago sistemtica das terminologias, incrementando a

definico de postulados fundamentais para o desenvolvimento de mtodos de

trabalho. Porm, na URSS. pela mo de Lotte, responsvel do Comit de

6

Normalizago Terminolgica do Instituto de Normalizago do Concelho dos

Ministros da URSS e membro da Academia das Cincias, que a terminologia

nasce como cincia (cf. Rondeau, 1983).

Em consequncia das preocupages metodolgicas de Wuster e das

preocupages tericas de Lotte, criado um organismo, o ISA - International

Organization for Standardization, cujo objectivo o favorecimento do comrcio

intemacional, desenvolvendo a normalizago dos produtos e dos processos.

Os membros fundadores deste organismo so a Franga, a Gr-Bretanha, a

Alemanha e a URSS. A 2a Guerra Mundial interrompe as actividades da ISA,

mas em 1946 nasce a ISO - International Organization for Standardiaztion,

sendo criada em 1951 o Comit Tcnico 37 (TC 37) que, reunindo pela

primeira vez em 1952, tem por fungo a normalizago da Terminologia e dos

seus princpios metodolgicos.

A metodologia preconizada pelos seguidores de Wuster parte da anlise do

objecto para chegar denominago, uma vez que , essencialmente, atravs

desta que os especialistas veiculam conhecimentos. 0 conceito est no centro

da metodologia onomasiolgica, desempenhando a denominago a fungo de

etiqueta: [...] /a dmarche terminologique, au contraire de la dmarche

linguistique. ne part pas d'une appellation pour dcouvrir l'tre ou le groupe

d'tres reprsent par cette appellation: elle procde l'inverse, partir des

entits pour tudier leurs dnominations. (Rondeau, 1983:12).

A normalizago do termo passa pela normalizago do conceito,

pressupondo tal abordagem a sua universalidade, uma vez que para a ISO os

conceitos no esto ligados a cada uma das lnguas individualmente. Tal como

7

refere Lerat (1995), os linguistas no podem aceitar esta perspectiva, porque:

[...] les notions sont lies aux conceptualisations, donc aux locuteurs, leurs

cultures et leurs langues (Lerat.1995 17).

A rpida evolugo da tcnica, das cincias e da tecnologia fazem com a

conceptualizago dos factos cientficos no seja universal, porque dependente

de factores sociais e culturais evidentes. Por esta razo, linguistas como

Bjoint e Thoiron rejeitam a doutrina wusteriana, perspectivando a

normalizago como um processo artificialmente construdo, com vista a atingir

o ideal da biunivocidade: um termo para um conceito: [...] bref de la langue

fabrique de toutes pices et contrle par la communaut linguistique pour

fagonnerle monde (Bjoint; Thoiron, 2000:6).

Do ponto de vista terico e metodolgico, defendemos uma abordagem

descritiva Terminologia. Numa perspectiva lingustica, a automatizago

requer no so a descrigo do comportamento lingustico das denominages em

situago real. como tambm a descrigo dos contextos em que tais

denominages ocorrem.

A evolugo da capacidade de armazenamento da informago em suporte

electrnico, bem como o aumento crescente dos recursos linguisticos

plurilingues informatizados contribuem para as viragens metodolgica e terica

que neste momento atingem claramente a terminologia.

Os textos eschtos que compem os corpora so o meio mais efectivo para

os especialistas transmitirem e divulgarem o seu conhecimento quer no seio da

comunidade cientfica a que pertencem quer fora dela. Tais textos so um

potencial inegvel para o levantamento de terminologias, que reflectem o

estado do conhecimento de uma determinada comunidade

A quantidade de produgo cientfica textual, tal como a facilidade de aceder

a textos informatizados, enorme, levando o terminlogo a reequacionar as

suas metodologias. Assim, o texto passa a ser o centro das suas

preocupages. 0 estudo das denominages, com recurso ao contexto

lingustico em que estas ocorrem, leva-nos a preconizar a existncia de uma

terminologia textual: Les applications de la terminologie sont le plus souvent

des applications textuelles (traduction, indexation, aide /a rdaction); la

terminologie doit venir des textes pour mieux y retourner. C'est parce

qu'elle n'estjamais dlie du texte qu'on parle de terminologie textuelle. C'est

dans les textes produits ou utiliss par une communaut d'experts, quise sont

exprimes, et donc accessibles, une bonne partie des connaissances

partages de cette communaut, c'est donc par l qu'il faut commencer

l'analyse. (Bourigault, Slodzian, 1999:30).

Em nosso entender, esta abordagem vem manifestamente contribuir para

um desenvolvimento das anlise e descrigo em lingustica, permitindo um

desenvolvimento renovado de gramticas e dicionrios.

O levantamento e organizago da terminologia , actualmente, uma

necessidade politica, econmica e industrial ao servigo da inovago e da

Sociedade da Informago e do Conhecimento, mbito em que as aplicages

informatizadas so concebidas para fins especficos, sendo a identificago do

pblico alvo uma prioridade. Deste modo. uma denominago tem uma acepgo

reconhecida e identificada pelos indivduos pertencentes a uma comunidade

9

cientfica especfica. sendo que: /_a tche de description lexicale est un travail

de fixation, de stabilisation. d'homognisation d'une signification, dont le

rsultat est le terme. [...] C'est ainsi qu'on parle de normalisation, non plus au

sens que la planification terminologique donne au mot, mais au sens ou la

communaut d'experts entrine des signifis comme des termes du

domaine. (Bourigault, D.. Slodzian, M. 1999:30).

Apesar de os procedimentos metodolgicos propostos e de os

programas informticos desenvolvidos poderem servir qualquer rea de

especialidade, podemos interrogar-nos sobre a pertinncia da escolha dos

textos de Detecgo Remota como corpus de experimentago do nosso

trabalho.

Em primeiro lugar, a comunidade cientfica e os textos produzidos nesta

especialidade apresentam uma grande identidade, mesmo quando as fronteiras

tcnicas e cientficas dos discursos da Detecgo Remota evidenciam alguma

interdisciplinaridade com outros ramos do saber, nomeadamente com a Fsica,

a Matemtica, a Geografia e as Cincias da Terra (cf. Captulo 3). Esta

caracterstica faz com que o corpus constitudo seja seguramente

representativo do universo de discursos produzidos.

Em segundo lugar. a Detecgo Remota assistiu, em Portugal, nos

ltimos dez anos, a um desenvolvimento sem precedentes, quer ao nvel do

ensino quer da investigago. Esse facto traduziu-se na produgo exponencial

de textos de especialidade, nomeadamente a partir de meados da ltima

dcada, Assim, foi-nos possvel confrontar o corpus inicial com um corpus

final de referncia, com o objectivo de testar e de ennquecer as regras

10

criadas -

por via do enriquecimento tcnico e cientfico dos prprios discursos -,

com vista subsequente expehmentago dos programas informticos

desenvolvidos.

Em terceiro lugar, a comunidade cientfica da Detecgo Remota em

Portugal tem vindo a reconhecer a necessidade de harmonizago

terminolgica. no sentido de dar resposta s exigncias dos discursos

cientfico-pedaggicos. So um exemplo dessa preocupago, as concluses do

Workshop ROT'2000, subordinado ao tema 0 Ensino da Detecgo Remota

em Portugal, que reuniu, em Lisboa, cerca de 70 especialistas em ensino

destas matnas. Entre outras concluses, esta reunio salientou a necessidade

de harmonizago lingustica de termos, por forma a aumentar a qualidade do

saber produzido e ministrado nas universidades portuguesas.

Em quarto lugar. a Detecgo Remota detm um lugar de destaque entre

as Tecnologias de Informago Geogrfica para a Sociedade da Informago. A

difuso de inovago, que est inevitavelmente associada Sociedade da

Informago, requer qualidade; essa qualidade passa no s pelo

enriquecimento dos contedos disponibilizados via Internet - disso exemplo o

projecto GEOCID. promovido pela Centro Nacional de Informago Geogrfica

(CNIG), e o Programa para a Sociedade da Informago (POSI), em

desenvolvimento ao abrigo do Quadro Comunitrio de Apoio (QCA III) - como

tambm pela utilizago de um referencial tcnico e cientfico aperfeigoado do

ponto de vista terminolgico.

11

2. Apresentago da dissertago

A presente dissertago desenvolve-se em cinco captulos. Nos trs

primeiros expomos os pnncipais pressupostos tericos que fundamentam e

justificam as opges e onentages metodolgicas que apresentamos nos dois

ltimos captulos.

Captulo 1: Neste captulo, fazemos uma incurso pelas lingusticas de

corpora. Definimos o conceito de corpus, distinguindo-o do de arquivo, antes de

abordarmos os corpora informatizados. Em ntima associago com a nogo de

corpora informatizados. damos conta das mais recentes tcnicas de anotago,

ou seja, das diversas formas de acrescentar informago metalingustica aos

lexemas, sublinhando particularmente o papel da etiquetagem gramatical.

Captulo 2: Os corpora so constitudos por textos de especialidade

produzidos por comunidades cientficas. Descrevemos o que entendemos por

comunidade cientfica, antes de justificarmos. do ponto de vista teorico, a

selecgo dos textos que constituem o corpus em anlise. Debatemos, de igual

forma, os conceitos de texto e de discurso, bem como o papel desempenhado

pelos intervenientes activos e passivos na produgo de textos. Salientamos a

importncia dos contextos lingusticos e extra-lingusticos na constituigo de

tipologias, clarificando, para o efeito. os conceitos de tipo e de gnero.

12

Captulo 3: As denominages que nos interessam identificar e analisar so

as unidades terminolgicas multilexmicas, Neste ponto, debatemos a nogo

de expresses nominais multilexmicas e fazemos uma sinopse de algumas

abordagens lingusticas s expresses nominais. que se reflectem na

diversidade de terminologias utlizadas para as denominar.

Captulo 4: Iniciamos, neste captulo. a exposigo da metodologia que nos

permite proceder ao levantamento automtico de unidades terminolgicas

multilexmicas.

A primeira fase consiste na elaborago de dicionrios: dicionrios de formas

flexionadas, dicionrio de locuges e dicionrios de unidades terminolgicas

multilexmicas da detecgo remota. A todas as formas que os constituem so

atribudas etiquetas metalingusticas. O Etiquelex, etiquetador automtico,

adiciona etiquetas aos lexemas do corpus que consegue identificar.

Com base na observago do corpus etiquetado criamos uma tipologia de

regras elementares e de regras base, que servem de fundamento ao dicionrio

de regras de reconhecimento.

Captulo 5: A partir das regras de reconhecimento, o ExtracTerm, programa

que extrai automaticamente unidades terminolgicas multilexmicas, efectua

um primeiro levantamento automtico.

Com base nos dados observados, estabelecemos regras lingusticas de

desambiguago, que nos permitem elaborar regras de aprendizagem. Com

estas regras, o ExtracTerm opera sobre o texto etiquetado, levantando as

13

ambiguidades, antes de recorrer s regras de reconhecimento, que permitem

um levantamento mais rigoroso das unidades terminolgicas multilexmicas.

Atravs da reflexo terica e metodolgica que expomos nesta

dissertago. esperamos contribuir para a renovago das teorias e metodologias

em Terminologia no mbito do tratamento automtico da lngua de

especialidade.

14

Captulo I

Corpora

1 . Lingusticas de corpora

1 . 1 Definigo de lingustica de corpora

1.2 A rq u ivo e corpus

2. Tipologia de corpora

2.1 Corpora de textos integrais e corpora de extractos de textos

2.2 Corpora comparativos e corpora paralelos

2.3 Monitorcorpora

2.4 Corpora de referncia

2.5 Corpora de especialidade e corpora especiais

3. Corpora anotados

3.1 SGML

3.2 TEI

3.3 CES

3.4 Etiquetagem gramatical

Captulo I - Corpora

1. Lingusticas de corpora

1.1. Definigo de lingusticas de corpora

0 corpus, objecto de estudo que est na origem das lingusticas de corpora,

um lugar de observago que permite a descrigo de actualizages da lngua

organizadas em enunciados, discursos ou textos. Na base da constituigo

destes conjuntos de dados lingusticos esto critnos de selecgo

sistematizados, que facultam a legtima atribuigo do estatuto de corpus a tais

conjuntos de dados.

0 facto de o termo corpus linguistics no ser utilizado nos textos

anteriores a Chomsky, no significa que os corpora no fossem usados e

explorados com a finalidade de anlise lingustica. Assim, recorrer aos corpora

como objecto de anlise no um procedimento inovador. Em 1951, Harris

considerava j o corpus o nico objecto legtimo da lingustica e designava por

lingustica estrutural a investigago que operava, a priori ou a posteriori, com

corpora.

Aarts, por sua vez, considera que o conceito de corpus linguistics no d

conta de uma actividade totalmente nova em lingustica: [...] ifwe take corpus

linguistics as referring to linguistic research based on observed utterances, we

can say that this type of research has a very long history indeed. Only in earlier

days it was simply called linguistics ofphilology (Aarts. 1 990:1 3).

16

Chomsky (1957. 1965) modificou o objecto da lingustica, considerando que

os corpora no poderiam nunca ser entendidos como objectos de anlise teis

para o lingutsta; privilegia, recorrendo introspecgo uma aproximago

racionalista ao objecto, em detrimento de uma aproximago empnca:

Chomsky changed the object of linguistic enquiry from abstract descriptions of

language to theories which reflected a psychological reality, cognitively

plausible models of language (McEnery, Wilson, 1997: 4). Para este autor, os

corpora do conta exclusivamente dos actos de performance, no revelando os

actos de competncia, que podem ser unicamente determinados pelo falante.

No que concerne ao corpus, McEnery e Wilson sintetizam o posicionamento de

Chomsky do seguinte modo: A corpus is by its very nature a collection of

externalised utterances; it is performance data, and such it must ofnecessity be

a poorguide to modelling linguistic competence (1997:5).

Nos anos sessenta, as metodoiogias e as teorias associadas aos corpora

ganham uma nova dinmica. Vnos autores (Aarts, 1990; Leech, 1997; Habert,

1997) consideram esta dcada um marco na histria recente das lingusticas

de corpora: The year of 1961, which more famously saw then first manned

space flight, is the date to which corpus linguistics can look back as the date

when the entreprise now known as corpus linguistics (or more precisly

computer corpus linguistics) came into being (Leech, 1997:1).

a escola anglo-saxnica que populariza o termo corpus linguistics, que

recobre simultaneamente o objecto, bem como as metodologias e as teorias

que se constroem a partir dos corpora. A prpria definigo de corpus

actualizada tendo por referncia o suporte em que este armazenado, o seu

17

formato electrnico, incrementando as perspectivas de anlise: /n the past

thirty-five years. the term corpus has been increasingly applied to a body of

language material which exists in electronic form, and which may be processed

by computer for various purposes such as linguistic research and language

engineering (Leech, 1997:1).

Tambm Sinclair (1996) prope uma definigo de computer corpus,

independente da de corpus : A computer corpus is a corpus which is encoded

in a standardised and homogenous way for openended retrieval tasks. Its

constituent pieces of language are documented as to their origins and

provenance (Sinclair, 1996:6). Tal definigo pressupe, implicitamente, que o

corpus seja entendido como: [...] collection of pieces of language that are

selected and ordered according to explicit linguistic criteria in order to be used

as a sample ofthe language (Sinclair, 1996:6).

0 corpus informatizado pode apresentar-se sob duas formas, isto , na sua

forma bruta (raw corpus) ou anotada. Enquanto que o corpus bruto um

objecto para testar hipteses [...] the test bed for his hypotheses about the

structure ofthe language, which he has expressed in a formal grammar (Aarts,

1990:18), o corpus anotado enriquecido com informago de diversa

natureza: morfolgica. smtctica. semntica, prosdica, crtica, etc, e [...]

serves as a linguistic database for all linguists studying the structure of the

language,[...] (Aarts, 1990:18).

Pensamos, deste modo, que as lingusticas de corpora assumem um duplo

estatuto: por um lado, de sub-disciplina no seio da lingustica, por outro,

funcionam como disciplina auxiliar para todas as restantes disciplinas da

18

lingustica: lt creates textuat databases which have been ennched with

detailed morphological and syntactica information and where possible, with

phonological and semantic information. Within the foreseeable future, every

linguist will be able to make use of such databases. which means he will also

have at immediate numencal data about the use of constructions and sentence

pattems, the realisation ofgrammaticalsentences. etc. (Aarts, 1990:16).

Para que os resultados obtidos a partir de corpora sejam fiveis,

indispensvel que o objecto sobre o qual recaem as nossas hipteses seja

adequadamente definido e delimitado. Com o aumento crescente e variado dos

corpora, surge a necessidade de reflectirmos adequadamente, por um lado,

sobre as caractersticas do corpus merecedor dessa designago, por outro

saber como classificar a diversidade resultante de tal proliferago.

1.2 Arquivo e corpus

Possuir uma colecgo de textos mformatizados no condigo suficiente

para que possamos considerar estar em presenga de um corpus; para o

constituir necessno ter em conta um conjunto de pressupostos tericos e

metodolgicos considerados de importnciafundamental.

Com base nestes princpios, sentimos, numa pnmeira instncia, a

necessidade de distinguir corpus de arquivo, conceitos que, frequentemente,

so usados de forma arbitrria.

Em 1969, Foucault dedica grande parte da sua obra Archologie du

savoin> definigo e compreenso do conceito de arquivo. abordando para o

19

efeito os discursos cientificos caractersticos de cada poca, centrando a sua

reflexo na relago que cada um dos enunciados mantm entre si, com o

objectivo de se concentrar na organizago interna do conhecimento,

secundarizando os contedos particulares veiculados pelo mesmo.

Acredita, assim, que o arquivo /e domaine des choses dites. Para

chegar a esta concepgo de arquivo, Foucault (1969) aborda a questo das

formages discursivas, que define como conjuntos de enunciados,

historicamente demarcados utilizando o mesmo sistema de regras. Para este

autor, a unidade dos enunciados que. segundo ele, se organizam em famlias,

tais como a Medicina, a Economia ou a Biologia, identificvel atravs da

descrigo das dissemelhangas que caracterizam os mesmos, constituindo

sistemas de disperso merentes s formages discursivas: Une telle analyse

n'essaierait pas d'isoler, pour en dcrire la structure interne, des lots de

cohrence; elle ne se donnerait pas pour tche de soupgonner et de porter en

pleine lumire les conflits latents; elle tudierait des formes de rpartition

(Foucault, 1969:52). Foucault recorre ao conceito de formago discursiva para

contornar noges to genricas e abrangentes como as de cincia, ideologia e

teoria (cf. Foucault, 1969:53), que considera, no que conceme as suas

implicages. serem demasiadamente complexas: Dans le cas o on pourrait

dcrire, entre un certain nombre d'noncs, un pareil systme de dispersion,

dans le cas ou entre les objets, les types d'nonciation, les concepts,les choix

thmatiques. on pourrait dfinir une rgularit, [..,], on dira, par convention,

qu'on a affaire une formation discursive (Foucault 1969:53). Assim, a

formago discursiva compreende o conceito de enunciado, cujo espago de

20

comunicago restrito comparativamente ao espago de comunicago da

cincia, entendida aqui na sua acepgo mais ampla.

Desta forma, o conceito de nunciado fundamental para o entendimento do

conceito de arquivo, que Foucault define, no como uma estrutura, mas como

uma fungo : [...] qui croise un domaine de structures et d'units possibles et

qui les fait apparatre. avec des contenus concrets, dans le temps et l'espace

(Foucault, 1969:115). 0 enunciado o lugar onde os signos e as regras

existem e onde so actualizados.

Em Foucault, o sujeito do enunciado uma fungo vazia que, enquanto

entidade singular, desprovido de valor, quando equiparado aos valores de

espago e de tempo, elementos fulcrais na sua teoria para a construgo do

conceito de arquivo: [...] le sujet de l'nonc est une fonction dtermine, mais

qui n'est pas forcment le mme d'un auteur autre; dans la mesure o c'est

une fonction vide. pouvant tre remplie par des individus, jusqu' un certain

point, indiffrents, lorsqu'ils viennent formuler l'nonc; [...] (Foucault,

1969:123).

As formages discursivas que constituem um arquivo so geradoras de

sistemas discursivos: /_' archive c'est la loi de ce qui peut tre dit, le systme

qui rgit l'apparition des noncs comme vnements singuliers (Foucault,

1969:170). Por sua vez. os ltimos dependem de prticas discursivas, isto :

[...] un ensemble de rgles anonymes, historiques, dtermines dans le temps

et l'espace qui ont dfini une poque donne. et pour une aire sociale,

conomique, gographique ou linguistique donne, les conditions d'exercice de

la fonction nonciative (Foucault, 1969:153). 0 arquivo . deste modo, um

21

lugar aglomerador, que permite o acesso ao sistema geral da formago e da

transformago dos enunciados pertencentes a formages discursivas.

A fungo do arquivo situa-se entre a lngua e o corpus: Entre la langue qui

dfinit le systme de construction des phrases possibles. et le corpus qui

recueille passivement les paroles prononces, l'archive dfinit un niveau

particulier: celui d'une pratique qui fait surgir une multiplicit d'noncs comme

autant d'vnements rguliers, comme autant de choses offertes au traitement

et la manipulation (Foucault, 1969:171). Assim, no existe, em momento

algum, identificago entre arquivo e corpus, caracterizado o primeiro como um

lugar de actualizages e o segundo como um repertrio passivo de palavras

ditas.

0 que motiva Foucault, o objectivo de compreender e de descrever as

leis que regem os discursos de especialidade, para comprovar que a unidade

destes advm de irregularidades que esto elas prprias sujeitas a regulago:

Je voudrais montrer que ces units forment autant de domaines autonomes,

bien qu'ils ne soient pas indpendants, rgls. bien qu'ils soient en perptuelie

transformation. anonymes et sans sujet, bien qu'ils traversent tant d'oeuvres

individuelles (Foucault, 1969). Como afirma o prprio filsofo, a anlise do

discurso que preconiza no pretende dar conta da universalidade de um

sentido, mas sim de uma ordem do discurso independente do seu objecto

material, distanciando-se desta forma do formalismo lingustico (cf. Foucault,

1971:72-73).

Por seu turno, as reflexes explicativas de Maingueneau sobre corpus e

arquivo afiguram-se-nos menos consolidadas. na medida em que do ponto de

22

vista terico, os dois conceitos parecem aproximar-se no discurso deste autor.

No obstante, no que se refere a uma aproximago emprica aos referidos

conceitos. a sua perspectiva assume. porventura, uma vertente mais

operacional. Na qualidade de linguista, Maingueneau entende o arquivo como

sendo constitudo por enunciados que se organizam em corpora: On fera ici

distinction entre l'archive, sa surface discursive et les corpus que cette dernire

permet de dterminer. La surface discursive correspond l'ensemble des

inscnptions relevant d'une mme archive. [...] En fonction de ces objectifs le

chercheur peut extrair de multiples corpus de cette surface discursive (un

corpus de mots. de phrases de tel ou tel type, etc.) qu'il soumet

manipulations, un traitemenh (1991:25). 0 arquivo perfilha o valor de

instituigo, enquanto que o corpus est sujeito a manipulago, decorrendo este

ltimo do primeiro.

A anlise do discurso, domnio da lingustica que Maingueneau pretende

estabilizar, tem por objecto de estudo textos legitimados; a incluso de um

enunciado no arquivo o reconhecimento da sua legitimidade: L'AD [analyse

du discours] s'intresse en effet surtout aux discours autoriss qui, au-del de

leur fonction immdiate, supposent un rapport aux fondements et aux valeurs

(Maingueneau, 1991: 23). Neste aspecto, as posiges de Foucault e de

Maingueneau convergem: tanto um como outro consideram que o arquivo

constitudo por enunciados legitimados no seio de instituiges: [...] [les

noncs sont des] choses qui se transmettent et se conservent, qui ont une

valeur, et qu'on cherche s'approprier: qu'on rpte, qu'on reproduit, et qu'on

transforme: auxquelles on mnage des circuits prtablis et auxquelles on

donne statut dans l'instituion (Foucault, 1969:157).

Enquanto, para Foucault, o arquivo no analisvel no seu todo, uma vez

que, na sua essncia, demasiadamente complexo En sa totalit, l'archive

n'est pas descriptible; et elle est incontournable en son actualit (Foucault,

1969:171), para Maingueneau, o arquivo possui uma superfcie discursiva a

partir da qual podem ser extrados corpora. correspondendo estes ao conjunto

dos enunciados, sendo que para os identificar necessrio recorrer a saberes

discursivos e extra-discursivos.

Segundo estes autores, o_arquivo , assim, constitudo por um conjunto de

enunciados legitimados, que estabelecem relages de diversa ordem, quer

entre si quer com o mundo que representam. Uma anlise em concreto exige,

na perspectiva de Maingueneau, o trabalho a partir de corpora exrados dos

arquivos, e segundo a terminologia de Foucault, a extracgo de fragmentos

desses mesmos arquivos.

Desta forma, os corpora, partes constituintes de um todo - o arquivo-

caractenzam-se pela presenga ou ausncia de tragos lingusticos e/ou extra-

lingusticos, identificados aquando do estabelecimento dos crithos

subjacentes selecgo dos enunciados que os constituem.

A carga filosfica de que est impregnado o conceito de arquivo em

Foucault perde-se com a escola anglo-saxnica, que desenvolve uma

aproximago mais empnca a esse conceito. Em 1996, Sinclair rejeita

taxativamente o conceito de arquivo. no o considerando um objecto de estudo

pertinente para fins lingusticos:Words such as collections and archive refer to

24

sets of texts that do not need to be selected, or do not need to be ordered, or

the selection and / or ordenng do not need to be on linguistic criteria. They are

therefor quite unlike corpora (Sinclair, 1996:7). Para este autor, arquivo e

corpora so divergentes nos objectivos que justificam as suas existncias,

considerando que s o segundo pode ser seleccionado e organizado segundo

critrios lingusticos, os nicos parmetros a legitimarem os corpora.

Estabelecemos um paralelismo entre as terminologias de Foucault e de

Maingueneau e a de Sinclair. Este ltimo designa por monitor corpora o que

Foucault e Maingueneau designam por arquivo e por subcorpora o que

Maingueneau designa por corpora. Para Sinclair, A corpus can be divided in

subcorpora. A subcorpus has all the properties of a corpus but happens to be

partofa larger corpus (Sinclair, 1996:9).

Sinclair privilegia o conceito de monitor corpora. em dethmento do de

arquivo: [...] a dynamic rather than a static phenomenon, consisting of very

large amounts of electronicaily-held text ... A certain proportion of the data wiil

be stored at any one time, but the bulk will necessarily be discarded after

processing. The object will be to 'monitor' such data, from various points of

view, in order to record facts about the changing nature of the language

(Sinclair 1991:21). Este tipo de corpora desempenha, assim, a fungo de

observatrio da lngua. Para este autor, primordial a constituigo de um

monitor corpora para todas as lnguas que tenham um estatuto internacional

(cf. Sinclair, 1991:25), devendo a extenso deste. idealmente, igualar a da

prpria lngua: // is now possible to create a new kind ofcorpus, one which has

25

no final extent because, like the language itself. it keeps on developping

(Sinclair, 1991:25).

Apesar de Sinclair preferir o conceito de monitor corpora ao de arquivo

(cf. Leech, 1991:12), Leech no abandona este ltimo conceito sem

primeiramente o distinguir do de corpus. apontando algumas iniciativas que

surgiram no seio da escola americana, com o propsito de distanciar os

referidos conceitos, delimitando as respectivas funges. Assim, imputa

Association of Computational Linguistics Data Coding inttiative, nos Estados

Unidos, a intengo de querer : [...] make the concept of an archive almost

comparable in scope to that of a national copyright library (Leech, 1991:11),

sendo que [... ] the difference between an archive and a corpus must be that

the latter is designed or required for a particular 'representative' function

(Leech, 1991:11).

Como podemos constatar, os conceitos de arquivo e de corpus assumem

valores diferenciados nas escolas francesa e anglo-saxnica, revelando tais

valores posicionamentos filosficos e tericos distintos.

A investigago que subjaz a esta dissertago situa-se no mbito das teorias

lingusticas. Desta feita, o objecto sobre o qual efectuamos as anlises um

corpus informatizado que, numa pnmeira instncia. desprovido de qualquer

acrscimo informativo.

2. Tipologia de corpora

No devemos considerar todo e qualquer tipo de corpora um objecto vlido,

a priori, para todos os fins da anlise lingustica. Os critrios de selecgo dos

26

enunciados que compem o corpus, assim como as suas propriedades, tm de

estar, necessariamente, em consonncia com os objectivos pr-estabelecidos

pelo linguista,

Os corpora. tal como os enunciados que os constituem, podem ser

classificados em tipos distintos. Aludiremos, exclusivamente, tipologia de

corpora de textos escritos.

Em 1996, nas Preliminary recommandations on Corpus Typology,

Sinclair prope uma tipologia de corpus, que entendemos estar arquitectada

sobre pressupostos metodolgicos e tericos que determinam o seu desenho e

a sua constituigo. Um corpus deve ser edificado tendo por base parmetros

que permitam legitimar os resultados obtidos a partir da sua anlise.

Subjacentes compilago de um corpus, esto respostas a perguntas que

Kennedy equaciona do seguinte modo: lssues have included whether a

corpus should be a static or dynamic sample of a language, how best it can be

representative of a language or a genre. how big a corpus should be to be

representative or to serve particular purposes, and how big the text samples

shouldbe (Kennedy, 1998:60).

0 facto de os corpora poderem ser constitudos por extractos de textos ou

por textos integrais, leva Sinclair (1996) a evitar a utilizago do termo texto em

favor da expresso pieces of language, opgo terminolgica que indicia, no

que concerne ao conceito de texto, um posicionamento terico no explcito,

Note that the non-comminttal word 'pieces of language' is used above, and not

'texts'. This is because of the question of sampling techniques used. If samples

are to be all same size, then they cannot all be texts. Most of them will be

27

fragments of texts, arbitrarily detached from their contents (Sinclair, 1996:6).

Com esta observago, Sinclair faz uma tmida incurso nas questes tericas

relativas ao texto, admitindo que os corpora podem ser constitudos por outras

realidades que no textos, nunca chegando a explicitar o seu entendimento do

mesmo. amda com alguma surpresa que verificamos que Sinclair e Ball nem

mesmo no documento Preliminary recommandations on Text Typology

(1996) definem o conceito de texto, sendo a supracitada assergo desprovida

de valor, uma vez que no revela um posicionamento claro face s teorias do

texto.

Convictos da indispensabilidade de assumirmos um posicionamento terico

inequivoco no que se refere ao conceito de texto (cf. ponto 2.2.1), e por

entendermos no corresponder a expresso pieces of language de Sinclair

(1996) a um conceito da lingustica, recorremos, neste momento, para

mencionar os dados lingusticos que integram os corpora, ao conceito de

enunciado na acepgo de Greimas, isto , [...] toute grandeur pourvue de

sens, relevant de la chane parle ou du texte crit, antrieurement toute

analyse linguistique ou logique (Greimas, 1979:123).

Deliberadamente, exclumos da tipologia que apresentamos os corpora

lexicogrficos, isto , os corpora de frequncias, os corporade palavras, etc.

2.1. Corpora de textos integrais e Corpora de extractosde textos

Um dos princpios a partir do qual Smclair constri a sua tipologia diz

respeito aos atributos dos enunciados que constituem os corpora. Esses

28

enunciados podem corresponder a textos integrais ou a amostras de textos,

sendo o primeiro tipo de corpus designado por text corpus ou ainda por

whole text corpus e o segundo por samples corpus.

Kennedy, por sua vez, diz-nos que tambm os samples corpus podem

ser constitudos por textos integrais: A sample text corpus may consist of

complete texts sampled from a population of complete texts (sometimes called

a full-text corpus) or it may consist of samples of a specified size taken from

complete texts (Kennedy, 1998:21). Pensamos, na verdade, no poder

confundir a nogo de amostra com a de extracto. Efectivamente, tanto os textos

integrais como os extractos de textos podem servir de amostras, sendo que

corpus de amostragem no se pode opor a corpus de textos integrais.

2.2. Corpora comparativos e corpora paralelos

Os corpora comparativos e os corpora paralelos caracterizam-se por

recorrer, no mnimo, a dois sistemas lingusticos distintos.

Os corpora comparativos so conjuntos de enunciados bilingues ou

multilingues que permitem comparar dois ou mais sistemas lingusticos: [...]

some multilingual corpora might more truly be described as small collecttons of

individual monolingual corpora in the sense that they use the same or similar

sampling procedures and categories for each language but contain completely

different texts in those several languages (Mc Enery and Wilson, 1996:57).

Por sua vez, os corpora paralelos so constitudos por dois conjuntos de

enunciados idnticos representados, em geral, por dois sistemas lingusticos

29

distintos: Paralel corpora are corpora which. rather than simply employing the

same sampling procedures. actually hold the same texts in more than one

language (Mc Enery and Wilson. 1996:58). Frequentemente, os corpora

paralelos so constitudos por textos traduzidos, no se sabendo na maiona

dos casos, qual a lngua de partida e qual a lngua de chegada.

2.3. Monitor corpora

Originariamente. o monitor corpora era constitudo por uma quantidade

pr-definida de enunciados. Quando surgia a necessidade de renovar o corpus,

os enunciados mais desactualizados e antigos eram subtrados e passavam a

fazer parte de arquivos: t was originally envisaged that the monitor corpus

would remain the same size with 'old' material being relegated to the archives

as new material was added [...] (Pearson, 1998:45).

Mas de esttico, o corpus passou a ser considerada uma entidade

dinmica. Na definigo deste conceito apresentado no ponto 1.2, o monitor

corpora concebido como um objecto dinmico (dynamic corpora) que

permite a observago e o estudo de aspectos da lngua atravs das suas

actualizages ao longo de vnos perodos. Um monitor corpora dinmico

porque permite a introdugo de uma dimenso diacrnica aos corpora

contemporneos. que Kennedy explicita do seguinte modo: A monitor corpus,

more analogous to a moving picture than a snapshot, is so-caled because it

provides the means to monitor changing pattems of usage over time

(Kennedy. 1998:61).

30

Em 1996, Sinclair introduz a nogo de rate of flow, que vem reforgar o

carcter dinmico do monitor corpus, j explanado em 1991 (cf. ponto 1.2).

A introdugo deste conceito tem repercusses ao nvel do tamanho do corpus,

uma vez que o volume de dados aumenta com regularidade oportunista:

Quantity of text replaces planning of sampling as the main compilation

criterion (Kennedy, 1998:61).

A metodologia utilizada na recolha e na constituigo de dados no obedece

ao critrio de representatividade. nem de equilbrio que se refere a um mesmo

gnero ou a um mesmo tipo de texto: lnstead of setting, say 10 million words

as the proper proportion of that genre. the seeting could just as easily be 10

millions words a year. Or a month, or a week. The language would flow through

the machine, so that at any time there would be a good sample available,

comparable to its previous and future state (Sinclair, 1996:23).

Com a utilizago desta tcnica pretende aumentar-se o volume de dados,

por forma a permitir a observago de vrios estados da lngua.

2.4. Corpora de referncia

Num corpus de referncia, a representatividade e a extenso dos

enunciados que o constituem so parmetros essenciais para que Ihe possa

ser confendo o estatuto de objecto referencial, cuja finalidade a de

disponibilizar informago compreensiva sobre a lngua.

A representatividade do corpus traduz-se na diversidade e na

homogeneidade dos materiais lingusticos seleccionados, que devem exprimir o

31

maior nmero possivel de situages em que a lngua usada, estando deste

modo representadoo todos os sujeitos falantes que utilizam um sistema

lingustico, num determinado espago geogrfico. Desta diversidade so, porm,

excludos todos os enunciados de especialidade. Assim, corpus de referncia

definido do seguinte modo: [...] / recommand for a general corpus that any

specialized material is either kept out or stored separately as an ancillary

corpus. A general reference corpus is not a collection of material from different

specialist areas- technical. dialectical, juvenile. etc. . It is a collection of material

which is broadly homogeneous, but which is gathered from a variety of sources

so that the individuality of a source is obscured, unless the researcher isolates a

particular text (Sinclair, 1991:17).

Esta definigo de corpus de referncia no nos satisfaz na sua globalidade.

A que tipo de material se refere Sinclair, quando sugere que o corpus deve ser

constitudo por a collection of material which is broadly homogeneous?

Sabemos que os corpora de referncia so compostos, na sua grande maioria,

por textos jornalsticos, estando assim salvaguardado um critrio de

representatividade, se tivermos em conta o grande pblico a quem se destmam

os jornais.

No entanto. tambm sabemos que grande parte dos textos jomalsticos

incidem em reas especficas, tais como a Economia, a Crtica, a Arte, a

Poltica, etc. Quando estes assuntos so explanados em jornais, o grau de

especialidade dos conceitos, dos termos e dos discursos inferior ao grau de

especialidade de textos de especialidade, dado o pblico a quem se dihgem

estes ltimos ser composto por especialistas.

32

Devido penetrago cada vez maior das reas de especialidade na vida

quotidiana, podemos considerar o texto jornalstico um texto hbrido devido ao

recurso intercalar de vocabulrio usual com termos. Em 1971, Phal diz-nos a

este propsito: [...] /a langue courante fait des emprunts de plus en plus

nombreux aux vocabulaires scientifiques et techniques [. . .], ce qui traduit le fait

que notre vision du monde est de plus en plus influence par la science et

technique (Phal, 1971:7). A tecnologizago da sociedade torna a fronteira

entre a lngua corrente e a lngua de especialidade cada vez menos ntida.

Sinclair no se debruga suficientemente sobre o conceito de rea de

especialidade e por isso no tem em conta os vrios nveis de lngua usados

em contextos especializados distintos. Porm, tal investida seria fundamental

para se decidir que tipo de materiais deve constar de um corpus, para que ele

seja considerado de referncia.

Aceitar a validade da definigo de Sinclair, levar-nos-ia a considerar que o

Corpus de Referncia do Portugus Contemporneo (CRPC) se baseia em

pressupostos errados de selecgo de materiais: The CRPC [...] is an

electronically based linguistic corpus containing at the present 92 million words

by sampling from several types of written speech (literary, newspaper,

technicai scientific, didactic. economics, decisions of the supreme court of

justice parliament) and oral speech formal and informah (Bacelar, 2000:1603).

Tal como podemos constatar, este corpus constitudo por textos de

especialidade que, de acordo com Sinclair, no devem fazer parte de um

corpus de referncia.

33

Se relativamente definigo do conceito de corpus de referncia (cf.

Sinclair, 1991, 1996) e sua constituigo (cf, Bacelar, 2000) no ficmos

satisfatoriamente esclarecidos, ficmo-lo quanto fungo atribuda a um

corpus de referncia: lt aims to be large enough to represent all the relevant

varieties of the language, and the characteristic vocabulary, so that it can be

used as a basis for reliable grammers. dictionaries, thesauruses and other

reference materiah (Sinclair, 1996:21). a partir do corpus de referncia que

se extrai a informago pertinente para a constituigo de matehais de referncia,

tais como os dicionrios e as gramticas. entre outros.

Finalmente, queremos distanciar-nos de Pearson, quando esta afirma: [...]

a general reference corpus appears to be the superordinate in the hierarchy,

[...] (Pearson, 1998:44). Se partirmos do princpio que o conceito de monitor

corpora pode ser equiparado ao de arquivo, proporcionando uma abordagem

diacrnica aos corpora contemporneos, ento o monitor corpora funciona

como hipernimo de todos os outros tipos de corpora, uma vez que mais

abrangente e lato do que qualquer outro:

Monitor corpus 1 Arquivo

Corpus de referncia

Corpus de extractos Corpus de textos integrais

r''

Corpora paralelosJ

r

Corpora comparativos Corpora paralelos Corpora comparativosk *

34

As relages hierrquicas existentes entre os vrios tipos de corpora de

lngua corrente. assim como as suas dependncias, esto patentes nesta

representago. estando dela excludos os corpora de especialidade,

2.5. Corpora de especialidade e corpora especiais

Sinclair utiliza os termos sublanguage e special corpora para

designar todos os enunciados que so produzidos em situages sociais

especficas, devendo alm dos critrios internos, recorrer-se tambm a critrios

externos para definir tais conceitos que se opem, pela sua natureza, ao de

corpus ao de referncia: A sublanguage is at the other end of the linguistic

spectrum from a reference corpus (Sinclair, 1996:20). Assim, deduzimos que

todo o enunciado que, devido s suas caractersticas, no pode integrar o

corpus de referncia. faz parte integrante de corpora especiais. Baseando-se

em Sinclair, Pearson apresenta-nos alguns exemplos de corpora especiais:

Examples of special corpora given by Sinclair are corpora of the language of

children. the language of geriatrics, the language of non native-speakers and

the language ofvery specialized areas of communications (Pearson, 1998:46).

Geraimente, quando tais conjuntos de dados so abordados do ponto de vista

lingustico, cria-se a expectativa de encontrar desvios norma. a constatgo

desses desvios que impede de os incluir no corpus de referncia, em razo de

o resultado da extracgo de um enunciado deste tipo no constituir um

subcorpus, porque A subcorpus has all the properties of a corpus but

happens to be part of a larger corpus (Sinclair, 1996:9).

35

No podemos, no entanto, aceitar que enunciados resultantes de

situages de comunicago entre especialistas sejam includos num corpus

especial, ou sejam entendidos como uma sublngua, j que de forma alguma

podemos considerar que nestes enunciados existem desvios norma. 0 que

encontramos neste tipo de enunciados so termos utilizados com acepges

diferentes e construges morfossintcticas que. idealmente, reflectem

comunicages monorreferenciais e no ambguas, inerentes s situages de

comunicago especializada: Les corpus spcialiss runissent des donnes

linguistiques relatives une dimension particulire: un domaine, un thme, une

situation de communication (Habert et alii, 1998:37)

Consideramos que os discursos proferidos em situages de

especialidade constituem corpora de especialidade, que requerem

aproximages metodolgicas e tericas particulares.

Assim, o conjunto dos enunciados produzidos por especialistas em

Detecgo Remota constituem um corpus de especialidade. Se o conjunto de

enunciados de especialidade for representativo dos enunciados produzidos

pela classe profissional em causa e se a quantidade de enunciados recolhidos

for significativa, ento assumimos estar perante um corpus de referncia de

especialidade:

Corpus de referncia (LSP)

Corpus de extractos Corpus de textos integrais

Corpora paralelos Corpora comparativos Corpora paralelos Corpora comparativos

36

A representatividade dos enunciados que compem um corpus uma

questo central da constituigo dos corpora de especialidade, uma vez que a

diversidade dos textos no seio de uma rea de especialidade imensa: [...]

I'troitesse du sujet n'empche pas sa diversit interne, et le problme ne

consiste l encore concevoir un corpus quilibr, que l'on puisse considrer

comme chantillon de l'ensemble que l'on veut analysen> (Habert et alii,

1998:37).

A nogo de representatividade em corpora especializados no

pressupe a nogo de quantidade. dado que a produgo de textos numa rea

de especialidade, numa lngua determinada, pode ser diminuta, assumindo o

tamanho do corpus um valor relativo.

3. Corpora anotados

Com o intuito de ampliar as possibilidades das anlises textuais, surgem

os corpora anotados que pressupem uma selecgo rigorosa dos textos, aos

quais se adiciona informago em conformidade com os objectivos de um grupo

de investigadores ou com as necessidades gerais de um sector da

comunidade.

A informago acrescentada ao corpus no seu estado bruto (raw corpus)

pode ser da ordem da:

i) lingustica: informago morfolgica, sintctica, pragmtica,

semntica, etc,

37

ii) representago fsica e lgica: ttulo, subtitulos, maisculas,

sublinhados, pargrafos. etc.

Em ambos os casos estamos perante a introdugo de informago

metalingustica, representada atravs de um sistema de cdigos que obedece

a pressupostos tericos e metodolgicos, assim como a finalidades bem

distintas.

Para Leech, a anotago entendida como: [...] the practice of adding

interpretative, linguistic information to an electronic corpus of spoken and / or

written language data (Leech, 1997:2), que no se confunde com os conceitos

de mark-up ou de encoding.

Assim, anotar um corpus significa associar informago lingustica a

segmentos de texto, recorrendo para o efeito a um conjunto de smbolos, as

etiquetas. por forma a poder identific-los, com vista ao seu tratamento

automtico. Esta operago designada de etiquetagem, constituindo o produto

final um corpus etiquetado.

Anotar um corpus pode tambm ter por finalidade a introdugo de um

sistema de cdigos, cujo objectivo o de delimitar, por exemplo, um itlico, um

ttulo, um pargrafo, um sublinhado, etc: This record can be represented

eectronically in the computer by special codes and mark-up, and one-to-one

mapping between these and symbols can be maintained: the original

orthographic document is simply replaced by an unambiguous representation in

the forma of an electronic documenh (Leech, 1997:3). Os cdigos que

permitem, de forma no ambgua, dar conta da representago de um texto

38

designam-se por balizas, sendo esta operago designada de balizagem e o

produto final de corpus balizado.

Assim, anotar significa balizar ou etiquetar segmentos de textos no seio

de um corpus. Deste modo, consideramos a anotago o hipernimo de

balizagem e de etiquetagem, sendo ambos co-hipnimos:

Em lngua portuguesa, o termo anotago utilizado ora como sinnimo

de etiquetagem, ora como sinnimo de balizagem.

No contexto desta dissertago utilizaremos o termo anotago como um

genrico, para designar qualquer tipo de adigo de nformago ao texto na sua

forma bruta.

3.1. SGML

SGML - Standard Generalized Markup Language1 uma norma ISO

(International Organization for Standardization) que foi criada a fim de se atingir

uma maior flexibilidade na utilizago. na reutilizago e na permuta de

1

International Organization for Standardization, ISO 8879; Information processing- Text and

office systems- Standard Generalized Markup Language (SGML), ([Geneva]: ISO, 1986)

39

documentos. 0 objectivo desta norma a de facultar: [...] an unambiguous

format for text interchange and a markup language that would be sufficiently

rich to permite any (future) processing (Herwijnen, 1994:22), permitindo uma

codificago universal de algumas das componentes de um texto.

SGML uma metalinguagem que inclui a) uma sintaxe abstracta, cuja

finalidade a de permitir a balizagem descntiva dos elementos presentes num

documento; b) uma sintaxe concreta de referncia, que serve de base sintaxe

abstracta e c) declarages que exprimem uma sintaxe de balizagem aplicada,

A sintaxe abstracta d conta dos esquemas de codificago de

aplicages que podem ser empregues pelos utilizadores e que estabelece o

esquema conceptual da metodologia SGML. A sintaxe concreta , por sua vez,

uma realizago da sintaxe abstracta, que utilizada para codificar um

documento, fornecendo um lote comum de cdigos de caracteres e de

delimitadores que devem ser utilizados nas aplicages,

Os cdigos de caracteres esto definidos na norma ISO 646, enquanto

que os delimitadores fazem parte da sintaxe concreta de referncia usada pela

norma SGML:

Delimitadores Utilizago i

< Abertura de baliza de incio

</ Abertura de baliza de fim

<! Abertura de declarago de balizagem

<? Abertura de instruco de tratamento

> Fecho da baliza

- Incio e fim de comentno

# Indicadorde nome reservado

40

Os delimitadores so utilizados para construir etiquetas <MEMO> que

marcam os elementos, isto , as partes lgicas do documento (captulo,

secgo, ttulo, pargrafo, etc).

Um documento que tenha sido balizado com SGML est preparado para

permutar informages ao nvel da forma e da estrutura, separando, atravs da

utilizago de balizas, a representago fisica da representago lgica, propondo

convenges gerais para os vrios tipos de textos. (cf. Habert, 1997:153),

A norma SGML constitui, assim, um meio para descrever documentos,

independentemente dos tipos de computadores, dos sistemas operativos e dos

programas de pagmago.

Um documento SGML est dividido em trs partes lgicas: a declarago

SGML, a definigo de tipo de documento (DTD) e a instncia do documento.

A declarago SGML define a sintaxe concreta de referncia e especifica

toda a mformago dependente da mquina em que se trabalha. Esta

declarago antecede a DTD e corresponde primeira parte do documento

SGML : The SGML declaration defines which characters are used in a

document instance, which syntax the DTD is written in, which SGML features

are used, and so on (Herwijnem, 1994:269). Caso o utilizador no mencione

explicitamente uma declarago, o sistema assume uma declarago pordefeito.

Exemplifiquemos:

<! SGML"IS0 8879 : 1986"

CHARSET

BASESET "ISO 646 : 1983// CHARSET

Intemational Reference Version (IRV) / / ESC 2/5 4/0

DESCSET 0 9 UNUSED - the first 9 characters starting are not used--

9 2 9 - the next two, 9 and 1 0, map onto 9 and 1 0 of

the baseset --

41

11 2 UNUSED -- 11 and 12 are not used--

13 1 13 -- 13 is mapped onto 13on the baseset --

14 18 UNUSED -the next 18, satarting with 14, are unused

32 95 32 -- the next 95, starting with 32, are mappedonto 32-126 of the baseset --

127 1 UNUSED - the character 127 is unused --

CAPACITY PUBLIC "ISO 8879 : 1986/ / CAPACITY REFERENCE/ / EN"

SCOPE DOCUMENT

SYNTAX PUBLIC "ISO 8879: 1 986/ / SYNTAX REFERENCE/ / EN"

MINIMIZE

LINK

OTHER

FEATURES

DATATAG NO OMITTAG YES RANK NO SHARTTAG YES

SIMPLE NO IMPLICIT NO EXPLICIT NO

CONCUR NO SUBDOC NO FORMAL NO

APPINFONONE>

In Herwijnem (1994:122)

As componentes da declarago SGML esto explicitadas na norma e, a

ttulo de exemplo. apresentamos um quadro explicativo das palavras chave e

dos parmetros que podem constar de uma declarago:

Keyword Parameter Explanation

CHARSET document character st start of description of

document's character set

BASESET public identifier Document base character set

DESCSET 0 9UNUSED document's character set, in

terms of the base set

CAPACITY public identifier limits not to oe exceeded bydocument

SCOPE DOCUMENT syntax applies to DTD as well

as document

SYNTAX public identifier syntax used by document

FEATURES Start of features descnbes features used

(MINIMIZE, LINK, etc.)

APPINFO NONE application specific

information

Herwijnem (1994), Practical SGML, Boston/Dordrecht/London, Kluwer Academic, pp. 122-123

Todas as regras que definem os tipos de elementos prprios a um

documento esto contidas numa DTD. Assim, a DTD define as regras de

42

balizagem de um documento ou de uma classe de documentos, permitindo a

descrigo da sua estrutura lgica hierarquizada.

Segundo Habert, balizar um documento significa indicar as subdivises

e as suas relages que compem a estrutura de um documento. Tal

identificago passa por dois momentos distintos, mas consecutivos. Num

primeiro momento, define-se uma DTD. que pode ser equiparada escrita de

uma gramtica de classes de documentos e num segundo momento, introduz-

se: [...] des balises choisies dans le document relevant de cette DTD, en

respectant les rgles dites pour leur combinaison (Habert, 1997:1 54).

So consideradas componentes da DTD SGML os elementos, as

entidades e os atributos.

Os elementos definidos pela DTD [...] peuvent apparatre dans un type

de document prcis et leur associe un nom, qui fgure dans les balises

correspondantes. Elle prcise le contenu des lments (s'ils peuvent ou non

tre dcomposs dans des lments plus petits (Habert at alii, 1998:64). As

entidades, por sua vez, so formas abreviadas de cadeias de caracteres que

ocorrem com frequncia, reenvios ou servem ainda para incluir outras DTD.

Os atributos, finalmente, permitem associar informago complementar

ao documento balizado.

A estrutura da DTD bivalente, determinando, num primeiro momento,

os jogos de caracteres utilizados. fixando as opges permitidas; num segundo

momento, definindo de forma efectiva um documento.

Apresentamos uma DTD definida pelo autores do TEI (Text Encoding

Initiative) e retomada como exemplo por Habert (1998:65);

43

<! - - <'DOCTYPE tei.2 SYSTEM "tei2 dtd" [ - ->

<!-- TEI LiteDTD

<! - - Text Encoding Imtiative: Guidelines for Electromc

<! - - Text Encoding and Interchange. Document TEI P3, 1994

<! - - Copynght (c) 1994 ACH, ACL, ALLC. Permisson to copy

<! - - in any form is granted, provided this notice is

<! - - inculded in all copies

<!ELEMENT hstBibl -- ((head)?, (bibl | biblFull)+. (trailer)?)>

<!ELEMENT bibl - 0 (#PCDATA | ident| code | kw | abbr | address

date | name | num | rs | time | add | corr | del | gap | orig | reg |sic | unclear | emph | foreign | gloss | hi | mentioned | soCalled |

term | tilte | ptr | ref | xptr j xref | anchor | s | seg | gi |

formula | author | biblScope | edition | editor | extent | idno|

imprint | note| publisher | pubPlace | respStmt) *>

<'ELEMENT biblFull - 0 (titleStmt, (editionStmt)?, (extent)?,

publicationStmt, (senesStmt)?, (notesStmt)?, (sourceDesc)")>

<!ELEMENT title - 0 #PCDATA | ... | text)*)>

<!ATTLIST title

langlDREF #IMPLIED

rendCDATA#IMPLIED

level (a | m|j |s| u)#IMPLIED

typeCDATA#IMPLIEDTEIform CDATA "title">

<!ELEMENT impnnt-

(pubPlace | publisher | date i ciblScope.r>

Toda a informago contida na DTD definida pelo balizador, que

conjuga a sintaxe SGML com o conhecimento que tem de um documento,

construindo uma gramtica do documento estudado.

- ->

- - >

- - >

. - >

. - >

44

a mstncia que contem os dados balizados incluindo as referncias ao

DTD, caso este no esteja presente no texto. A utilizago do termo instncia

deve-se ao facto de ele remeter para uma realizago concreta de uma classe

de documentos que tem a estrutura definida por uma DTD: The document

instance is the part of SGML document that contains the marked up textual

data (Herwijnem, 1994:273).

0 SGML uma metalinguagem que permite definir uma gramtica

normalizada da representago fsica e lgica dos diferentes tipos de

documentos.

3.2. TEI

0 esquema de balizagem definido pelo TEI - Text Enconding Initiative -

uma aplicago do SGML, que foi desenhado para ser aplicado a qualquer tipo

de texto. abstraindo da lngua em que foi escnto, da data em que foi produzido

ou do gnero a que pertence.

O TEI um projecto que resulta do financiamento de trs grandes

associages- Association for Computational Linguistics (ACL), a Association

forLiterary and Linguistic Computing (ALLC) e a Association for Computers and

the Humanities (ACH), a fim de [...] provide standardised implementation for

machine-readable text interchange (McEnery. Tony e Wilson, Andrew,

1997:27).

45

A originalidade do TEI consiste em propor conjuntos de directrizes para

o uso adequado da norma SGML, aplicado codificago de textos (cf.

Sperberg-Mc Queen and Burnard, 1994).

No TEI, cada texto ou documento constitudo por um cabegalho

(headen>) e por um corpo, isto . o texto propriamente dito. Do cabegalho

consta informago acerca do texto : autor, ttulo, eto. Do texto. faz parte

nformago que permite uma interpretago no ambgua do mesmo.

Para a anotago do cabegalho e do texto de cada documento recorre-se

s balizas (tags) e s entidades referenciais (entity references), sendo o

texto, assumidamente, constitudo por elementos (elements) que so

anotados com as balizas ou os delimitadores que fazem parte da sintaxe

concreta de referncia proposta na norma SGML. Apresentamos um exemplo

da utilizago das balizas SGML que d conta da extenso de um pargrafo:

<p>

Isto foi a essncia.

</p>

Assim, as balizas < > e </...> indicam, respectivamente, a abertura e o

fecho de uma baliza, sendo que a letra minscula p remete para a nogo de

pargrafo.

Contrariamente s balizas, as entidades referenciais so delimitadas

pelos caracteres & e ;. Assim sendo, uma entidade referencial uma forma

abreviada (shorthand form) para codificar informago especfica dentro do

texto. Sempre que um elemento acompanhado do carcter & ou ; seguido de

uma forma abreviada significa que pode ser substitudo por uma informago

mais ampla e detalhada que se encontra fora do texto, designada por feature

46

system declaration (FSD). que considerado um tipo de documento auxiliar

no seio doTEI.

0 exemplo dado por McEnery, Tony e Wilson, Andrew (1997:28) ilustra

bem este procedimento. Quando, no seio de um texto, surge a forma polished

anotada com vvd . polished&vvd;, significa que o primeiro v est para verbo, o

segundo v para verbo de base lexical e o d para particpio passado. A entidade

referencial &vvd; pode referir-se a uma FSD que contm a informago extensa

referente ao significado da forma abreviada:

<fs id=vvd type=word-form><f name=verb-clas><sym value=verb>

<f name=base><sym value=lexical>

<f name=verb-form><sym value=past>

</fs>

A forma abreviada pode a qualquer momento ser substituda pela sua

descrigo.

No entanto, a DTD a nogo fulcral do TEI: This is a formal

representation which tels the user or a computer program what elements the

text contains, how these elements are combined, and also contains a set of

entity declarations, for example representations of non-standard characters

(McEnery, Tony e Wilson. Andrew (1997:28). 0 TEI contem normas pr-

definidas para balizar tipos de documentos, tais como poemas, artigos de

dicionrios, fichas terminolgicas, eto.

Na criago de uma DTD, cabe ao utilizador decidir o grau de

complexidade que quer conferir anotago de um documento. em consoncia

47

com o objectivo que o move: /f is important to remember that every document

type definition is an interpretation of a text. There is no single DTD which

encompasses any kind of absolute truth about a text. [...] (Sperberg C.M. e

Burnard, Lou, 1994:19),

o utilizador que interpreta um documento, recorrendo ao TEI para fixar

a sua interpretago.

3.3. CES

O CES (Corpus Encoding Standard) surge no seguimento do TEI em

consequncia dos projectos europeus EAGLES e MULTEXT. Tal como o TEI, o

CES ainda no uma norma, mas sim uma proposta de norma que tem por

finalidade [...] fournir des propositions d'encodage minimal pour les corpus

lectroniques. la fois pour faciliter leur intgration dans une base de donnes

textuelles et pour leur associer les informations structurales et linguistiques

ncessaires (Habert, 1998:100).

Tal como vimos no ponto anterior. o TEI visa a balizagem de todo o tipo

de documentago: corpus, artigos lexicogrficos, fichas bibliogrfias, etc 0

CES vem especializar-se e dedicar-se exclusivamente anotago de corpora,

retendo somente uma parte do TEI, que especifica e prolonga.

O objectivo explcito do CES a reutilizago dos corpora, incidindo o

seu campo de acgo no tratamento automtico dos dados, recorrendo para tal

a trs nveis de anotago. 0 pnmeiro nvel diz respeito anotago dos dados

estruturais de base do corpus, o segundo nvel de anotago ocorre nos

48

objectos lingusticos e o terceiro nos objectos textuais com um estatuto

lingustico menos nitido (cf. Habert et alii, 1998:101-102).

Ainda de acordo com Habert: Chaque niveau d'annotation doit tre

valid par l'utilisation d'un parseur SGML mum de la DTD correspondante

(Habert et aln. 1998:102).

0 CES corresponde a um proposta de norma mais completa e complexa

que visa a balizagem de corpora, permitindo associar-lhe etiquetagens

metalingusticas.visando o levantamento automtico de informago.

0 CES distmgue-se do TEI por aplicar-se exclusivamente a corpora,

permitindo diversos nveis de anotago, correspondendo cada nvel de

anotago a uma DTD diferente: L o la TEI insre dans le mme document

les balises correspondant aux diffrents niveaux d'annotation envisags, CES

repartit ces balises dans des documents distincts,relevant de DTD diffrentes

(Habert et alii, 1998:101). A anotago, assim, feita por camadas distintas e

no atravs da interacgo das diferentes anotages, podendo coexistir vrias

anotages do mesmo nvel: On peut ainsi utiliser diffrents tiqueteurs

morphosyntaxiques (Habertet alii, 1998:101).

A associago das diversas formas de anotago- balizagem e

etiquetagem- permite aumentar em qualidade e em quantidade o tratamento

automtico da lngua natural (TALN), obtendo resultados cada vez mais

performativos, necessrios para o desenvolvimento da lngua.

49

3.4. Etiquetagem gramatical (part-of-spech annotation)

As etiquetas metalinguisticas so adicionadas aos corpora brutos, por

forma a tornar explcita a informago sobre a lngua que est presente de modo

implcito no corpus, permitindo um tratamento mais rpido e eficiente da

informago e da anlise lingustica. A este propsito, McEnery e Wilson

apresentam o seguinte exemplo: For example. the pad-of-speech information

'third person singular present tense verb' is always present impiicitly in the

forma loves. but it is only retrieved in normal reading by recourse to our

preexisting knowledge of the grammar of English (McEnery; Wilson, 1997:24).

A etiquetagem de um corpus explicita a interpretago levada a cabo por um

anotador ou por uma equipa de investigago.

Para que um corpus seja reutilizado, multifuncional e facilmente

manejvel pelos utilizadores, essencial terem-se presentes algumas linhas

orientadoras no momento de proceder sua etiquetagem. Leech (1997)

menciona algumas mximas que devem guiar o anotador

Assim, o corpus etiquetado deve permitir uma grande flexibilidade aos

utilizadores, podendo estes a qualquer momento subtrair as etiquetas ao

corpus, facultando um regresso inequvoco ao corpus bruto. A bateria de

etiquetas, tal como as orientages que presidem etiquetagem, devem ser

disponibilizadas ao utilizador, devendo este ficar esclarecido sobre como e

quem procedeu etiquetagem. Geralmente, este tipo de informago est

contido num ficheiro, em apndice ao corpus.

50

A etiquetagem no sendo um processo infalivel, um instrumento de

grande utilidade Mas para que um corpus etiquetado seja reutilizvel pelo

maior nmero possvel de utilizadores, fundamental que a etiquetagem usada

obedega a critrios to consensuais quanto possvel e que se baseie em

princpios tericos neutros. No entanto, nenhum esquema de etiquetagem tem

a priori o condo de ser considerado uma norma, uma vez que a norma surge

de uma prtica consensual.

0 tratamento automtico ou semi-automtico da lngua natural

pressupe a etiquetagem de elementos lingusticos mediante uma bateria de

etiquetas concebidas em fungo do nvel lingustico e do grau de mincia com

que se pretende tratar o corpus. As etiquetagens podem ser atribudas aos

segmentos de forma automtica, utilizando para o efeito um etiquetador

(taggen>) ou podem ainda ser atribudas de forma manual.

0 corpus pode ser etiquetado totalmente ou parcialmente, obedecendo

aos critrios pr-estabelecidos pelo linguista.

Actualmente. os nveis lingusticos tratados com sucesso so os nveis:

ortogrfico, fontico, prosdico, gramatical, sintctico. semntico, discursivo,

pragmtico e estilstico.

A etiquetagem sintctica corresponde prtica de adicionar informago

sintctica a um corpus, ao incorporar indicadores de informago sintctica no

texto.

As etiquetagens gramatical e sintctica so, frequentemente, tratadas

em conjunto, j que ambas do conta das caractersticas gramaticais de um

texto, sendo a etiquetagem gramatical considerada um pr-estgio necessrio

51

etiquetagem sintctica. Leech considera estes dois nveis de tratamento

simbiticos: ln fact. there are strong argument that these are nor really distinct

levels at all: gramatical tagging is merely a specification of the leaves (or pre-

terminal nodes) of the phrase-structure (PS) tree which is favoured model for

syntactic annotation (Leech, 1997:19).

0 facto de uma etiquetagem sintctica pressupor uma etiquetagem

gramatical confere a esta ltima um valor acrescentado no seio do TALN.

Atribuir etiquetas gramaticais a um corpus significa associar a cada

unidade lexical a sua categoria morfossintctica, utilizando para o efeito um

conjunto de etiquetas pr-definidas. Embora no exista nenhuma norma que

mstitua e defina o conjunto de etiquetas a utilizar. tem-se por referncia as

batenas de etiquetas (tagset) utilizadas nas etiquetagens dos grandes

corpora, tais como a British National Corpus (BNC), o Lancaster-Oslo/Bergen

Corpus (LOB Corpus) e a Surface Underlying Structure Analysis of Natural

English (SUSANNE) para a lngua inglesa; para a lngua francesa, o Menelas e

o Mitterand 1, entre outros.

O resultado obtido aps a etiquetagem gramatical de um corpus pode

ser apresentado num formato horizontal ou vertical. Apresentamos um extracto

retirado do LOB corpus2 no seu formato horizontal, em que a cada unidade

lexical acrescentada uma etiqueta morfossintctica:

A01 2A *' *'

stop_VB electing_VBG life_NN peers_NNS *"_"'_A01 3

A

by_IN Trevor_NP Williams_NP ._.

A01 4 Aa_AT move_NN to_TO stop_VB \0Mr_NPT Gaitskell_NP from_INA01 4 nominating_VBG any_DTI more_AP labour_NNA01 5 life_NN peers_NNS is_BEZ to_TO be_BF made VBN at_IN a_AT meeting_NN

A01 5 of_IN labour_NN \0MPs_NPTS tomorrow_NR ._.

A01 6A

\0Mr_NPT Micheal_NP Foot_NP has_HVZ put_VBN down_RP a_AT

2

http://www hit.uib/no/icame/lob-eks.html

52

A01 6

A01 7

A01 7

A01 8

resolution_NN onJN the_ATI subject_NN and_CC

he_PP3A is_BEZ to_TO be_BE backed_VBN by_IN \0Mr_NPT Will_NP

Griffiths_NP '_' \OMP_NPT for_IN Manchester_NP

Exchange_NP ._.

Apresentamos o mesmo extracto na sua forma vertical, em que cada

unidade lexical apresentada em linhas separadas, acompanhada da sua

etiqueta, assim como de alguma informago adicional:

A012001

A012002

A012010

AO12020

A012030

A0 12040

A0 12041

A012042

A013001

A013010

A013020

A013030

A0 13031

A014001

A014010

A014020

A014030

AO 14040

A014050

AO 14060

A014070

A014080

AO 14090

A014100

A014110

AO 15010

A015020

AO15030

AO 1 5040

A015050

A015070

A015080

A015090

A015100

A015110

A015120

A015140

A015141

VB

VBG

NN

NNS

IN

NP

NP

stop

electing

life

peers

AT

NN

TO

VB

NPT

NP

IN

VBG

DTI

AP

NN

NN

NNS

3EZ

Tu

BE

IN

A.T

NN

IN

NN

NPTS

NR

by

Trevor

Williams

move

to

stop

\0Mr

Gaitskell

froma

nominating

any

more

labour

hfe

peers

is

to

be

at

a

meetingof

labour

\0MPs

tomorrow

\Q

\0

Cada uma das etiquetas que acompanham as unidades lexicais so

etiquetas que constituem baterias de etiquetas: que permitem identificar em

contexto cada uma das formas constituintes do corpus.

53

Assim, a ttulo de exemplo. no LOB corpus ,a classe de palavras 'nome'

apresenta as seguintes classificages:

N

NP

NPS

NPL(S)

NPT(S)

NNP(S)

JNP

noun

'true proper name'

plural proper name

locative nouns with word-initial capital

titular names with word-initial capital

common noun habitually written with a word-

capital

adjective habtually written with a word-initial

capital

Outro jogo de etiquetas o utilizado pelo corpus francs Mitterand 1, em

que a frase:

[ . . . ] moi, je suis de la France - je ne dis pas: je suis la France

etiquetado da seguinte forma:

moi, je,5II II II M

Kf."i i i H

je.je,5suis.tre.1 1

de,de,81

la,le,7

France,France,22

--,P

je,je,5ne,ne,6

dis,dire.11

pas,pas,6

:,:,p

je.je,5suis,tre,1 1

la,le,7

France,France,22

[...]-

54

0 texto etiquetado e constitudo por conjuntos de trs elementos. em

que o pnmeiro corresponde a unidade lexical tal como surge no corpus. o

segundo corresponde ao lema e o terceiro corresponde sua categona, que

est representada por um nmero.

Os poucos exemplos de baterias de etiquetas que apresentmos,

deixam antever uma grande disperso e disparidade quer na cnago e na

utilizago de etiquetas, quer, mais particularmente, das realidades lingusticas

que estas cobrem: On peut ainsi par exemple avoir des tiquettes pour les

articles. et considrer les possessifis (mon, ton, son. etc.) comme faisant partie

des adjectifs. ou bien mclure les uns et les autres dans une catgorie

"dterminants" (Vronis J. .Khouri L, 1995: 236).

As divergncias tericas subjacentes etiquetagem das unidades

lexicais e dos segmentos lingusticos constituem um dos maiores entraves ao

consenso entre os especialistas. A identificago e a atribuigo das etiquetas

adequadas s entidades lingusticas, assim como o estabelecimento de regras

lingusticas localizadas que permitam. num pnmeira fase, um levantamento

automtico dos termos e a desambiguago automtica. numa segunda,

representam. para ns, o grande desafio do tratamento automtico da lngua

natural.

3

Exemplo retirado de HABERT (1997 22)

55

Captulo II

Constituigo de corpus

1 . Comunidade cientfica. produtora de textos de especialidade

2. Texto de especialidade

2.1 Texto e discurso

2.2 Contextos

2.3 Intervenientes

3. Tipologia de tipos ou tipologia de gneros?

4. Constituigo do corpus em Detecgo Remota

4.1 . Definigo da rea de especialidade em anlise: Detecgo Remota

4.2. Constituigo de tipologias

4.2.1. Tipologia de tipos de discurso

4.2.2. Tipologia de gneros de discurso

Captulo II - Consttuigo de corpus

1. A comunidade cientfica, produtora de textos de especialidade

A comunidade cientfica compe-se de indivduos que possuem

conhecimentos especficos para exercer, ensinar, discursar e escrever sobre

uma especialidade cientfica.

Kuhn reflectiu longamente sobre a questo da pertenga a uma

comunidade cientfica e aponta como razo principal para definir essa pertenga

a existncia de um paradigma comum aos seus membros: Un paradigme est

ce que les membres d'une communaut scientifique possdent en comum. et

rciproquement, une communaut scientifique se composent d'hommes qui se

rfrent au mme paradigme (Kuhn, 1070:240).

Assim, ser membro integrante de uma comunidade cientfica implica, na

perspectiva kuhniana, ser portador de um conjunto de conhecimentos

baseados em investigages slidas (cf. Kuhn, 1970:30). Para que um membro

de uma comunidade cientfica seja aceite e reconhecido como especialista.

necessno que active mecanismos discursivos (escritos e/ou orais) que Ihe

permitam partilhar o seu saber com os membros da comunidade a que

pertence. Os grupos receptores da comunicago especializada so

constitudos por indivduos de uma comunidade cientfica que, teoricamente,

detm um elevado grau de conhecimento cientfico.

No entanto, estamos cientes de que a comunicago cientfica tambm

pode ser dingida a mdivduos exteriores a ela. Se quisssemos introduzir uma

57

nogo de escala. diramos que, no que respeita ao conhecimento, tais

indivduos encontram-se em oposigo simtrica aos membros de uma

comunidade cientifica, correspondendo, desta forma, ao grupo com o menor

grau de conhecimento cientfico.

Os mecanismos discursivos que o especialista activa nestas duas

situages de comumcago so distintos. No primeiro caso. estamos perante um

discurso cientfico especializado: no segundo caso, estamos perante um

discurso vulganzado. 0 grau de complexidade conceptual representado nos

textos resultantes dos respectivos discursos vai do mais complexo. o texto

especializado. ao menos complexo, o texto vulgarizado.

0 especialista produz textos com diferentes graus de dificuldade, ao

nvel do conhecimento, para veicular e difundir o seu saber, sendo. no entanto,

atravs do texto de especialidade que contribui de forma mais efectiva para a

evolugo do conhecimento no seio da comunidade cientfica a que pertence. 0

texto de especialidade uma das formas privilegiadas ao qual o especialista

recorre para transmitir e aceder ao conhecimento.

A comunidade cientfica rene indivduos que, nas mais diversas

situages de comunicago, podem assumir tanto o papel de produtor como o

de receptor de discursos e/ou textos. Na situago em que existe um debate de

ideias, os papis invertem-se, altemadamente. Para que a comunicago seja

possivel, imprescindvel que os intervenientes tenham os mesmos referentes,

que tenham conhecimentos e leituras que Ihes permitam, a cada momento do

debate, actualizar o seu saber e contribuir, a longo prazo. para o progresso das

58

cincias e para a transformago das representages sociais (Bronckart,

1996:111).

Os membros da comunidade auto-regulam os seus discursos, sendo

eles os nicos verdadeiros juzes da sua produgo cientfica: [...] les membres

d'un groupe scientifique se considrent et sont considrs par les autres.

comme les seuls responsables de la poursuite d'un ensemble d'objectifs qui

leur sont communs et qui englobent la formation de leurs sucesseurs (Kuhn,

1970:241).

Ao especialista, produtor e receptor de discursos e de textos,

reconhecida legitimidade para debater paradigmas e referncias.Estabeleceu-

se um contrato. tacitamente aceite, entre os mtervenientes que se propem

debater ideias, uma vez que possuem a mesma memria cientfica. [...] /a

connaissance scientifique est intrinsquement la proprit d'un groupe [...]

(Kuhn, 1970:284). 0 saber que um mdivduo detm sobre uma cincia consiste.

na essncia. no conhecimento e na capacidade de cnago de discursos e de

textos que podero servir de referncia a outros ou a futuros membros da

comunidade cientifica. Dominar as referncias, que so comuns a uma mesma

comunidade, significa pertencer-lhe de pleno direito.

0 especialista . consequentemente, o produtor e o receptor dos textos

de especialidade que so produzidos e consumidos por e para uma

comunidade de especialistas, que perfaz uma comunidade de comunicago,

tambm ela restrita. Assim, fazer parte de uma comunidade cientfica implica,

entre outras percias, dominar um discurso prprio a um conjunto de indivduos

que tm em comum saberes especficos sobre uma rea do conhecimento.

59

0 texto escrito. expresso de um saber, poder transformar-se em

conhecimento. sendo o consenso entre os especialistas relattvamente

verdade explanada no documento uma condigo sine qua non. Maingueneau

refere-se importncia do texto escrito, enquanto produto. para confenr e

consolidar a identidade de uma comunidade restnta; [...] la production crite

impiique crucialement un groupe, une communaut associe ses rites [...]

(Maingueneau, 1992:117). A nogo de autondade, a existncia de ntuais e a

importncia da memria so fulcrais para que a relago entre os membros que

constituem uma comunidade cientfica seja coesa, sendo os textos, atravs das

relages sociais, conceptuais e lingusticas que neles esto expressas. um elo

de ligago entre os seus membros.

, efectivamente. o texto escrito que permite a um grupo de mdivduos

perpetuar a sua memria cientfica, porque [...] I'crit conserve le discours et

en fait une archive disponible pour la mmoire individuelle et collective

(Ricoeur, 1986:139).

2. Texto de especialidade

2.1 Texto e discurso

0 texto escrito. produto estvel resultante de uma actividade intelectual e

profissional, provindo de uma comunidade de comunicago restrita, o objecto

de estudo desta dissertago.

Mas abordar o texto, entendido como um objecto matenal e concreto,

acarreta necessanamente uma reflexo terica sobre o texto, entendido como

60

um objecto em abstracto (cf Adam, 1999:40). Intimamente ligado ao conceito

de texto. surge o conceito de discurso. sendo que. nos planos terico e

metodolgico. nem sempre se conseguem distinguir cabalmente um do outro.

Para Maingueneau discurso e texto tm em comum o facto de designarem

produges verbais. Na sua obra intitulada Analyser les textes de

communication (1998), o autor define longamente o conceito de discurso e

aborda de forma sumria o conceito de texto. Tambm Rastier evidencia a

primazia do conceito de discurso sobre o de texto, reconhecendo que este

ltimo tem vindo a ser substitudo por uma panplia de novos conceitos com

caractersticas interdisciplinares. centrados nos contextos extralingusticos

inerentes ao acto verbal: [...] /e concept de texte a t supplant par ceux de

discours. d'interaction verbale. etc. (Rastier, 1998:106).

A razo pela qual o conceito de discurso abundantemente utilizado nas

cincias da linguagem deve-se ao facto de isso representar [...] le symptme

d'une modification dans notre fagon de concevoir le langage (Maingueneau,

1998:38). Maingueneau defende que tal modificago se operou devido

confluncia de diversas correntes das cincias da linguagem que compem a

pragmtica, que se consubstanciam numa forma particular de apreenso da

comunicago verbal. Aceitar tal constatago implica perspectivar o discurso em

termos das propostas tencas e metodolgicas inerentes pragmtica.

Greimas considera a pragmtica da linguagem, na perspectiva da escola

amencana, como [...] un des aspects de la dimension cognitive, car elle

concerne en fait la comptence cognitive des sujets communicants, telle qu'on

peut la reconnatre [...] l'intrieur des discours-noncs [...] (1979:288).

61

Desta forma, os mtervenientes na comunicago, isto , o autor e o destinatno,

fazem parte integrante do processo da comunicago, uma vez que so

indivduos com competncias especficas.

Enquanto Greimas introduz aqui o conceito de enunciado. que equipara a

discurso, Maingueneau equipara tal conceito ao de texto. Para este autor, o

enunciado e o texto so co-ocorrentes de discurso, admitindo. no contexto da

sua obra, que [...] nonc possde donc une valeur peu prs quivalente

celle de texte (1998:42), enquanto o enunciado for entendido como [...]

une squence verbale qui forme une unit de communication complte relevant

d'un genre de discours dtermin (1998:42).

Na obra supracitada, o texto merece pouca atengo em termos definitrios

0 texto incluido no mbito do estudo da lingustica textual, devendo ser

apreendido como um todo coerente, caracterizado por ser uma produgo oral

ou escrita. estruturado de forma a perdurar fora do contexto em que foi

enunciado.

Em Les termes cls de l'analyse du discours, Maingueneau ope discurso a

texto. com base na seguinte afirmago: En parlant de discours. on adicule

l'nonc sur une situation d'nonciation singulire; en parlant de texte, on met

l'accent sur ce qui lui donne son unit. qui en fait une totalit et non une simple

suite de phrase (Maingueneau, 1996:82). Depreende-se desta afirmago que

tanto o discurso como o texto so enunciados; o que os distingue, na realidade,

o ponto de vista sob o qual so abordados.

O discurso deve ser apreendido como um enunciado associado s

condiges em que foi produzido, enquanto o texto deve ser sentido, numa

62

pnmeira instncia, como um todo coerente, sendo tal coerncia um dos

parmetros que permite definiro conceito de texto.

O texto um documento que faz parte do todo, o arquivo, na acepgo de

Foucault. e pode ser analisado segundo duas realidades distintas: as

realidades inerentes sua produco e as realidades inerentes sua leitura,

isto . o momento em que o texto est a ser actualizado luz dos

conhecimentos e das realidades histncas e sociodiscursivas do leitor. Os

discursos so, maiontanamente, apreendidos sob forma de textos, recorrendo

o linguista ao conceito de texto ou de discurso em fungo da anlise que

pretende efectuar. 0 texto uma das formas privilegiadas para veicular um

discurso,

Distinguir discurso e texto, com base na essncia deste ltimo conceito, isto

, [...] productions verbales orales oucrites qui sont structures de manire

durer, tre rptes. circuler loin de leur contexte onginah (Maingueneau.

1998:43), parece-nos insuficiente para decidir, por exempio, se estamos a

trabalhar o texto jurdico ou o discurso jurdico, um texto cientfico ou um

discurso cientfico.

A possvel ambiguidade resultante da opgo por um ou por outro conceito,

texto ou discurso, deve-se, tambm, ao facto de o suporte fsico sobre o qual

se trabalha ser o mesmo. O texto escrito pode ser abordado do ponto de vista

discursivo e/ou textual, nem sempre sendo consciente e explcita a passagem

de um a outro nvel de anlise.

Bronckart considera que os textos podem ser apreendidos a diversos nveis:

o texto enquanto entidade gennca ou geral e o texto enquanto entidade

63

singular ou empnca (1996:73-79) 0 texto. na qualidade de entidade genrica.

definido do seguinte modo; [...] chaque texte est en relation

d'interdpendance avec les propnts du contexte dans lequel il est produit;

chaque texte exhibe un mode dtermin d'organisation de son contenu

rfrentiel; chaque texte est compos de phrases articules les unes aux autres

selon des rgles compositionnelles plus ou moins strictes; chaque texte enfin

met en oeuvre des mcanismes de textualisation et de prose en charge

nonciative destins lui assurer sa cohrence inteme (Bronckart, 1995:74).

O texto, enquanto entidade singular, definido como um objecto concreto que,

embora apresentando semelhangas com outros textos, possui caractersticas

especficas que o distinguem de todos os outros: Chaque texte singulier exibe,

en d'autres termes. des caractristiques individuelles et constitue de ce fait un

objet toujours unique (Bronckart, 1996:79).

Adam. por sua vez, tenta distinguir, do ponto de vista teorico e

metodolgico, texto de discurso. revendo algumas considerages que teceu,

nomeadamente, nos Elments de linguistique textuelle (1990). Nesta obra, ele

apresenta uma frmula para distinguir o discurso de texto, que sintetiza na

seguinte expresso:

Discours = Texte + Conditions de production

Texte = Discours - Conditions de production

Adam (1990), lments de linguistique textuelle. Bruxelles-Lige. Mardaga, p.23

54

De acordo com esta formulago. o texto um objecto desprovido das

condiges discursivas em que foi produzido. Na sua obra mais recente. Adam

afirma. actualmente. discordar da frmula que tinha proposto. uma vez no se

poder descontextualizar o texto das prticas discursivas: Cette formule ne doit

pas oprerla dcontextualisation queje prconisaisalors. II s'agit d'une formule

d'inclusion du texte dans le champ plus vaste de pratiques discursives [. . .]

(Adam, 1999:39). Por conseguinte, apresenta uma nova frmula, em

substituigo da antenor, que obedece seguinte expresso:

D I SCO U RSCONTEXTE

Conditions de production

et de

rception-interprtationTEXTE

Adam (1999). Linguistique textuelle. Des genres de discours aux textes,

Paris, Nathan. p. 39.

Decorrente desta remodelago, Adam prope definiges renovadas de texto

e de discurso, em que texto assume duas acepges distintas. Na primeira

acepgo, o texto entendido como um objecto abstracto que [...] I'objet

d'une thorie gnrale des agencements d'units [...] au sein d'un tout de rang

de complexit linguistique plus ou moins lev. [...]: na segunda acepgo, o

texto entendido como [...] objet[s] concret[s], matriel[s], empririque[s].

Chaque texte se prsente comme un nonc complet, le rsultat toujours

singulier d'un acte d'nonciation. C'est pas excellence, l'unit de l'interaction

textuelle [..,] (Adam, 1999:40).

Por seu turno, falar em discurso, acarreta implicages a dois niveis, que

Adam explicita do seguinte modo: [...] ouvnr le texte, d'une part. sur une

55

situation d'nonciation-interaction toujours singulire et. d'autre part. sur

l'interdiscursivit dans laquelle chaque texte est pns- en particulier celle des

genres (Adam, 1999:40). Inequivocamente. texto e discurso mantm uma

relago de interdependncia. no podendo um ser pensado sem o outro, uma

vez que o discurso actualizado apresenta-se, geralmente, sob forma de texto.

Deste modo, a separago entre o que pertence ao nivel do textual e do

discursivo . para este autor, essencialmente uma questo metodolgica:

Dans la pratique d'analyse qui nous retiendra prioritairement dans cet essai,

cette distinction tend a s'estomper (Adam, 1999:40-41). Pode infenr-se da

afirmago de Adam que a tendncia a de no distinguir os dois conceitos, a

no ser que tal distingo seja benfica para os objectivos da anlise em

questo.

Conclusivamente, falar em texto implica a nogo de discurso. uma vez que

o texto fixa um discurso que foi proferido por um indivduo, num espago e num

tempo especficos. Na perspectiva de Ricoeur (1986:137), o texto entendido

como [...] tout discours fix par l'cnture. Quanto a esta matria, Rastier

parece seguir a linha de pensamento de Ricoeur, uma vez que afirma: 11 nous

semble en effet que le concept de texte s'etend toute pratique linguistique

attest. produite dans une pratique sociale dtermine,et fixe sur un support

(1998:106) Deixa, assim, implcita uma aproximago terica entre os conceitos

de texto e de discurso.

A relago entre texto e discurso pressupe um entrecruzar constante dos

pressupostos tericos que suportamos dois conceitos, sendo, porm, o nosso

66

objecto de estudo. p texto enquanto entidade singular e concreta resultante de

uma produgo verbal especficajp verdadeiro objecto do nosso estudo.

Tendo em conta o exposto e a afirmago Le discours est concu comme

l'association d'un texte et de son contexte (Maingueneau. 1996:29), assim

como a asseverago de Rastier :[...] le texte est le lieu de rencontre entre le

contexte et l'intertexte (1998:107). julgamos pertinente abordar o texto

atravs dos seus contextos sociodiscursivos e lingusticos.

2.2 Contextos

0 texto pode, simultaneamente, ser entendido como produgo e produto de

uma comunidade de comunicago restrita (Maingueneau, 1992) ou nuclear

(Beacco, 1995). Nele concentram-se todos os elementos lingusticos e

extralinguisticos que do conta da interacgo da linguagem com a vida social,

que fazem com que o texto possa ser analisado ao mesmo tempo como um

processo e um resultado

A importncia dos parmetros extralinguisticos no momento da produgo

textual, perceptvets na anlise do texto enquanto produto de uma actividade

intelectual e social de um ou de um grupo de indivduos , presentemente, um

facto irrefutvel.

Diversas so as designages propostas para referir de forma no ambgua

a realidade que no pertence esfera da Lingustica, mas sim s esferas

social, psicolgica, pragmtica e/ou fsica, e que interfere na produgo textual,

reflectindo-se no produto final, o texto.

67

Designaremos a prion por contexto as realidades lingusticas ou no. que

envolvem o texto e a sua produgo. Rastier introduz o conceito de contexto

como elemento indispensvel interpretago de um texto. Para ele, o contexto

pode ser problematizado de distintas formas: [...] il est utilis soit pour

rintroduire une forme limite de globalite dans l'interprtation. soit pour lier la

langue une exteriorit en conditionnant la construction du sens la

connaissance de cette extenorit (Rastier, 1998:98).

Deste modo. o contexto pode assumir vrias significages, podendo o seu

uso ser gerador de ambiguidades. Bronckart um dos autores que evita a

utilizago do termo contexto por o considerar ambguo e por no o considerar

suficientemente abrangente. Prefere recorrer ao conceito de extralangage.

que considera um conceito operatrio, definindo-o como: [...] I'ensemble

thoriquement infini de toutes les entits mondaines en dehors du langage

(1995:26). Mas quando, por necessidade, se reporta ao contexto, f-lo

utilizando-o como sinonimo de extralangage. distinguindo este ultimo do

conceito de co-texto que remete, mequivocamente. para questes do foro

lingustico: [...] /e concept de contexte s'adresse 'extralangage, et qu'il faut

viter de le confondre avec l'environnement linguistique d'un conc. Pour

dsignerce dernier. nous utiliserons le conceptde co-texte [...] (1995:27).

Tambm Rastier distingue estes dois tipos de contextos considerando que o

contexto lingustico se define como un voisinage locah (Rastier, 1998:106), o

contexto extraverbal como uma situago.

68

Para que o texto seja apreendido como um todo. necessno que se

tenham em conta todos os parmetros lingusticos e extraverbais que intervm

no acto da escrita.

Na sua obra. publicada em 1996. Bronckart utiliza a expresso situation

d'action langagire para referir os parmetros que influem na anlise do texto,

entendido como objecto referencial. Diz-nos que Cette expression gnrale

dsigne les proprits des mondes formels (physiques, sociales et subjectifs)

qui sont sucpectibles d'exercer une influence sur la production textuelle

(1996:93). Tais parmetros podem ser subdivididos em situation d'action

langagire exteme e situation d'action langagire interne. A pnmeira diz

respeito as caracteristicas do mundo formal, isto , do mundo observvel. a

segunda. est relacionada com acgo interiorizada dos indivduos, tanto do

autor como do destinatno.

Para se referir s mesmas realidades, Dcles utiliza uma terminologia

distinta Distingue o contexto externo - Les contextes externes Ke font appel

des connaissances sur le domaine externe. sur les interlocuteurs. sur les

conditions de dialogue. sur les buts poursuivis et les tches resoudre....

(1997:216)- do contexto interno - Les contextes mternes K, reposent sur des

connaissances linguistiques qui entrent dans le co-texte d'une unit

linguistique (1997:216). Enquanto Bronckart utiliza o termo de co-texto para

designar o ambiente linguistico de um enunciado, Dcles utiliza-o para

designar o ambiente lingustico que envolve a unidade lingustica em anlise.

Para este autor, o conceito de co-texto abrange uma realidade linguistica

delimitada e curta, em comparago com o conceito de co-texto de Bronckart,

69

que remete para uma realidade linguistica que pode ser to vasta, quo vasta

pode ser o enunciado

Rastier sintetiza. de forma clara. as duas perspectivas de contexto

lingustico empregues pelos dois autores supracitados: [...] on peut opposer

deux conceptions du contexte linguistique: comme zone d'extension,

relativement au signe; ou de restriction. relativement au texte (Rastier.

1998:99). 0 contexto linguistico remete para duas realidades diferentes. Por

um lado, o contexto que envolve a unidade de significago em anlise.

correspondendo nogo de contexto utilizada por Dcles; por outro, o

contexto perspectivado como uma zona lingustica mais alargada, o texto na

sua amplitude. que esta em consonncia com o ponto de vista de Bronckart.

0 contexto lingustico, entendido como uma zona de extenso. permite

alargar a mformago conceptual, semntica e sintctica da unidade de

significago atravs da sua anlise. 0 contexto lingustico. entendido como

uma zona de restrigo, define-se como uma zona de localidade, sendo que

[...] un contexte n'est plus le contexte d'un mot, mais un passage du texte. Un

mot peu certes servir a choisir un passage dans une recherche [...]; mais

ensuite, c'est le passage qui devient l'unit tudie (Rastier. 1998:99).

Tanto Bronckart como Dcles tm por objecto de estudo o texto. sendo que

Bronckart desenvolve um mtodo de anlise baseado num modelo psicolgico,

ao passo que Dcles desenvolve um mtodo de explorago contextual que tem

por intuito a construgo de um sistema informtico baseado em conhecimentos

exclusivamente lingusticos. patentes no texto (cf. Dcles, 1997:215)

70

Bronckart (1997) analisa o funcionamento do texto e a sua arquitectura

interna partindo de pressupostos tencos sociodiscursivos subjacentes sua

cnago, enquanto que a abordagem de Dcles puramente linguistica.

pretendendo este autor cnar um modelo que parta de uma descngo lingustica

fina, por considerar que as unidades lingusticas soindices pertinentes para o

desenvolvimento de tarefas especficas. Assim sendo, isolar e observar o

contexto que envolve uma unidade lingustica primordial. uma vez que este

contm os elementos necessrios para melhor entender a unidade lingustica

em anlise. deixando marcas sua volta, que so passveis de serem

identificadas.

Pensamos que Bronckart pretende chegar a um entendimento sobre o

funcionamento do discurso e Dcles gnese do texto, para dele retirar

informago com vista ao tratamento automtico do texto.

Novamente, pensamos que os contextos lingusticos e extralingusticos se

subjugam. na medida em que o indivduo e o objecto produzem-se

reciprocamente. 0 contexto desempenha uma fungo mediadora entre o

indivduo e o mundo objectivo, ideia que Rastier expnme do seguinte modo:

[...], de mme que l'environnement est un concept intermdiaire entrecelui de

monde propre du sujet et celui du monde objectif, il semble que le concept de

contexte soit un pseudo-concept, qui tout la fois souligne et voile l'unit

entre le mot et le texte. comme le lien entre la situation et la pratique en cours

(Rastier, 1998:110).

71

0 contexto um conceito operatno. mediador entre o intralinguistico. o

linguistico e o extralingustico, sendo os mtervenientes os pnncipais

protagonistas da mediago.

2.3 Intervenientes

Para que haja comunicago, necessno a mtervengo de vnos actores.

No caso do acto da parole. os intervenientes so, no mnimo, dois, que ora

assumem o papel de falante, ora o de ouvinte. 0 outro. est presente, podendo

ou no intervir no acto de comunicago.

Mas se entendermos a nogo de parote no seu sentido mais lato,

podemos considerar que o discurso uma forma de parole. Falar em

parole na perspectiva saussuriana implica que se tenha subjacente a nogo

de lngua, o segundo elemento da construgo dicotmica. semelhanga desta,

podemos construir uma outra dicotomia constituida pelo par lngua- discurso:

En effet, si on entend par parole, avec Ferdinand de Saussure, la ralisation

de la langue dans un vnement de discours, la production d'un discours

singulierpar un locuteur singulier, alors chaque texteest par rapport la langue

dans la mme position d'effectuation que la parole (Ricoeur, 1986:138).

Ricoeur considera que o acto da escrita pode ser equiparado ao acto da

parole. na medida em que estes actos representam uma forma de

actualizago da lingua: La fixation par l'ecnture survient la place mme de la

parole, c'est--dire la place o la praole aurait p naitre (Ricoeur, 1986:138).

72

Tal aproximago dicotmica deve-se ao facto de, em consonncia com

Saussure, se poder considerar a lngua como um produto social e a parole.

tal como o discurso como um acto individual dependendo da vontade e da

inteligncia do individuo.

No caso da realizago da comunicago atravs do texto, sendo este

entendido como um produto material com contornos fsicos finitos, que fixa um

discurso profendo por um ou por vnos indivduos insendos em contextos

especficos, a relago entre o autor e o leitor caracteriza-se pelo facto de, regra

geral. a comunicago se concretizar na ausncia de um dos intervenientes,

sendo o texto, objecto fisico. o nico elo de ligago entre eles.

A actualizago da lngua uma actividade cooperativa que tem implicages

ao nivel dos seus mtervenientes. Para Charaudeau Tout acte de

communication est un objet d'change entre deux instances. I'une d'nonciation

l'autre de rception. dont le sens dpend de la relation d'intentionnalit qui

s'instaure entre celles-ci (1997:15). o que pressupe a existncia de trs

lugares distintos associados produgo, ao produto e recepgo da

transacgo verbal mediatizada pelo texto. Assim. a produgo integra-se no

lugar das condiges de produgo, o produto. no lugar da construgo do

discurso e a recepgo no lugar da interpretago.

0 processo de transacgo verbal realiza-se segundo quatro principios que

se complementam: o pnncipio da altendade. o princpio da pertinncia. o

princpio da influncia e o princpio da regulago (cf. Charaudeau. 1995:98-

100).

73

Para que a comunicago se realize, e necessrio que os intervenientes

tenham referentes em comum e que estejam aptos a reconhecer o universo de

referncias do outro (pnncpio da pertinncia), no obstante o autor e o leitor se

reconhecerem como sujeitos estrutural e psicologicamente diferentes (prmcpio

de altendade): Ainsi. ce pnncipe dit que chacun des partenaires est engag

dans un processus rciproque (mais non symtrique) de reconnaissance de

l'autre, dans une interaction ie lgitimant du mme coup dans son rle, ce qui

est une condition de validation de l'acte du langage (1995:99). 0 autor produz

um discurso ou um texto com a intengo de exercer influncia sobre o outro,

com o intuito de faz-lo agir, modific-lo (princpio da influncia). 0 leitor, por

seu turno. consciente ou inconscientemente, regula o jogo de influncias de

modo a viabilizar o intercmbio verbal (princpio da regulago).

Charaudeau considera que o processo acima explanado entra no campo

daquilo que ele convencionou designar por machine mdiatique (1997). Este

autor trabalha com o discurso de informago meditica, podendo, no entanto, a

sua perspectiva ser alargada ao discurso cientfico, na medida em que a

institucionalizago do discurso cientfico permite estabelecer simetnas com

outros discursos, onde a nogo de espago uma componente importante da

legitimago do discurso.

Os intervenientes so uma das componentes que Bronckart insere nos

parmetros extraverbais. mais especificamente na situation d'action

langagire interne, que identificmos como sendo a acgo interionzada dos

indivduos, tanto do autor como do destinatrio.

Este autor qualifica os intervenientes uns de activos.os autores. e os outros

de passivos, os destinatnos.0 interveniente activo o produtor de texto que

incorpora toda a situago social e psicolgica. 0 interveniente passivo o

destinatno do texto. o leitor, que tal como o interveniente activo, tambm

incorpora uma situaco social e psicolgica, cuja fungo ler, compreender e

interpretar o texto.

0 interveniente activo, neste caso. o especialista produtor de um texto

de especialidade, estrutura o seu saber em fungo de um pblico modelo, do

qual possui uma imagem prototpica. 0 pblico assim constituido por um

conjunto de indivduos que, numa primeira instncia, so considerados

intervenientes passivos, na medida em que. no momento em que o texto est a

ser construdo. eles no exercem qualquer tipo de acgo directa sobre o

mesmo.

No entanto. so intervenientes, porque esto presentes na mente do

autor que constri uma imagem do potencial leitor, instituindo deste modo a

competncia do leitor-modelo: [...] prever o prpno Leitor-Modelo no significa

apenas esperar que exista, significa tambm conduzir o texto de forma a

construi-lo (Eco, 1979:59). com base na imagem que construiu da

competncia do seu leitor-modelo que o especialista estrutura a complexidade

conceptual e lingustica que se reflecte num todo coeso: o texto de

especialidade. A elevada competncia atnbuida ao leitor-modeio, permite ao

especialista elaborar um texto com um alto nvel de cientificidade que se

repercute, geralmente, num texto denso e rigoroso. incompreensvel para o

no-especialista no conhecedor dos conceitos, das redes conceptuais e

referenciais que compem o discurso patente no texto.

Qualquer texto tem por fungo ser lido: [...] lire, c'est en toute

hypothese. enchainer un discours nouveau au discours du texte (Ricoeur,

1986:152). 0 leitor intervm, no momento em que o autor do texto considera o

seu trabalho de escnta acabado e o pe disposigo do outro A mudanga dos

meios histnco e social em que o texto foi produzido tem repercusses

imanentes ao nivel dos conhecimentos veiculados pelo texto: Si l'entour

change. le contenu du texte change aussi puisqu'il est immanentune situation

de commumcation matntenant modifie. En rgle gnrale. dans le cas d'un

changement d'epoque ou de culture. il s'appauvrit, par deperdition des

connaissances (Rastier. 1989:51).

Nestas circunstncias, deixamos de considerar o leitor um interveniente

passivo para assumir a fungo de mterveniente activo. com funges e graus de

intervengo diferentes da do autor.

Segundo Rastier, o leitor adopta duas posturas: a da leitura produtiva ou

a da leitura descntiva. No caso da leitura produtiva, o leitor [...] rinterprte le

texte au gre du rcepteur, pour la faire correspondre des situations et des

rfrents nouveaux. quitte ies recnre en partie (Rastier, 1989:51); no caso

da leitura descntiva, o seu objectivo a de restituir o contedo do texto, [...]

en reconstituant l'entour de la communication imtiale (Rastier, 1989:52).

Estamos convictos de que o leitor especialista faz, regra geral, uma

leitura produtiva, 0 leitor especialista apropna-se do texto, reestrutura a

informago recebida a luz do seu proprio saber e conhecimento. Ao ler o texto,

~6

o leitor - especialista acrescenta uma mais-valia ao seu saber. acrescenta

saber ao saber que j detem e. teoncamente. leitura aps leitura deste e de

outros textos. adquire competncias para produzir novos textos Os textos por

ele produzidos so adicionados aos textos j existentes e, conjuntamente.

desencadeiam processos semelhantes noutros leitores. Como refere Rastier:

En somme. tout texte est un centon (Rastier, 1989:39).

0 conjunto de todos estes textos constituem arquivos documentais e

arqueolgicos (Foucault, 1969) comuns aos membros de uma comunidade

cientfica: Dans cette chane les premiers mterprtants servent de tradition

pourles derniers interprtants [...] (Ricoeur, 1986:158).

3. Tipologia de tipos ou tipologia de gneros?

Para atingirmos o objectivo que nos propomos levar a cabo,

imprescindvel seleccionar cnteriosamente um conjunto de textos da

especialidade que ser o objecto de anlise, e que, de ora em diante, ser

considerado o pnncipal objecto de estudo. Tal deciso obnga-nos a reflectir

sobre os cntenos subjacentes selecgo, organizago e sistematizago

dos textos que passaro a constituir o corpus de referncia.

0 conceito de texto de especialidade demasiadamente genrico e

complexo por forma a permitir um tratamento uniforme de todas as ocorrncias

de textos produzidos no seio de uma mesma comunidade cientfica. O(s)

pblico(s) a quem se dinge(m), a pluralidade das situages e o enquadramento

77

espacio-temporal em que os diversos textos so produzidos e consumidos so

to divergentes. que se impoe a constituigo de uma tipologia.

Por tipologia entende-se [.. ] un ensemble de procdures permettant de

reconnaitre et detablir des corrlations entre deux ou plusieurs objets

smiotiques, ou leur rsultah (Greimas. 1979:403). 0 estabelecimento de uma

tipologia implica a classificago e a reunio de um conjunto de textos. que

mantm entre si relages de semelhanga ao nvel das respectivas macro e/ou

microestruturas, sob uma mesma etiqueta, atravs da identificago de

regulandades de uns conjuntos de textos, por oposigo s regulandades de

outros conjuntos. Para Petitjean, classificar significa [...] operer un

rapprochement entre des objets langagiers, toujours univoqueset diffrents, a

partir de caractnstiques (propnets) qui leur sont communes

(Petitjean, 1989:93). Na identificago, designago e classificago das

regulandades. que podem ser da ordem do sociolgico, do psicolgico, do

histnco e/ou do lingustico, entre outros, que se situa a essncia da

problemtica da tipologia. Contudo, uma classificagotraduz sempre, de forma

mais ou menos clara, uma redugo de informago das partes para se poder

compreender o todo.

A construgo de uma tipologia , assim, um processo cognitivo que passa

pelo estabelecimento de trs parmetros: 1) Une base typologique. 2) Un

domaine d'application caractns. 3) Une descnption des formes de mise en

rappod entre la base et le domaine d'application (Petitjean, 1989:95).

Identificar uma base tipolgica o ponto de partida para a estruturago de

quaiquer tipologia, uma vez que absolutamente indispensvel estabelecer os

~8

critnos que devem ser usados para a sua construgo. Os cntnos de base

devem ser adequados ao objecto de estudo, devendo ser reconhecidos e

aplicados parcial ou totalmente. estabelecendo a relago entre a base, o

objecto de estudo e a finalidade da anlise.

Petitjean distingue trs tipos de classificages: as classificages

homogneas, as classificages intermdiase as classificages heterogneas.

Por classificages homogneas entende-se [...] rava///e[r] partir d'une

base typologique unique et homogne sous la forme d'un modle abstrait,

souvent dductif, qui se ralise compltement ou partiellement dans un

domaine d'application donn (Petitjean, 1989:97). 0 resultado obtido atravs

da classificago homognea designada por tipo de texto.

Contranamente a classificago homognea, a classificagomtermdia parte

de uma base tipolgica heterognea, cujos cntnos se baseiam no modo

enunciativo, na intengo da comunicago e nas condiges de produgo. As

tipologias que resultam dessas classificages reflectem a mise en sttuation

des textes, das quais procedem as tipologias enunciativas. as tipologias

comunicacionais e as tipologias situacionais que o autor designa por tipos de

discursos.

Petitjean designa de heterognea a terceira e ltima classificago: [...] la

base typologique est totalement htrogne et comprend des critres qui

relevent des foyers classificatoires aussi diffrents que l'intention

communicative. le mode nonciatif. la stratgie illocutoire, [...] (Petitjean.

1989:117). Ao objecto de estudo, obtido atravs desta classificaco. Petitjean

atribui a designago de gneros de textos.

79

Se a tipologia das classificages. assim como as tipologias resultantes da

classificago intermdia, vingaram e so refendas como tipologias pertmentes

e funcionais, o mesmo no sucedeu relativamente s designages utilizadas

para distinguir os objectos resultantes de cada uma das classificages. que

Petitjean designou por tipo de texto. tipo de discurso e gnero de textos.

Existe. hoje, alguma confuso terminolgica no que diz respeito

classificago de textos e discursos em gneros ou tipos.

Tal constatago leva-nos a repensar a problemtica da distingo entre texto

e discurso Algumas questes podem ser colocadas e este respeito. A partir de

que realidades que podemos conceber tipologias^ Tivemos oportunidade de

referir autores como Adam que. em determinadas circunstncias, optaram por

no distinguir texto de discurso. Significa isso. que podemos falar

indiferentemente de tipos de textos e de tipos de discursos, de gneros de

textos e de gneros de discursos?

A tentativa de resposta a tais questes ocasiona a reflexo sobre o gnero,

conceito que. embora geralmente associado ao de discurso, tem repercusses

ao nvel da classificago dos textos.

Para ilustrar o que atrs ficou dito, optmos por apresentar um quadro

revelador da diversidade terminolgica, reflexo de posicionamentos tencos

diferentes, face aos mesmos objectos de estudo:

80

Tipos de texto Tipos de discurso

+ +

+

+

+

Gnero de texto Gneros de discurso

Schaeffer(1986)

Petitjean (1989)

Rastier(1989)

Bronckart(1996)

Maingueneau (1998)

Adam(1999)

Classificar os textos em tipos uma actividade de cariz sociolgica e no

lingustica, sendo o gnero o conceito constitutivo da acgo verbal: Les

genres de discours relvent de divers types de discours. associs de vastes

secteurs d'activit sociale (Maingueneau, 1998:47). Para este autor, a

elaborago de tipologias de discursos e de textos s pertinente caso se tenha

em conta o gnero, conceito fundador da actividade verbal : Tout texte relve

d'une catgorie de discours. d'un genre de discours (Maingueneau, 1998:45).

Falar em tipos de discurso, significa estabelecer parmetros em harmonia com

os diversos sectores da sociedade, cada um desses sectores produz discursos

e textos que podem ser classificados em tipos. A investigago cientfica um

81

Schaeffer(1986)

Petitjean (1989)

Rastier(1989)

Bronckart(1996)

Maingueneau (1998)

Adam(1999)

+

+

+

+

+

+

sector de actividade. cuja produgo textual e discursiva constitui um tipo.

porque o produto de uma actividade social especfica.

Quando o discurso ou texto analisado como o resultado de uma

actividade verbal interdependente de parmetros extralingusticos. que so

uma componente intrinseca da actividade da parole saussunana. estamos

perante os gneros. [...] c'est-a-dire des dispositifs de communication qui ne

peuvent apparaitre que si certaines conditions socio-histonques sont rumes

(Maingueneau, 1998:47).

Existe, assim, uma relago de dependncia hierrquica entre os conceitos

de gnero e de tipo. necessno que determinadas condiges sociais sejam

preenchidas para que exista um tipo de discurso ou de texto do qual decorrem

gneros

Na perspectiva defendida por Maingueneau, a relago entre tipo de discurso

e gnero de discurso pode ser esquematizada do seguinte modo:

Tipo de discurso

Meditico

"\ r

Tipo de discurso

Radiofnico

Tipo de discurso

Televisivo

Tipo de discurso

Imprensa

Gnero de discurso

Talk Show

82

Os mdivduos reconhecem estruturas- do nvel do textual, discursivo.

histnco, pragmatico. social, psicoidgico.etc. -

que. obedecendo a protdtipos

interiorizados, Ihes permitem ordenar os textos ou discursos em gneros.

Segundo Kleiber. [...] le prototype est le meilleur exemplaire qui es reconnu

comme tan le meilleur par les sujets* (Kleiber, 1991:104) Kleiber relembra

que o reconhecimento de um objecto como sendo prototpico implica uma

perceppo mdividual estando. na globalidade, em conformidade com a

percepco do colectivo.

0 conceito de protdtipo implica um modelo conceptual gennco que nos

leva a refenr Schaeffer. autor que considera a generacidade como sendo

uma caracteristica mtrnseca constituco do gnero. Segundo Schaeffer, o

conceito de gnero pressupe uma extenondade gennca, que este defme do

segumte modo: [...] c'esf /a procdure qui consiste a produire la notion d'un

genre non a partir d'un reseau de ressemblance existant entre un ensemble de

textes. mais en postulant un texte idal dont les textes reels ne seraient queles

dnvs plus ou moins conformes. de mme que selon Platon les objets

empiriques ne sont que de copies imparfaitesdes Idees eternelles* (1986:190)

O conceito de gnero surge. assim, comouma realidade abstracta ideal. do

qual decorrem textos empncos, que so ocorrncias de um ou de diversos

gneros.

Schaeffer acredita que um texto especifico no tenta reproduzir de forma

fiel um modelo gennco, tenta sim modifica-lo: [..] tout texte modifie son

genre: la composante gnrique d'un texte n'est jamais (sauf exceptions

ranssimes) la s,mple rduplication du modele gnrique constitu par la classe

83

de textes (supposes antneurs) dansla ligne desquels il se situe. Au contraire

pour tout texte en gestation le modele genenque est un matenel parmi

d'autres sur lequel il travaille (Schaeffer, 1986:197).

Os conceitos de texto e de gnero implicam-se mutuamente. sendo que a

no existncia e o desconhecimento de gneros impossibilitana a

comunicago. na medida em que seria necessno estar constantemente a

re.nventar novas formatages ou modelos para poder profenr um discurso

adequado a uma situago especfica: Si les genres de discours n'existaient

pas et si nous n'en av,ons pas la maitnse. et qu'il faille les creer pour la

premire fois dans le processus de la parole, qu'il nous faille construire chacun

de nos nonces, l'change verbal serait impossible (Bakhtine, 1984, p.285).

Independentemente de se pnvilegiar o texto em detnmento do discurso, ou

vice-versa, ambos decorrem de gneros. cabendo-nos,neste mbito, reflectir

sobre que objectos teoncos que se concebe tipologias: tipologias de tipos de

discurso ou de texto ou tipologias de gneros de textoou de discurso?

Optar. em conscincia. recorrer a um genero de discurso. implica o

conhecimento das condiges necessanas para que o discurso seja bem

sucedido em termos sociais: Acte de langage d'un mveau de compiexit

supneure. un genre de discours est soumis lui aussi a un ensemble de

conditions de russite (Maingueneau, 1998:51).

Tais condiges obedecem a cntnos diversos da ordem do social e do

lingustico. No campo sociolgico, so requeridas quatro condiges: a

finalidade do discurso, a legitimago dos intervementes no discurso, a

adequago do discurso ao espago e ao momento em que profendo e a

84

identificago ou a utilizago do suporte adequado em conformidade.

particularmente. com a intengo do discurso (cf. Maingueneau, 1998:50-54). A

ltma condigo situa-se no campo do lingustico e diz respeito prpria

organizago textual.

A distmgo entre tipo e gnero, preconizada por Maingueneau, no

adoptada por Adam. que rejeita, na globalidade, o conceito de tipo de texto:

J'ai consacr plusieurs articles. entre 1987 et 1992. et en un livre (1992)

tenter d'expliquer pourquoi il est mon sens, profondment erron de parler de

types de textes (Adam, 1999:82). Para este autor. o texto uma unidade

demasiadamente heterognea e complexa para se poder identificar

regulandades lingusticas, que possam ser consideradas o sustentculo de

uma tipologia. Sugere que se elaborem tipologias das sequencialidades

presentes no texto, reduzindo para a sua anlise a extenso do texto.

Partindo do pressuposto de que Adam tem o mesmo entendimento que

Maingueneau da concepgo de tipo. compreensvel que rejeite as tipologias

de tipos de textos, uma vez que a sua abordagem predominantemente

lingustica: C'est dire qu'au-del des formeslementaires de squentialisation

dontje vais parler des codifications sociales- gnriques

- sont l'oeuvre dans

toute communication verbale (Rastier. 1989:37), codifications qui de toute

vidence. ne relvent pas d'une theonsation strictement linguistique et que je

suis bien oblig. de ce fait, d'carter provisoirement de ma rflexion (Adam,

1992:15).

Mais recentemente. Adam afirma aceitar o conceito de tipo, quando

utilizado como sinnimo de gnero Si l'on tient parler de types au niveau

8

global et complexe des organisations de haut niveau. ,1 ne peut s'agir que de

pratiques sociodiscursives. c'est--dires de genres (Adam, 1999:83). Segundo

este autor, o conceito de gnero permite congregar anlises lingusticas e

sociais.

Em 1985, Bronckart defendia a existncia de tipos de textos, conceito que

abandona postenormente: La notion de type de texte sera notamment

abondonne. au profit de celles de genres de texte et de types de discours

(1996:13). Enquanto Maingueneau e Adam utilizam preferencialmente o

conceito de gnero associado ao de discurso, Bronckart usa a nogo de gnero

associada ao conceito de texto: Et dans la mesure ou tout texte s'inscrit

ncessairement dans un ensemble ou dans un genre, nous avons adopt

l'expression de genre de texte. de prfrence ceile de discours (Bronckart,

1996:78). Pensamos, no entanto, que a definigo de tipo utilizada por Bronckart

no corresponde de Maingueneau. Bronckart considera haver uma

multiplicidade de gneros, provocada pela multiplicidade de actividades

humanas, o que dificulta a abordagem ao gnero. Em contrapartida. os

segmentos (segmentos de argumentago, de dilogo, ...) que entram na sua

composigo so fmitos e podem ser identificados pelas suas regularidades

linguisticas, o que justifica a sua escolha terica: Ces segmentes diffrents

entrant dans la composition d'un genre constituent le produit d'un travail

particulier de smiotisation ou de mise en forme discursive. et c'est pour cette

raison que nous les qualifierons dsormas de discours. Dans la mesure o ils

prsentent de fortes rgularits de structuration linguistique, nous considrons

qu'ils relvent de types, et nous utiliserons donc pour les dsigner l'expression

86

de type de discours. de prfrence a celle de type textueh (Bronckart,

1996:78). Bronckarl diverge dos outros autores. no s quanto a distingo de

texto e de discurso. como tambm relativamente s definiges de tipo e de

gnero. Tal divergncia deve-se ao posicionamento terico assumido por cada

um dos autores Bronckart defme, a priori. o seu enquadramento terico: Nos

propositions thonques relevent d'une psychologie du langage. elle-mme

onente par les principes pistmologiques de l'interactionisme sociah

(Bronckart, 1996:11). Tal nvel de anlise situa-se a um nvel diferente da de

Adam. cuja perspectiva se msere na ptica da lingustica textual, posicionando-

se Maingueneau na senda da anlise do discurso.

Da definigo de discurso dada por Rastier, depreende-se que a nogo de

gnero est ligada de discurso e a nogo de tipo de actividade social. Para

este autor discurso [un] ensemble d'usages lingistiques codifisattach a un

type de pratique sociale (Rastier. 1991:247). Esta ideia j tinha sido expressa

antenormente: Puisque le sens d'un texte est immanent a une situation de

communication. et que les situations typiques dterminent des types de textes.

les parcours interprtatifs qui permettent de re(construire) le sens textuel sont

dtermins par le type de texte (Rastier, 1989:35). Contranamente a

Maingueneau e a Adam, Rastier admite distinguir claramente os conceitos de

discurso e de texto: Nous cartons l'usage tnspir de la linguistique anglo-

saxonne qui assimile discours et texte (1989:39). Consequentemente,

segundo este autor, no pode proceder-se constituigo de tipologias

indiferenciadas de textos e de discursos. Utiliza a expresso tipo de texto

para refenr-se s diversas funges perceptveis num texto, que designa por

87

tipologia das funges ou por tipologia funcional dos textos, enquanto relaciona

o conceito de gnero de discurso com as prticas sociais associadas a um tipo

de uso lingustico considerando que: Tout locuteur participe plusieurs

pratiques sociales et doit donc possder plusieurs comptences discursives.

Chacune suppose la maitnse d'un ou plusieurs genres (1989:40). Se o texto e

o discurso esto mterligados atravs do gnero. ento poder-se- identificar as

funges textuais mais usuais no seio de um gnero de discurso, permitindo

assim chegar a um maior entendimento do mesmo.

Pensar o texto implica pensar o discurso. e pensar texto e discurso implica

pensar tipo e gnero. Para Rastier [...] un genre est ce qui rattache un texte

un discours (Rastier, 1989:40), no deixando este autor, porm. de considerar

as relages de dependncia mutuas que unem os tipos aos gneros: Les

rgimes interprtatifs des types de discours (politiques. religieux, etc.) sont

enfin spcifis par les contrats interprtatifs propres aux genres (Rastier,

1998:109).

Na sequncia deste debate. adoptamos a perspectiva de Rastier que

defende a distingo entre texto e discurso, perspectiva contrna defendida

pela escola anglo-saxnica. 0 ponto de vista. segundo o qual se aborda o

enunciado que pr-determina a sua aproximago textual ou discursiva.

Deste modo, consideramos que a elaborago de tipologias de tipos. assim

como as tipologias de gneros resulta da observago das condiges

sociodiscursivas em que foi produzido um texto. testemunho representativo de

uma colecgo de textos que, no seu conjunto, caracteriza um discurso.

88

Se, peio contrno, os critrios de classificago forem consequncia de uma

anlise linguistica apurada, estamos, em nosso entender. claramente perante

uma tipologia de textos, organizada segundo denominadores comuns aos

textos que a compem. Esta tipologia e designada de tipologia a posteriori: La

typologie a postenon part des donnes textuelles elles-mmes pour proposer

des catgories issues de l'examen et du regroupement de traits linguistiques

(Habert, Fabre, Isaac. 1998:40).

A tipologia a pnon corresponde ao que ns convencionmos denominar de

tipologia de tipos de discursos e de tipologia de gneros de discursos. que

Habert, Fabre. Isaac, influenciados por Sinclair e Ball (1996) definem como:

La typologie a pnon s'appuie sur des catgories pr-tablies de genre [...]. de

domaine ou sur ia dtermination du contexte de production [...] (Habert. Fabre

Isaac, 1998:40).

0 textos decorre de um discurso, porm no podemos tomar a parte pelo.

todo. 0 estudo minucioso de um texto cientfico, no nos permite afirmar

conhecer e dominar o discurso cientfico. Julgamos, contudo que um corpus

reflecte as propriedades de um tipo de discurso ou de vrios tipos de discursos.

tendo em conta que um texto uma ocorrncia de um ou vrios gneros. que

estabelece(m) o elo de ligago entre o texto e o(s) discurso(s).

89

4. Constituigo do corpus em detecgo remota

4.1 . Definigo da rea de especialidade em anlise: Detecgo Remota

0 termo Detecgo Remota, ou Teledetecgo. designa todo o sistema de

aquisigo de mformago sobre os objectos terrestres - reunidos nos trs

grandes dominios gua, solo e vegetaco- sem contacto fisico entre o

instrumento de medida e o objecto. Nesta acepgo geral. a Detecgo Remota

rene um vasto conjunto de conhecimentos cientficos. tcnicos e tecnolgicos

que conduzem observago da Terra a partir do espago, essencialmente por

satlite e por avio, utilizando as propriedades da radiago electromagntica.

Lillesand e Kiefer definem Detecgo Remota como (...) the science and

art of obtaining information about an object. area. or phenomenon through the

analysis of data acquired by a device that is not in contact with the object, area

or phenomenon under investigation (Lillesand: Kiefer, 2000:1). Estes autores

baseiam a defmigo, exclusivamente. na distncia que separa o objecto

observado e o sensor, entendido este como dispositivo de medida de energia

electromagntica emitida e/ou reflectida pela superfcie terrestre.

Campbell (1996:5), pelo contrrio, no d nfase distncia entre

objecto observado e o sensor, mas sim ao papel da radiago electromagntica

(REM), ou seja, propagago da energia atravs do vazio ou de um meio

natural. sob forma de ondas vectonais transversais, velocidade da luz e em

interacgo com a matria: Remote sensing is the practice of deriving

information about earth's land and water surfaces using images acquired from

an overhead perspective. usmg electromagnetic radiation in one or more

90

regions of the electromagnetic spectrum. reflected or emitted from earth's

surface (CampbelP.1996:5).

As definiges anteriores. baseadas, como refenmos. na nogo de

distncia fisica e de REM, no contemplam, contudo. todos os processos que

envolve a Detecgo Remota. nem fazem referncia tecnologia que Ihe est

associada. Aquilo que omisso nas definiges de Lillesand e Kiefer (2000:1) e

de Campbell (1996:5) est claramente expresso na definigo de Bonn. segundo

o qual: La tldtection est la discipline scientifique qui regroupe l'ensemble

des connaissances et des techniques utilises pour lobservation, l'analyse.

I'interprtation et la gestion de l'environnement partir de mesures et d'images

obtenues l'aide de plates-formes aroportes, spatiales, terrestres ou

maritimes. (...) (Bonn. 1992:3). Este autor admite, na sua definigo, embora

de forma indirecta, a evidente nogo de distncia que incorpora o formante

"tele-" - (...) partir de mesures et d'images obtenues l'aide de plates-

formes aroportes (..,) -. mas no Ihe atribui a importncia dada por Lillesand

e Kiefer e por Campbell.

A anlise dos mais recentes manuais de referncia em Detecgo

Remota dingidos ao ensino e investigago e escntos em francs, castelhano

ou em ingls- alm dos citados podemos referir, entre outros, Girard e Girard

(1999), Chuvieco (1996). Jensen (1996) - permite concluir que a definigo do

conceito de Detecgo Remota abarca:

A nogo de distncia. a partir da qual se pode definir a Detecgo

Remota como o conjunto de mtodos e tcnicas utilizadas para

determinar as caractersticas fisicas e biolgicas dos objectos por

91

intermdio de medidas efectuadas a distncia, sem contacto material

com os mesmos objectos. A nogo de REM, meio pelo qual possvel

conhecer um objecto ou um conjunto de objectos distnbuidos

espacialmente em fungo de um ou mais sinais electromagnticos

numa ou mais bandas do espectro; da evolugo do sinal

electromagntico do objecto no tempo (hora, ano, estago do ano ou

dcada); da repartigo espacial do objecto: das ligages espaciais e

temporais do objecto com outro que Ihe seja vizinho, mas de natureza

qumica. geoqumica ou biolgica diferente.

A nogo de aplicago, que faz da Detecgo Remota um conjunto de

mtodos e de tcnicas necessrios para determinar a natureza de um

objecto ou de um conjunto de objectos, considerando o seu

comportamento espectral num contexto espacial e temporal definido. A

nogo de aplicago inclui a no menos importante nogo de

processamento digital de imagem- ou tratamento numnco de imagens

-

que incorpora os procedimentos para extrair os dados de Detecgo

Remota (fotografias areas. imagens de satlite. termografias, imagens

radar, entre outras), a informago sobre a natureza e a forma e a fungo

dos objectos superfcie da Terra.

No contexto das Cincias Sociais e Humanas, nomeadamente em

Geografia- uma das Cincias que mais uso faz das imagens de satlite -, a

Detecgo Remota sustenta-se nos dois elementos seguintes:

92

- os pxeis de uma imagem no so considerados apenas como uma

medida de REM, mas sim como um meio de acesso a uma mformago

caracteristica do espago geogrfico estudado:

- a anlise. visual ou numnca, reporta-se, frequentemente. aos objectos

geogrficos, s texturas, s estruturas e s formas de organizago espacial

que traduzem o estado de interacges mltiplas e as respostas- actuais ou

passadas- das sociedades s modificages das paisagens.

Pode concluir-se, ento, que o conceito de Detecgo Remota. em

sentido amplo, no engloba apenas os meios (plataformase sensores areos e

orbitais) e os processos (REM, radar, sonar, etc.) que permitem obter dados

sobre a Terra mas abrange tambm o seu postenor tratamento no mbito de

uma determinada aplicago ou duma 'reflexo pura", que conduz ao

conhecimento cientfico.

0 esquema seguinte ilustra a forma como pode ser entendido o conceito

de Detecgo Remota.

OBJECTOSFSICOS

SENSORES AEREOS E ORBITAIS

EXTRACQO DE INFORMAgOESPECTRAL E CONTEXTUAL

m

RADIAQOELECTROMAGNETICA

TECNOLOGIA AERO-ESPACIAL

PROCESSAMENTO DIGITAL

DE IMAGEM

.-

USO DO SOLO

APLICAQES

SOLOS VEGETAQO AGUA GEOLOGIA

93

A ideia central esquematizada a de a Detecgo Remota no

representa apenas o conhecimento tecnolgico exigido pela observago da

Terra; esta nogo entendida tambm como uma cadeia de processamentos

numricos. que d forma s aplicages nas mais vanadas reas do

conhecimento (Cincias Agrrias. Geografia, Oceanografia, Geologia.

Climatologia. Ecologia. Pedologia, Urbanismo, etc).

Os textos produzidos pela comunidade cientfica portuguesa utilizam

sempre as denominages Detecgo Remota e Teledetecgo como smnimos

totais. Este fenmeno constata-se, por exemplo. em artigos publicados em

revistas de especialidade, em comunicages apresentadas em colquios, em

seminrios e em congressos, em teses de mestrado e de doutoramento e at

na designago oficial das disciplinas dos planos de estudos dasLicenciaturas e

dos Mestrados

Em Portugal, existe um nmero considervel de universidades onde se

lecciona Detecgo Remota. Esta disciplina ensina-se, mais precisamente, em

15 universidades e institutos politcnicos. mcluindo os sectores pblico e

privado, de acordo com o apuramento realizado a partir dos dados disponveis

na Internet em Julho de 2001 - relativos ao nmero de instituiges de ensino

supenor e politcnico e contedos programticos de Detecgo Remota. 0

ensino ministrado quer ao nvel das Licenciaturas (74%) quer ao nvel dos

Mestrados (26%); cerca de 50% das disciplinas esto circunscritas s

universidades e institutos politcnicos da regio de Lisboa. Os contedos

programticos compreendem, na sua maioria, reas de aplicago terrestre ou

costeira; as aplicages ao domnio ocenico so ainda muito incipientes.

94

Exclumdo apenas um caso em que o ttulo evidencia uma clara articulago da

Detecgo Remota com os Sistemas de Informago Geogrfica- o que

significa, no nosso entender, uma transversalidade clara da Detecgo Remota

em muitas reas de aplicago -. as restantes disciplinas ou se intitulam

Detecgo Remota ou de Teledetecgo (51%) ou especificam, na

designago. a rea de especializago (49%); por exemplo: Detecgo Remota

em Ecologia (Departamento de Ecologia da Universidade de vora);

Cartografia e Teledetecgo (Departamento de Geologia da Faculdade de

Cincias da Universidade de Lisboa).

Da anlise efectuada podemos concluir, quer do ponto de vista tcnico e

tecnolgico quer do ponto de vista cientfico, nada de substancial diferencia a

definigo dos conceitos de Detecgo Remota e de Teledetecgo. sendo

estes dois termos igualmente correctos do ponto de vista da sua formago. Por

esta razo, so usados indiscriminadamente, sem gerar ambiguidades na

comunicago entre especialistas. 0 que pode afirmar-se. ainda que tendo por

base uma observago empnca. que existe uma relago entre a utilizago de

uma ou outra designago e a "escola" que serviu de formago cientfica aos

docentes e investigadores: Detecgo Remota - do ingls Remote Sensing-

mais utilizada pelos docentes e investigadores de formago anglfona e

Teledetecgo- do francs Tldtection - pelos especialistas de formago

francfona.

95

4.2. Constituigo de tipologias

4.2.1. Tipologia de tipos de discurso

A tipologia de tipos de discurso em Detecgo Remota que propomos

baseia-se na observago e na anlise dos textos escritos em portugus

europeu que constituem o corpus . A primeira sntese dessa anlise.

esquematizada na figura seguinte, pressupe que:

a) a Detecgo Remota tem o seu prprio discurso e estando tambm

presente nesta rea do saber o discurso das outras cincias. das outras

tecnologias e das outras tcnicas que Ihe so conexas. Na verdade. entre, por

exemplo, a Detecgo Remota e a Geografia existe um objecto de estudo

comum: a superfcie da Terra. Contudo. enquanto a Detecgo Remota

pertence, em pnmeiro lugar, ao largo espectro das Cincias da Informago e de

Observago da Terra, a Geografia est onentada para a explicago das

relages espaciais entre lugares geogrficos caracterizados por diferentes

atributos. Neste sentido, a Detecgo Remota poder ser entendida como uma

tcnica auxiliar da Geografia, fornecendo-lhe a informago espacial necessria

compreenso dos fenmenos localizados. Este exemplo pretende mostrar a

dificuldade - e at a relativa artificialidade - em estabelecer uma tipologia de

tipos de discurso numa rea do conhecimento com elevado nvel de

transdisciplmaridade.

b) a "atomizago" das aplicages da Detecgo Remota produz

"'discursos temticos" fundamentados na cincia, na tecnologia e na tcnica

que a Detecgo Remota incorpora. Esses discursos, que designamos

"temticos" por terem origem nas mais diversas cincias, associam o

96

TIPOS DE DISCURSO EM DETECQO REMOTA

DISCURSOCIENTIFICO DISCURSOTECNOLOGICO DISCURSOTECNICO

DISCURSOSDASCINCIASFUNDAMENTAIS.

Fisica (fisica da atmosfera.

electromagnetismo optica,

optico-electrnica, metrologia,

acustica)

Matemtica (lgica. derivago,

pnmitivago, trigonometria)

Estatistica (estatistica

descntiva. estatistica inferencial

e probabilidades, estatistica

multivanada e classificages de

dados)

Informtica (algontmia.

Iinguagens de programaco)

DISCURSOSCIENTFICOSINTERDISCIPLINARES

Cincias Geogrficas

Cincias da Terra

Cincias Sociais

Telecomumcaces

******* *:m^;^r.<h-mr

DISCURSOS DAS

TECNOLOGIAS

Tecnologia aerea

Tecnologia espacial

Tecnologia acstica

Instrumentos de registo

de dados

Sistemas de armazenamento

e de transmisso de dados

Instrumentos de tratamento

de dados

Instrumentos de edico

de dados

Instrumentos de gesto

e de difuso de dados

DISCURSOS TECNOLOGICOS

INTERDISCIPLINARES:

Geodesia

Topografia

Cartografia

Sistemas de Informagc

Geogrfica (SIG)

DISCURSOS DAS

TCNICAS

Processamento Digital

de Imagem

Anlise visual de imagem

Tcnicas analgicas

Tcnicas digitais

Tcmcas

aerofotogramtncas

Tcnicas cartogrficas

Tcmcas topogrficas

Tcnicas infogrficas

DISCURSOSTCNICOS

INTERDISCIPLINARES:

"Tcnicas temticas"

Tcnicas de trabalho de

campo

Tcnicas geomticas

'^^^11; :U<^

DISCURSOS EM DETECQO REMOTA APLICADA

Ambiente

Cartografia e Geodesia "*-.

Geografia

Geologia

Hidrologia

Meteorologia

Oceanografia

Ordenamento do Territrio

Pedoiogia ^,^"'Outras aplicages,.

-"'"

97

conhecimento fundamental - no sentido estrito de discurso das cincias

fundamentais - ao conhecimento tecnolgico e ao conhecimento mais prximo

da acgo, para darem ongem aos discursos da Detecgo Remota Aplicada.

Apesar de a Detecgo Remota ser uma rea em que grande a

transdisciplinanedade, podem a ser reconhecidos quatro tipos pertinentes de

discurso. isolados a partir da intervengo conjugada de dois tipos de fronteiras:

- a fronteira da natureza do conhecimento - responsvel pela

determinago do conhecimento cientfico. do conhecimento tecnolgico

e do conhecimento tcnico;

- a fronteira dos contedos, determinada a partir da utilizago das

unidades terminolgicas em contexto de discurso de especialidade-

conhecimentos de Detecgo Remota aplicados em disciplinas muito

diversas.

A fronteira da natureza do conhecimento implica a ufilizago de um conjunto

de conceitos caractensticos e prpnos de cada um dos supracitados tipos de

discurso. Esta especificidade. reconhecvel nos trs tipos de discurso em

Detecgo Remota - discurso cientfico, discurso tecnolgico e discurso tcnico

- no encontra paralelo no quarto tipo, designado discurso em Detecgo

Remota Aplicada, dado que, por exemplo, termos diferentes podem apresentar

significados iguais em contextos discursivos de especialidade. Por exemplo. os

termos resolugo espectral e separago espectral- muito frequentes no corpus

constitudo - denominam o mesmo conceito; o pnmeiro vulgarmente utilizado

por gelogos, gegrafos, entre outros especialistas, enquanto o segundo

96

especialmente utilizado pela comunidade cientifica da Engenhana do Ambiente

e da Biologia.

Assim, entendemos que as fronteiras mais rgidas que servem esta

tipologia de tipos encontram-se na natureza dos discursos e no natureza dos

contedos temticos.

0 pnmeiro tipo de discurso refere-se ao que designamos por discurso

cientfico. Este tipo decorre dos dominios cientificos fundamentais a que est

associada a Detecgo Remota: a Fsica. a Matemtica, a Estatstica e a

Informtica. Pela propria natureza do conhecimento que estas disciplinas

envolvem - o conhecimento das cincias duras- os discursos, recorrendo

formulago matmtica, revelam o uso de mtodos quantitativos e experimentais

(por exemplo, da fsica atmosfrica e do electromagnetismo). Os fenmenos

so apresentados como fenmenos isoladose controlados cientificamente para

se proceder modelago no espago e no tempo ( o caso, por exemplo, dos

discursos que apresentam os resultados da espectrometna da vegetago ou

dos solos). A complexidade da formulago matemtica. nomeadamente da

primitivago e da denvago. e, claramente, o trago mais emblemtico deste tipo

de discurso.

0 segundo tipo, o discurso tecnolgico, envolve uma componente

fortemente ancorada na descngo dos sistemas de observago da Terra. A

este nvel, os discursos apresentam a panplia de tecnologia disponvel

(sondas espaciais. satlites de observago passiva da Terra. sistemasRADAR

e LIDAR e SONAR. avies para observago a muito grande escala) para medir.

armazenar e/ou transmitir s estages de recepgo em Terra, o smal que

99

contm, de forma codificada, a informago sobre os objectos. A utilizago

intensiva de noges tecnolgicas relativas aos instrumentos de medida,e sua

importncia estratgica para a evolugo do conhecimento sobre a Terra,

constitui o denominador comum dos discursos que designamos por

tecnolgicos.

0 discurso tcnico trata o conhecimento tcito da Detecgo Remota.

Isso significa que se trata de um discurso que agrupa os fundamentos dos

discursos enunciados anteriormente para, a partir deles. construir a base de

conhecimentos tcnicos necessrios percepgo espectral, espacial e

temporal dos objectos observados a distncia.

0 discurso tcnico integra. por isso, o tratamento da informago contida

em imagens (de satlite, de avio. de RADAR, etc.) para. a partir dele,

reconhecer as caractersticas fsicas, biolgicas e funcionais dos objectos Este

discurso baseia-se na descrigo e anlise da investigago e desenvolvimento

das tcnicas de processamento digital de imagem; integra uma forte

componente de informtica aplicada, na medida em que traduz formalizages

rnatemticas e estatsticas em algoritmos para reconhecer objectos. quer pelos

atributos relativos sua radiometria quer pelos atributos relativos forma.

Estes discursos caracterizam-se na maior parte dos casos, pela

existncia de noges frequentemente utilizadas pelas aplicages temticas Por

isso, anunciam a passagem entre a Detecgo Remota e aquilo a que

poderemos chamar Detecgo Remota Aplicada. Na verdade, as diferentes

disciplinas e as diferentes comunidades de investigadores fazem uso do

discurso tcnico da Detecgo Remota, quer para equacionar problemas de

100

reconhecimento dos objectos (geogrficos, ambientais, pedolgicos,

meteorolgicos. oceanogrficos, etc). usando a cincia e a tecnologia aero-

espacial. quer para renovar os mtodos de investigago.

0 quarto tipo de discurso em Detecgo Remota decorre da utilizago

implcita dos trs discursos anteriores. Os discursos em Detecgo Remota

Aplicada, conforme o designamos, so discursos claramente disciplinares; ou

seja, utilizam intensivamente os conceitos do ramo de saber especializado-

Cincias do Ambiente, Engenharia Geogrfica, Geografia, Urbanismo. Biologia,

Engenhana Florestal, Engenharia Agrcola, etc.- sem deixarem de reconhecer

os fundamentos cientficos, tecnolgicos e tcnicos dos outros discursos 0

que distingue este tipo de discurso dos anteriores (trata-se de um problema de

fronteira de contedos, j referida) , por outro lado, a elaborago da

problemtica a partir da qual se elaboram as hipteses, se tratam os dados

espectrais, se cnticam os resultados e se retiram as concluses.

Estas etapas (equago do problema, elaborago das hipteses.

tratamento dos dados, crtica dos resultados e concluses) esto fortemente

condicionadas pela especificidade do discurso disciplinar no seio do qual

ocorrem. . por isso, frequente encontrar tendncias paraa sinonimia, para a

polissemia e para a homonimia.

Em sntese, podemos considerar que a fronteira da natureza do discurso

funciona bem na delimitago dos trs pnmeiros tipos, porque a sua unidade

discursiva mais forte. por apresentar maior identidade. Por outro lado, a

fronteira da natureza dos contedos- com manifesta repercusso nas unidades

terminolgicas- fundamental para balizar, por vezes dificilmente, os

101

discursos da Detecgo Remota Aplicada, dado os numerosos campos de

aplicago disciplinar e a diversidade de comunidades cientificas que produzem

estes discursos de especialidade.

4.2.2. Tipologia de gneros de discursos

A prtica da anlise dos tipos de discurso revela, tambm, o gnero de

discurso. Esta prtica denuncia, com relativa facilidade. uma separago entre

as abordagens estritamente cientfica, estritamente tcnica e estritamente

didctica.

Considerando o conjunto de textos recolhidos e mformatizados.

podemos identificar sete gneros. de acordo com o discurso dominante.

conforme se indica no quadro seguinte:

Cientfico Tcnico Didctico

Teses (Mestrado e Doutoramento)

Artigos em revistas de Detecgo Remota"

Artigos em revistas temticas"

Comunicages em eventos de Detecgo Remota*

Comunicages em eventos temticos**

Manuais e sebentas

Relatnos de projectos de l&D

*

As revistas e os eventos tendem a incluir a Detecgo Remota no grupo das Tecnologias

de Informaco Geogrfica (TIG), grupo que associa os Sistemas de Informago Geogrfica

e a Cartografia Digital s tecnologias e sistemas de observago da Terra

**

"Temtico' significa. neste contexto, a produco cientfica das diferentes reas

disciplinares (Engenhana Geogrfica Geografia. Geologia, Urbamsmo Cartografia, etc ).

102

As teses de Mestrado e Doutoramento. denotam estruturas discursivas

dominantemente cientficas; aliam o quadro terico. baseado no tipo de

discurso cientfico - leia-se das cincias fundamentais -. experimentago

tcnica desenvolvida com recurso algoritmia. Neste gnero, o texto revela

forte conceptualizago matemtica. estatstica e informtica, quase sempre

aliada ilustrago atravs de imagens resultantes do processamento digital de

dados de satlite. Embora as imagens tenham sido subtradas ao texto, assim

como as frmulas, julgamos que elas podem servir como material para explorar

uma vertente ainda pouco investigada: a ligago do texto imagem e o

"modelo semntico" que Ihe est associado. Na realidade, a imagem constitui

outro tipo de discurso que aqui deixamos como pista de mvestigago futura:

Que discurso substitui uma imagem? Que terminologia estar associada a esse

discurso?

Os artigos em revistas de Detecgo Remota evocam, em pnmeiro lugar.

a tcnica como justificago da mvestigago: o 'paradigma dominante' , por

isso, a resolugo de um problema concreto decorrente da vontade explcita da

comunidade cientfica em determinar uma solugo ou melhorar um processo j

existente (por exemplo, a aplicago de redes neuronais no melhoramento das

classificages automticas de dados de satlite).

Os artigos em revistas temticas articulam o discurso dominantemente

cientfico (proposigo de um problema novo, de indole geogrfica. geolgica,

urbanstica, etc.) com o discurso tcnico (uma tcnica nova, ou reformulada),

ao servigo da resolugo de um problema. frequente encontrar neste gnero a

103

reflexo terica sobejamente debatida a luz de novos dados e de novas

tcnicas de Detecgo Remota.

As comunicages em colquios, congressos e seminrios de Detecgo

Remota pnvilegiam o discurso tcnico, enquanto as apresentadas em eventos

temticos revelam o lugar pnmordial da reflexo cientfica conjugada com a

utilizago de novas tecnoiogias. Muitas vezes difcil entender se os resultados

so apresentados como evolugo real da temtica analisada (novas

interpretages e novas descobertas sobre um mesmo ou diferente problema),

se apresentados como 'propaganda cientfica' de novos matenais (os dados de

Detecgo Remota) disposigo da comunidade. Este gnero mostra, por

vezes, marcas muito fortes da oralidade. facto que no se estranha

considerando as circunstncias sociodiscursivas em que ocorre.

Os manuais e sebentas so um gnero muito distinto dos restantes. com

dominncia do discurso didctico. combinando o detalhe e o rigor dos

discursos cientifico, tecnolgico e tcnico. Apesar de a produgo deste gnero

no proliferar em Portugal, podemos referir que os manuais existentesmostram

grande abundncia terminolgica. Nos textos representativos deste gnero de

discurso acedemos. por exemplo, s formas extensas de siglas e de

acrnimos, sendo a maior parte destas formas abreviaturas de unidades

terminolgicas multilexmicas de lnguas inglesa e francesa. o caso dos

acrnimos pixel (picture element), RADAR (radio detection and ranging) e de

HRV (Haute Rsolution dans le visible) Por outro lado. tambm neste gnero

de discurso que o especialista tem a preocupago de descrever e de definir os

conceitos que utiliza no decorrer do seu discurso.

104

Os relatnos de projectos de l&D revelam uma combinago equilibrada

dos discursos cientfico e tcnico. 0 atributo mais peculiar o de insistir na

pertinncia da demonstrago dos resultados e no erro envolvido na formulago

das hiptese imciais. Constituem. frequentemente, um gnero que denota

ambiguidades na definigo de conceios, facto que se explica pelo contexto em

que tais textos se produzem (o da investigago de novas soluges para novos

problemas) e pela necessidade, aparente. de designar a mesma coisa com

termos diferentes. Esta observago tambm se justifica na medida em que este

gnero elaborado em circunstncias disciplinares muito diversas. quer quanto

substncia quer quando forma como produzido.

0 corpus que, no mbito desta dissertago, serve de base anlise e

descrigo composto por textos representativos dos gneros acima referidos,

que decorrem de discursos cientficos. tecnolgicos, tcnicos, assim como da

detecgo remota aplicada.

105

Captulo III

Denomina^o:

expresses nominais multilexmicas

1. Denominago

2. Expresses nominais multilexmicas

2.1. Lexias

2.2. Sinapse

2.3. Nome composto

2.4. Colocago

2.5. Frasemas

3. Fraseologia

Captulo III - Denominago: expresses nominais

multilexmicas

1. Denominago

A criago e a produgo cientficas implicam a sistematizago, a

estruturago e, eventualmente. a modelizago do conhecimento, sendo estas

actividades o resultado da conceptualizago dos objectos. 0 objecto

entendido, aqui, como o que dado experincia, o que independente do

espnto. A organizago e a hierarquizago da estrutura conceptual so factores

essenciais para a apropnago dos conhecimentos em qualquer rea de

especialidade. o que demonstra que a identificago e a delimitago dos

conceitos pressupem um julgamento por parte do especialista, tarefa que no

isenta de dificuldades. Diz-nos Moles a este respeito: Nous vivons au milieu

des phnomnes vagues, de choses imprcises. de situations perptueliement

variables dans lesquelles il faut nous dcider. ragir ou agir prendre position.

Si vagues soient-elles. pourtant. toutes les choses apparaissent notre

conscience comme des objets conceptuels, nous leur donnons des noms. et

nous faisons sur elles des oprations, mentales d'abord, pratiques ensuite,

nos hsques et prils (1995:13).

A terminologia, enquanto teoria, debruga-se sobre a relago entre o

conceito e o termo. A identificago do conceito e sua definigo esto na base

da terminologia uma vez que, teoricamente. a terminoiogia utiliza uma

metodologia onomasiolgica, isto . isola o conceito e estabelece,

107

seguidamente. a relago entre os vrios conceitos que constituem o sistema

conceptual dentro de uma area do saber. Para que o conceito seja perceptivel

e a comunicago possvel necessrio denominar o conceito. Segundo Felber,

Les notions ne peuvent pas tre pergus par les sens. C'est pourquoiil faut aux

fins de la communication. utiliser des symboles linguistiques. qui sont aussi des

objets individuels (Felber.1 987:141). Repare-se que, na verso francesa da

referida obra, o termo ingls concept traduzido pelo termo francs

notion. em deterimento do seu equivalente mais prximo. concept.

Tambm a norma ISO/FDIS 1087-1:2000 segue esta onentago terica,

considerando conceito e nogo sinnimos um do outro.

Por sua vez, Rey distingue claramente nogo de conceito. definindo a

nogo como l'objet de connaissance -

qui pose un objet et le dfinit en tant

que vise de son activit e o conceito como l'acte de pense de l'objet de

pense (ide) en tant qu'abstrait et que gnra/(1 979:29).

No pretendemos debater mais longamente esta questo, optando por

utilizar, preferencialmente, o conceito de conceito, respeitando, neste texto, a

designago utilizada por cada um dos autores.

Muitas tm sido as definiges que se tem dado de conceito numa

perspectiva terminolgica. isto . funcionalista. com o mtuito de contribuir para

uma metodoiogia das prticas terminogrficas. A mais conhecida, porque

normalizada, a definigo que nos dada pela norma ISO/FDIS 1087-1:2000

(E/F), que define conceito como sendo uma [...] unit de connaissance cre

par une combinaison unique de caractres. Sager apresenta outras

definiges, tais como a seguinte: A concept is a unit of thought, produced by

108

grouping of individual objects related by common characteristics (Sager

1990:23),

No entanto, pensamos que a defmigo mais prxima do que acabmos

de expor a definigo que provm de uma alterago que a ex-Unio Sovitica

prope norma ISO 1087:1990 (E/F), que obedece seguinte formulago: A

concept is a coherent group ofjudgements concerning an object whose nucleus

is made up of those judgements which reflect the inherent characteristics of the

objech (Sager, 1990:23).

Todas as definiges de conceito aqui apresentadas so fluidas; fluidos

so tambm os conceitos nas reas de especialidade, particularmente nas

cincias moles (cf. Moles. 1995). A no delimitago clara do conceito

reflecte-se na transmisso dos conhecimentos. isto . na comunicago

especializada, assim como nas definiges desses mesmos conceitos e,

portanto, na relago biunvoca entre o conceito e sua denominago, isto , o

termo.

Efectivamente, o especialista e/ou o terminlogo apreende o conceito

delimitando-o em fungo da sua prpria formago, em fungo da viso que tem

do mundo, 0 especialista olha e reflecte sobre o conceito, sob um determinado

prisma que tentar retratar o melhor possvel. no momento de transmitir o

conhecimento que tem acerca desse conceito. Como observa Bjoint. On

pourrait dire que le concept n'existe que dans l'esprit du spcialiste (1997:20).

A comunicago, neste caso, especializada. diz respeito transmisso de

conhecimentos, havendo um intercmbio de formas e de representages entre

o emissor e o receptor. Para Lamizet, [...] le rel [...] est exclu [de la

109

communication]. car le rel ne se communique pas: il se vit. il se pergoit. il fait

l'objet d'expriences (Lamizet, 1992:19). Embora seja o emissor a transmitir o

seu conhecimento, impregnado da sua viso do mundo, o receptor que filtra a

mensagem e a reconstri em fungo do seu conhecimento: L'acte de pense

s'accomplit dans l'individu. mais les rsultats de cet acte sont communiqus et

controlbles par d'autres. Car la communication langagire est toujours

conceptuelle: elle est le rsultat de l'utilisation des concepts (Czap, 1989 71 ).

Ao abordarmos os conceitos operatrios de conhecimento e de

conceito, temos conscincia de que nos encontramos ao nivel do

extralingustico. na medida em que a fungo do termo a de veicular

informago cientfica e tcnica. No plano lingustico, a insergo do termo no

enunciado, especializado ou no. inteiramente dependente do sistema da

lngua em causa.

Em terminologia, e fundamental no confundir os dois planos distintos

de anlise, o extralingustico e o intralingustico, que coabitam, mas no se

sobrepem. No pode confundir-se conceito com significado, uma vez que este

ltimo, na perspectiva de Saussure, no se dissocia do significante. formando

ambos uma unidade indivisvel, o signo lingustico. Em contrapartida, o

conceito tem uma existncia independente; existe alm da denominago. Desta

forma, so os tragos conceptuais que compem um conceito e o distinguem de

outro, no devendo ser confundidos com os tragos distintivos, tragos

semnticos ou semas dos significados (cf. Manuelito, 1995:137-141).

As componentes que constituem os conceitos so por sua vez, tambm

elas, conceitos. Tal como defende Felber, Le caractre est un lment de la

110

notion qui sert a dcrire ou identifier une qualit d'un objet individuel. Le

caractre lui-mme est une notion( 1984:99). No entanto. este autor faz a

distingo entre as caractersticas. componentes dos conceitos e as

propriedades, componentes dos objectos; [...] the concept is a thought unit

composed of characteristics assigned to properties of objects (Felber, 1994 /

1995:164).

Sager utiliza, indistintamente, caractersticas e propriedades, afirmando

que as caracteristicas do conceito so cada uma das propriedades que o

descreve: Characteristics can be expressed as properties of the conceph

(Sager, 1990:25).

Se no nos parece de grande relevo terico a diferenciago entre

propriedade e caracterstica, no podemos dizer o mesmo relativamente

utilizago indiferenciada de sema e de propriedade ou caracterstica. uma vez

que os planos de anlise em que estes termos devem ser aplicados so

distintos. Podemos. no entanto, estabelecer aproximages tericas e

considerar que os semas esto para a significago como as propriedades ou

caractersticas esto para o conceito.

A actualizago lingustica do conceito faz-se atravs da denominago,

no havendo, necessariamente. uma relago de correspondncia entre os

tragos conceptuais que possui um conceito e os elementos de nominago que

constituem a respectiva denominago. Thoiron (1996 : 514) defende que ao

designar-se um conceito, nem todos os tragos conceptuais so activados,

considerando que os que no so designados podem, eventualmente, ser

inferidos a partir dos conhecimentos enciclopdicosdos locutores.

1 1 1

O texto escrito uma das formas pnvilegiadas ao qual o especialista

recorre para transmitir e aceder ao conhecimento. Partindo de um corpus

textual. o terminlogo acede s denominages, podendo. numa primeira

instncia identificar alguns tragos conceptuais por intermdio dos elementos de

nominago. Os outros, os que no so perceptveis atravs da leitura do texto,

so os que nos so dados a conhecer pelos especialistas: Les traits

conceptuels les plus immdiatement acessibles aux tudes terminologiques

(par opposition ceux qui n'apparaissent que par l'interrogation des

spcialistes) son ceux auxquelles correspondent des lments de nomination.

L'accs au concept se fa'it alors par la mdiation du terme et en particulier de

ses lments de nomination (Bjoint; Thoiron. 1997:515). Mas nem sempre o

especialista consegue dar todos os esclarecimentos de que necessitamos

porque, como refere Bjoint (1997:20), no se pode conhecer um conceito na

sua globalidade, mesmo quando se especialista. Alm do mais, nem tudo se

pode exprimir atravs da lngua.

Porm, o que nos motiva so as actualizages da lngua mais em

concreto, as unidades terminolgicas estruturalmente complexas. cuja fungo

no texto a de denominar conceitos.

Assim, as denommages so. na sua essncia. unidades terminolgicas

que designam conceitos especficos de uma ou de vrias esferas do

conhecimento e que, teoricamente. so comuns aos indivduos que constituem

uma comunidade de comunicago especializada.

De um ponto de vista morfossintctico. os termos estruralmente complexos

so constitudos por dois ou por mais lexemas separados por um espago em

112

branco, podendo entre eles existir gramemas autnomos (artigos, preposiges,

...) ou uma marca grfica. tal como o hifen: imagem de satlite, imagem-

textura, filmes infravermelhos coloridos.

As denominages que nos interessa analisa. so unidades terminolgicas,

cujas estruturas morfossintcticas so monolexmicas ou multilexmicas (cf.

Capitulo 3, p. 112).

Numa perspectiva meramente lingustica, as unidades termmolgicas so.

na sua maior parte, expresses nominais complexas; so essas as estruturas

que nos interessa identificar, descrever e seleccionar atravs de processos

inerentes ao tratamento automtico da lngua natural.

2. Expresses nominais multilexmicas

2.1. Lexias

A tentativa de determinar as fronteiras das expresses nominais complexas

recorrendo para o efeito ao estabelecimento de critrios que permitem apartar

uma sequncia fixa de uma sequncia livre. tem sido largamente explorada.

A multiplicidade de terminologias cnadas pelas diferentes escolas

lingusticas para designar, descrever e analisar as unidades de significago

constitudas por dois ou mais elementos lexicais. originariamente com

autonomia morfolgica, sintctica e semntica. separados por um espago em

branco mterligados entre si por valores que se fundamentam em critrios

linqusticos e/ou conceptuais, um indcio da dificuldade em estabelecer

113

condiges necessrias e suficientes para a delimitago e subsequente

definigo dos vnos tipos de expresses nominais complexas.

A dificuldade em designar e em definir as unidades complexas. que no so

abrangidas pela composigo, segundo a definigo dada pela gramtica

tradicional, leva alguns autores a propor novas designages e a delinear

critnos que permitem a demarcago das diferentes estruturas que podem

assumir as unidades linguisticamente complexas.

Em 1967. Pottier introduz a nogo de lexia como elemento de base da

estruturago sintctica, opondo-a a morfema, unidade mnima de significago e

a palavra. unidade mnima construda. A lexia caracteriza-se por ser uma

unidade de comportamento, constituda por palavras, que se realiza como uma

unidade de comportamento significativa em discurso.

Pottier considera que as lexias se actualizam em lexias simples, em lexias

compostas e em lexias complexas.

A lexia simples corresponde inequivocamente palavra simples e palavra

derivada da gramtica tradicional. Em contrapartida. a distingo entre lexia

composta e lexia complexa no est suficientemente demarcada. Da lexia

composta, Pottier d-nos a seguinte definigo: La iexie compose contient

plusieurs mots dj en part'ie ou totalement intgrs (graphiquement, ou dans

leur comportament tactique: un bnse-glace (Pottier, 1967:17). No que se

refere lexia complexa, esta definida como: [...] une squence pius ou

moins fige de mots: faire une niche. en avoir plein le dos. pomme de terre, au

furetmesure, [...] (Pottier, 1967- 17)

Estas duas definiges no so claramente distintivas. uma vez que ambas

remetem claramente para uma coeso morfossintctica e semntica. De um

ponto de vista terico. as duas classes de entidades lingusticas,

pressupostamente distintas, que so cobertas pelas duas designages, lexia

composta e lexia complexa, no so, em consonncia com as respectivas

definiges. demarcadas umas das outras. A pnmeira definigo est prxima da

definigo de palavra composta dada pela gramtica tradicional, em que o hfen

um elemento identificador. Por sua vez, a definigo de lexia complexa, e de

acordo com os exemplos apresentados, remete pressupostamente para todas

as estruturas que indiciam um determinado grau de coeso e que no so

abrangidas pela definigo de lexia composta.

No nos parece que as definiges apresentadas por Pottier sejam

suficientemente esclarecedoras para permitirem a elaborago de critrios para

demarcar a lexia composta da lexia complexa.

Pottier tem, no entanto. o mrito de apontar para a existncia de sequncias

fixas que se distinguem das sequncias compostas. Tal facto evidenciado

pela introdugo do modificador complexo, que deixa supor um grau de

estabilidade lingustica mais ou menos fixa entre os constituintes de uma

estrutura morfossintctica, que podem co-ocorrer com uma frequncia mais ou

menos elevada. Os critnos que permitem a identificago dos parmetros para

a avaliago da sua estabilidade no se confundem com os critnos que

permitem definir a composigo da gramtica tradicional.

O termo de lexia complexa , em nosso entender, um genhco

extremamente produtivo e operacional, na medida em que frequentemente

115

empregue para designar toda e qualquer sequncia discursiva fixa,

independentemente da descrigo lingustica a que sujeita.

Tambm Mel'cuk (1995), no mbito da Teona Lmgustica Sentido-Texto,

privilegia a nogo de lexia. Para este autor, a lexia a unidade de base da

lexicologia, que deve ser considerada nas suas vertentes semntica, sintctica

e lxico-combinatria, e que engloba todas as suas possveis actualizages:

simples, composta e complexa: [...] il nous suffit de dire que lexie ou unit

lexicae, est soit un mot pris dans une acception b'ien spcifique (=lxeme), soit

encore une locution, elle aussi prise dans une acception bien spcifique

(=phrasme) (Mel'cuk, 1995:16).

Mel'cuk no se detm nas premissas que permitem distinguir um lexema de

um frasema. A lexia assume o valor de qualquer sequncia morfolexical que

possa ser objecto de descrigo lexicolgica, conferindo este autor uma

importncia maior lexia, em detrimento das regras que permitem agrupar o

conujunto das lexias em unidades coesivas de um nvel estrutural supenor: En

exagrant quelque peu, on pourraitdire que l'ensemble des lexies est

la langue.

En effet. une langue est constitue de lexies et de rgles servant ia

manipulation de ces dernires. Les rgles qui runissent les iexies en

syntagmes, les syntagmes en phrases, et les phrases en discours sont donc

nettement secondaires par rapport aux lexies - en ce sens que leur nature et

leurforme sont determines par les lexies (Mel'cuk, 1995:17).

A descrigo semntica do Ixico est no centro do quadro terico de

Mel'cuk, sendo a lexia monolexmica ou multilexmica (cf. Mel'cuk, 1995:45),

que assume o valor de lexema e de frasema, respectivamente, o plo de

atracgo, relegando a sintaxe para um plano secundrio.

2.2. Sinapse

Em 1974, Benveniste isola estruturas morfossintcticas complexas que se

distinguem dos compostos, propondo um novo termo para as designar: a

sinapse: 11 consiste en un groupe entier de lexme, relis pardivers procds,

et formant une dsignation constante et spcifique (Benveniste, 1974:172).

Para este autor, a smapse designa realidades lingusticas estruturalmente

complexas. cujo estatuto no est claramente definido. No entanto, a sua

elevada produtividade, particularmente, nas nomenclaturas tcnicas, justifica

uma observago mais minuciosa.

A sinapse identificada como um fenmeno predominantemente sintctico,

que se define por um conjunto de propriedades. que se elevam a sete: 1. a

natureza sintctica que liga os constituintes; 2. a utilizago dos determinantes

de e a que unem os seus constituintes; 3. a ordem linear determinado mais

determinante. 4. a conservago da forma plena dos seus constituintes e a livre

escolha do substantivo ou do adjectivo; 5. a ausncia de artigos antes do

determinante: 6. a possibilidade de expanso de um ou de outro constituinte e,

finalmente, 7. o carcter nico do significado (cf. Benveniste. 1974: 172-173).

Os critrios elaborados por Benveniste demonstram a pertinncia do

estabelecimento de parmetros para a delnmtago das fronteiras entre

117

composigo e outras estruturas coesas. Porm, os cntenos apresentados nem

sempre so distmtivos e, consequentemente, funcionais.

Repare-se, a titulo de exemplo. no segundo cntrio, que diz que para se

estar perante uma sinapse necessrio a presenga das preposiges de ou a.

No entanto, podemos apresentar inmeros exemplos em que tal facto no

acontece: imagem textura, camio reservatrio, entre muitos outros. Estas

duas unidades no so consideradas compostas. uma vez que no obedecem

aos cntnos que nos permitem identific-las como tal. mas encaixam na

definico dada por Benveniste, apesarde no obedecerem aos parmetros por

ele elaborados. Nestes dois exemplos, alm de no recorrerem s preposiges

de ou a, ficando o segundo parmetro anulado, tambm o terceiro critrio no

pode aplicar-se, na medida em que a ordem linear determinado mais

determinante no est claramente identificada.

Os critrios elaborados so da ordem do sintctico. uma vez que

Benveniste classifica os compostos e as sinapses como pertencentes s

funges sintcticas. No entanto, o ltimo critno situa-se no mbito do

semntico e do conceptual: C'est toujours et seulementla nature du dsign

qui permet de dcider si ia dsignation syntagmatique est ou n'est pas une

synapsie [...] (Benveniste ,1974:173).

Benveniste acaba por nos dar indcios querevelam de modo claro que no

nos podemos reger exclusivamente por cntrios sintcticos para delimitar

fronteiras entre as vnas sequncias estruturalmente complexas que abundam,

essencialmente, nos textos de especialidade.

118

Acreditamos que os cntnos que determinam as regras lingusticas para a

delimitago de fronteiras dos diversos tipos de unidades complexas, denvam

de diferentes niveis de anlise lingustica, que devem ser explorados caso se

demonstrem profcuos e operacionais

2.3. Nome composto

0 nome composto a designago mais frequentemente utilizada para se

designarem as expresses nommais complexas, sendo na composigo que

este fenmeno lingustico encontra a sua maior expresso. No entanto, os

cntnos para a delimitago da entidade lingustica para a qual o nome

composto remete. nem sempre so muito ngorosos e nem sempre renem o

consenso dos linguistas.

Em 1992, Corbin coloca algumas questes fundamentais, que permitem

reequacionar a nogo de nome composto, bem como os cntnos para o

estabelecimento das suas fronteiras. A autora aponta duas abordagens

lingusticas distintas s palavras compostas que, embora frequentemente

efectuadas de forma uniangular, se complementam.

A primeira abordagem palavra composta considerada externa, uma vez

que tem por objectivo a sua identificago enquanto unidade lexical, sendo o

resultado final o reconhecimento de uma sequncia complexa lexicalizada. A

segunda abordagem interna. na medida em que tenta compreender a

formago de palavra a fim de entender os processos linguisticos que Ihe esto

119

subjacentes. sendo o objecto de estudo, neste caso, as sequncias complexas

cuja estruturainterna corresponde aos pressupostos tencos pr-defmidos

Propondo-se descrever o papel que assumem os constituintes na

estruturago do sentido das palavras construdas por derivago e por

composigo, que se opem s palavras simples. defimda pela incapacidade de

se decompor em elementos mais pequenos, independentementedo seu valor,

Corbin entende que: Un mot complexe est une umt lexicale complexe

construite par des rgles lexicales conjoignant des units lexicales a pouvoir

rfrentieh (Corbin, 1992),

Embora a diferenciago entre a denvago e a composigo possa por vezes

ser fluida e as denominages destes dois processos difceis de fixar, tal

diferenciago no minimo reveladora de uma percepgo mtuitiva que deve ser

perscrutada.

Corbin parte do pressuposto terico de que as palavras construdas podem

ser definidas como: [...] I'association, gouverne par une rgle. d'unschma

d'interprtation a une structure (Corbin, 1992), concluindo que o modo de

construgo do sentido se faz por duas vias distintas, consoante se trate de

palavras construdas por afixago ou por composigo, Contranamente aos

afixos, os constituintes das palavras compostas tm um poder referencial.

situado ao mesmo nivel da base da palavra construida: [...] un mot compos

est un mot complexe dont le sens est construit par la combinaison de

constituants a pouvoir rfrentielLa regle de composition rgit la combinaison

de ces constituants, leur nature, leur ordre dans lequel ils apparaissent et

impose un schma d'interprtation plus ou moins dtermin (Corbin, 1992).

120

Esta inferncia inerente a estrutura interna da palavra composta, sendo

objecto de estudo da morfologia lexical.

Mas a descngo morfolexical da palavra composta no nos permite, s por

si. distingui-la de outras estruturas livres ou de outras construidas por outras

vias, que no sejam as regras de composigo ou de afixago. Por este motivo,

Corbin restringe a significago da etiqueta palavra composta a um [...] sous-

ensemble d'units lexicales construites par des rgles lexicales de

composition (Corbin. 1992), sendo todas asestruturas que no se definem por

esta via outra coisa que no palavras compostas, no obstante serem

formadas por palavras construdas.

Em 1997, Corbin define palavra composta como [...] des unts lexicaes

construites morphologiquement a partir des constituants sens rfrentieh

(Corbm, 1997:82), o que corresponde lexicalizago de unidades

morfologicamente construdas.As unidades que correspondem lexicalizago

de sequncias sintacticamente construdas, so designadas por mots

construits syntaxiquemenh, recorrendo a autora etiqueta unidade

polilexemtica para designar, genencamente, as unidades lexicais

morfossintcticas complexas.

O que nos interessa reter da abordagem terica de Corbin, a distingo

que estabelece entre sequncias lexicalizadas, sequncias em via de

lexicalizago e sequncias coesas.

Tal como G. Gross, Corbin sustenta a sua teoria na identificago das

propnedades que determinama solidanedade entre os constituintes que firmam

as expresses complexas. Enquanto que G. Gross elabora uma teoria dos

121

compostos. partmdo do pressuposto de que a coeso escalar. Corbin

considera a coeso uma consequncia da lexicalizago, produto terminado,

resultante de um processo lexical que conduz coeso En effet. la

lexicalisation envisage soit un processus en devenir. soit un processus

accompli. mais pas le processus en tant que potentialit, c'est--dire dans sa

dimension prdictible (Corbin. 1997:58). 0 que a motiva, no o produto

acabado, mas os factores ligados ao modo de construgo que favorece a

lexicalizago. que se caracteriza por: a) a sua extenso longitudinal entre duas

extremidades e a complexidade da sua estrutura, b) o tipo de estrutura e c) a

natureza do mecanismo gramatical que est na ongem da estrutura (cf. Corbin,

1997:58-59).

A coeso de uma sequncia o produto de um processo de transigo da

sintaxe para o lxico. em que as propriedades smtcticas e semnticas de cada

um dos constituintes que compem a sequncia ficam diludas pelas relages

de solidariedade que mantm entre si. Deste modo, [...] c'est [...] la

lexicalisation qui favorise le figement et donc la fixation de certaines proprits

(Corbin, 1997:87),

As unidades polilexemticas podem, assim, ser classificadas em fungo de

critrios sintcticos e morfolgicos, que permitem a identificago da estrutura e

da construgo das palavras compostas. que ocasionam a produgo de

sequncias complexas lexicalizveis.

Deste modo, prope a designago de palavra composta para denominar

sequncias morfologica e sintacticamente construdas e etiquetas como GN

lexicalizado para designar o tipo de categona lexicalizada:

122

1 . palavras compostasEx: timbre-poste

2. predicado lexicalizado Ex: pousse-au-cnme

3. GN lexicalizado ^' coffre-fort

4. SN prp lexicalizado Ex: hors-la-loi

5. predicado complexo lexicalizado Ex: va-et-vient

6. frase formulno lexicalizada Ex: on-dit

Enquanto Corbin restringe a significago de palavra composta nominal, G.

Gross expande a significago desta, na medida em que reformula a definigo

de nome composto, propondo uma designago nova. Tal reformulago denva

da influncia crescente do desenvolvimento da informtica aplicada aos

estudos da lingustica. Assim, o seu ponto de partida [...] Iister les noms

composs sur la base de leur structureet dcnre avec prcision l'ensemble des

paramtres qui sparent les suites f'iges des suites libres. et montrer par l

que le figement est un phnomne scalaire (Gross, G., 1996:26-27).

Tambm G. Gross preconiza a nogo de palavras construdas. que podem

ser derivadas ou compostas, sendo estas ltimas mais difceis de identificar

uma vez que existem palavras intermdias que podem ser uma ou outra das

realidades. Quando os elementos constitutivos das palavras so nomes ou

palavras com autonomia dentro da lngua. impe-se uma anlise mais

depurada.

G. Gross aborda a composigo numa perspectiva sintctico-semntica e

considera o composto o ncleo privilegiado do grupo nominal, sendo o nome a

categona gramatical mais produtiva do ponto de vista da estabilidade

123

morfossinttica e semntica. estabilidade essa que designa de figement e

que ns traduzimos por coeso.

Tambm Mathieu-Colas aceita a nogo de composigo de G. Gross

afirmando: [...], nous convenons de dsigner, sous l'appelation de noms

composs. toutes les formes nominales non soudes prsentant un certain

"degr" de figement. quelles qu'en soit la prsentation (1997:72).

Uma definigo estritamente formal no serve para distinguirmos uma

sequncia livre de uma sequncia composta. No caso da sequncia N + Adj

temos, por exemplo a sequncia imagem digital que segundo a terminologia de

G. Gross um composto e 'imagem original que uma sequncia livre. embora

as suas estruturas sejam as mesmas de um ponto de vista meramente

gramatical.

A coeso para G Gross a propriedade que mais fortemente caracteriza os

compostos, sendo esta o resultado de um processo que une de forma durativa

os constituintes de uma sequncia, qual G. Gross atribui a designago

composto sempre que este constitua o ncleo de um grupo nominal. Para este

autor, uma sequncia adquire o estatuto de nome composto quando existem

constrangimentos sintcticos e semnticos que coagem a liberdade mdividual

de cada um dos seus constituintes. A redugo parcial ou total da liberdade

exercida por cada um dos constituintes que formam um composto, leva G.

Gross a determinar a existncia de uma gradago de estabilidade lingustica

que agrega os seus elementos lexicais. sendo o grau de coeso vanvel e

medvel. preconizando a coeso como [...] un phnomene scalaire (Gross.

G., 1996:27).

124

Para a medigo desse grau de estabilidade. G. Gross recorre a cntrios

smtcticos e semnticos: Une squence est fige du po'mt de vue syntaxique

quand elle refuse toutes les possibilits combinatoires ou transformationnelles

qui caractrisent habituellement une suite de ce type. Elle est fige

smantiquement quand le sens est opaque ou non compositionnel, c'est--dire

quand il ne peutpas tre rduit au sens deslments composants [...] (Gross,

G., 1996: 154).

Deste modo. os constituintes tm uma actuago sintctica e semntica que

nos permite distinguir uma sequncia livre de uma sequncia composta; esses

constituintes mantm relages entre si, no seio do grupo nominal, nico grupo

que nos interessa abordar.

A coeso deve ser calculada tendo em conta a quantidade de palavras que

compem a sequncia, podendo a coeso do grupo nominal ser parcial ou

total.

0 grupo nominal constitudo por um ncleo, que no caso dos compostos

designado por substantif-tte, e pelassuas extenses esquerda e direita:

On pourrait qualifier ce figement de priphrique par rapport au noyau du

groupe nominal (Gross. G., 1996:38). So as relages privilegiadas entre os

elementos perifricos e o seu ncleo que originam a coeso.

A coeso total caracteriza-se por nenhum dos seus constituintes poder ser

substitudo ou sofrer alterages sintcticas. Assim. G. Gross tem a opinio de

que uma sequncia totalmente coesa tem de ser memorizada pelos falantes e

o seu tratamento lingustico requer esforgos reduzidos, uma vez que lls ne

relvent d'aucune analyse syntaxique interne car il n'existe ni paradigmes ni

125

transformations. Les seules modifications sont de nature formelle: [...] (Gross.

G., 1996:40) .

0 grau de coeso, dentro do grupo nominal. analisavel a partir das

combinages que unem os seus constituintes. sendo possivel identificar

relages sintcticas e semnticas motivadoras da coeso, estando essas

relages dependentes da natureza semntica do ncleo nominal.

G. Gross considera compostos os grupos nominais: [...] dont aucun

lment n'est actualis de fagon autonome et. en particulier, dont la

dtermination interne ne peut faire l'objet d'une vanation; qui ne constituent pas

de prdication interne; entre les lments ne peut faire l'objet d'une substitution

synonymique; et dont lesens global correspond un concept existant dans la

langue et qui pourrait. a l'occasion. tre expnm par un substantif umque

(Gross.G., 1996:42),

Com base nesta definigo, G. Gross prope uma tipologia de nomes

compostos, constituda por 17 tipos, que corresponde a uma verso elementar

da tipologia de Mathieu-Colas (1996), composta por 700 tipos.

Da tipologia apresentada por G Gross (1996:48-49). s daremos conta dos

tipos cujo ncleo constitudo por um nome, obtendo-se para a lngua francesa

a seguinte tipologia:

1 . compostos adjectivo+ nome Ex: beau-frre

2. compostos nome+ adjectivo Ex: table ronde

3. compostos nome+ nome Ex: poche revolver

4. compostos nome+ de + X Ex: pomme de terre

126

5. compostos nome+ a + X Ex: cuillere a soupe. machine laver

6. compostos nome+ Prep + X Ex: service aprs-vente

7. compostos nome+ divers Ex: traction avant

Para completar a tipoiogia, G. Gross acrescenta um conjunto de oito tipos

que permitem dar conta da estabilizago de algumas expanses de compostos

acima mencionados:

1. Expanses de A + N Ex: bon vieux temps

2. Expanses de N + A Ex: produit national brut

3. Expanses de N + N Ex: opration ville morte

4. Expanses de N + de + N Ex: offre publique d'achat

5. Expanses de N + + N Ex: film grand spectacle

6. Expanses de N + en + N Ex: requte en suspicion lgitime

7. Expanses de N + Prep + N Ex: acte sous seing priv

8. Expanses diversas: Ex: non-assistance en personne en

danger

G. Gross defende a necessidade da criago de tipologias de compostos

para o tratamento automtico da lngua, por considerar no ser possvel obter

resultados objectivos tendo por base generalidades: a identificago dos limites

da coeso assim uma pnondade: En effet, pour reconnatre

automatiquement les noms composs,il faut tre en mesure d'en montrer les

limites et de prdire leur morphologie [...] et tablir au pralable une typologie

127

de la composition. afin de percevoir les problemes spcifiquesa chaque type

(Gross, G., 1996.48).

Um conjunto de parmetros sintctico-semnticos (que no vamos aqui

abordar) permite-lhe testar a unio dos constituintes de uma sequncia, por

forma a consider-la. no seu todo. um composto.

2.4. Colocago

As escolas anglo-saxonica (Halliday (1996), Sinclair (1996), Benson

(1986,1997)) e alem (Hausmann (1989). Heid (2001)) optam,

preferencialmente, pelo termo colocago para designar os conjuntos de

unidades que co-ocorrem em contiguidade com uma determinada frequncia

no eixo sintagmtico.

No quadro tenco da anlise do discurso de Halliday, so os conjuntos de

unidades lexicais coesas que merecem particular atengo.

Para Halliday, a coeso que fundamenta a estabilizago dos constituintes

que co-ocorrem. podendo infenr-se a partir dessa co-ocorrncia uma relago

sintctico-semntica pnvilegiada: Cohesion occurs when the interpretation of

some elements in the discourse is dependent on that other. The one

pressuposes the other,in the sense that it cannot be effectively decoded except

by recourse to it (Halliday, 1996:4).

Neste quadro teorico, a colocago pode ser analisada numa perspect.va

gramat.cal ou lex.caP sendo a coeso. essncia da colocago enquanto

128

entidade linguistica, identificada pelas relagesestabelecidas entre as diversas

unidades lexicais.

Numa perspectiva lexical, a colocago da conta de uma forma de coeso

que se atinge atravs da [...] association of lexical item that regulary co-

occurn> (Halliday. 1996:284). Porm. a unidade lexical no intnnsecamente

portadora de uma relago coesiva, sendo a coeso determinada por referncia

ao texto em que esta unidade ocorre: [...] It is the occurrence ofthe item in the

context ofrelated lexical items that provides cohesion and gives to the passage

the quality of texh (Halliday, 1996:289). As unidades lexicais que formam uma

colocago lexical so actualizadas como um todo em discurso. porque existem

proximidades lexicais pr.vilegiadas que o sistema lingustico permite. As

proximidades lexicais no so todas da mesma ordem, nem da mesma

natureza: There are degrees of proximity in the lexical system, a function of

the relative probability with wh'ich one word tends to co-occur with another.

Secondly, in the text there is relatedness of another kind. reative proximity in

the simple sense of the distance separating one item from another. the number

of words or clauses or sentences 'in between (Halliday, 1996:290). Desta

forma, a densidade da coeso est relacionadacom o modo como os locutores

activam o sistema lingustico e, consequentemente, com o modo como

actualizam as unidades lexicais, em fungo da construgo de um discurso ou

de um texto.

Tambm Sinclair aborda a colocago na sua dupla faceta gramatical e

lexical. conferindo ao mtodo estatstico um papel essencial na delimitago da

colocago. para melhor poder descrev-la: Collocation is the occurrence of

129

two or more words within a short space of each other in the text (Sinclair.

1996:170). Sinclair preocupa-se, particularmente. com a vertente lexical da

colocago, numa perspectiva lexicogrfica, detendo-se nas suas descriges

formais.

A colocago , assim, abordada de acordo com metodologias lexicais e

estatsticas, que permitem, recorrendo ao conceito de distncia. compreendida

como o compnmento do segmento de recta definida por dois pontos, calcular e

medir a densidade entre as unidades que constituem a colocgo. As anlises

lexical e estatstica so, neste mbito, ferramentas complementares. A

frequncia com que cada uma das unidades constituintes da colocago se

actualiza numa determinada ordem sintagmtica um indicador para a

identificago, descrigo e classificago da colocago.

Cada uma das unidades que compem a colocago pode assumir

importncia e valor distintos. A unidade em observago constituda por um no

[node] e por um co-ocorrente [collocate], podendo qualquer unidade

assumir o estatuto de no ou de co-ocorrente, consoante o valor atnbudo a

cada uma das unidades.

Quando, na colocago AB, o A considerado o n, estamos perante uma

downward collocation, quando a unidade B assume o valor de no, fala-se em

upward collocatiomx As diferentes designages adoptadas permitem-nos

inferir que a abordagem teorica a uma e a outra distinta: There appears to

be systematic difference between upward and downward collocation. Upward

collocation, of course, is the weaker pattern in statistical terms, and the words

tend to be elements of grammaticai frames, or superordinates. Downward

130

collocation by contrast gives us a semantic analysis of a word (Sinclair,

1996:116).

Para Sinclair. em termos metodolgicos. a nogo de n est intimamente

relacionada com a nogo de concordncia informtica:

. - c .

v 1 S I

T3 ilbl

T2 "cl

T3 9b|

T3 12gi

T3 ;3f I

7r i4h I

T> l~b !

7 1 21il

7? 23hi

7- __ 3i I

T~ 2 3 il

T" 2 4e

77 24f i

_,-,

I4f I

7~ 24g|

T7 0 J .

T"7 24C

rT "*j Z5e

7-7 2:a

T^ 2 6a

T-> 2b

T" 26c

T" 2 6c

T7 26a

T~ 26i

T7 281

T7 32g

ibl adiac" suoerficie terrestre infraverirelhc med:: ou if:co ( :ig_.--. :^i i^ = -=-.<= zas bancas dc Visivei e Inravermelhc trr.icc- permite icca^-^c

^ Aa. ~ai"di ="^s%-uisce de um- filne ir.f raverrr.elh ccicndc . C facto oe tc

:: -.\: Ztl* nr- -r-~c---a-i-r-o de um fiime mmavermelho r.c correspcndem as ccre

:.: -;"! '<=' 1.-^ = ap^Cprrsdas pcr um fUrr.e mf ravermelhc colcridc seiam cersimer.t

:: ::-, 'f^^l coloncc vuiaar e um ilme inf ravermelhc cclcncc Recentemente ,

T: "-i ,n ac^o-v- auase mteiramer.ee nc mf raverr.eiho ,car.do cricerr. a vamres

^: *:.;. ^ -er* pmersa ,nesta banca cc inf ravermeiho prcximc . Inicialmente c

cr'm.mr.cia r.cs canais verde e dc mf ravermelhc prcximc : Fics .2,4,

no , qusr.do secos ,nc do proximo mf raverr.elhc . Ccr.scata

-

se , amc^

"-.* caotaoas r.as bancas dc oroximc mf ravermeiho . Esse facto deve-

se a

-f-^c-rc-a na fcanda 00 proximc inf ravermelho , associaaos a baixcs va

err. ^oe-ial dcs canais vermelhc e mf raverrr.elhc , e a relaco que se pco

s pspectrais , Verde ,Vermeiho e Inf raverrelho proximo . Neste caso , a

s -a-ai^ Xc2 vermelho e XS3 .inf raverrneiho prxirao . mostra uue e p

r^u^ al'T- fctoorrica ce filne ir.fr avermeihc .faisa cor : existente

car.ca dc visivel e jir. na bar.da =c mfravermelhc prcximc . A cutra imagem

nda oc visivel ,dcis na fcanda 00 mfraverrr.elhc crcximc e ura r.a oar.aa ao

,.evTBu-.' o?ximc e un r.a bar.da do ir.fraverrr.elhc meci: . As aiferentes

i^'-'r' a :.r. ir:ai r,ais elevadc no ir.f r avermeiho oc que nas cjtras bancss

. a 0 w

-,,; r. j

- Recic cc mfravermelho prcxinc ,ccm ccrr.pnmer.r

-'g Ir= -'7 rr,

- Feio dc ir.f ravermeihc rr.edio , que mciui vaicr

~3 '"n '&-'* l i t, '. - Recio oc miravermeinc terT.icc . 8 ir.- 14 ( m

o de ca-r,:no absorve radiacces no inf raverirelr.c trTico e no mfraverniel

ces nc mfravermeiho trmico e no infraverrr.elhc mcio . entre 2 . d e 4

amente r.-la a partir da reg:c cc mL=vemelho . 0 ccrr.pcrtame:,to tsp*

-vidade decresce . Em relacc ac ir.f ravermeiho prximc e necio .. a resp

re a rec:o visivei e a recio dc mf ravermelhc prcximc tradu:-

se peic

on^'ar' as esocies vecetais . c mfravermelhc proximo revela-

se ur.a

I_ AC;ppr-ral entre o visivei e o mfravermelho proximo , perr.ite ccnclu

ividade da veaetacc na regic dc ir.f ravermelho mdio , prmcipalmente p

ces ormoipalmente r.c dcminio dc mfravermelho rr.dic 1 em tonc acs . .

oue permitem abranger a regio 00 mf ravermeinc prcximc : estes rnmes s

v'^x^c-da*. oe' - vere , vermelho e nravermelhc prcximc dc sspectrc .

V^*vi"--l"" qur n dommio do mfravermelhc . 0 sistema RGV r.unca fu

t? 'a\ sceitrc , e imagens no dor.ir.io do inf ravemelho proximo , uma situada en

T8 33dl r.dc-

se cs 120 m cara a banda do infravermelho trrnco bar.da 6 : ;

Tg-

5 f | abrancida , tal oomc a regic dc ir.f ravermelho . 'esta forma , existem

-t i3*i s bandas cue actuam nc dcminic oc mravermelhc mdic e uma banaa na reg

:S I3f no mdic e uma banda na regio 00 mfravermeihc trmicc , mantencc-

se

Te 33f, mioc , mantendo-

se uma banda no mfravermelhc proxim: , tai ccmo o MSS

T8 3?al o os niveis igitais oa imagem do ir.f ravermelho proximo e Nci , ] ,iv o

^8 "b1 ec-r-i oa .eae^arc nc domir.ic dc ir.fr avermeiho prcximo ser maior e as a

;t :-b! se: _aicr e as dirarer.cas entre c mravermeihc e c vermelhc sc deste n

79 i-2e s areas em fiimc-s pancromaticc e in ravermelhc . k classificagc atmce

A concordncia permite organizar em coluna a unidade que assume a

funco de n, com todas as suas expanses esquerda e direita, isto . os

seus co-ocorrentes. Desta forma^ a colocaco identificada de forma eficaz.

proporcionando um levantamento exaustivo num dado corpus.

131

Tambm, Benson distingue as colocaces lexicais das colocaces

gramaticais: o seu mteresse pelas colocages prende-se com questes do foro

lexicogrfico. Na introduco ao BBI Combinatory Dictionary of English. Benson

afirma: ln English, as m other languages, there are many fixed. indentifiable.

non idomatic phrases and constructions Such groups of words are called

recurrent combinations. fixed combinations. orcollocations.Collocations fall into

two majorgroups: grammatical collocationsand lexical collocations (Benson e

aln, 1997:XV).

A utilizaco do termo colocaco empregue com uma dupla acepco. Por

um lado: considera-o sinnimo de combinatrias fixas e recorrentes; por outro

lado, considera a colocaco um subtipo de combinaco lexical claramente

identificado, distinguindo-a dos outros tipos.

Benson parte de uma tipologia, elaborada com base em possveis

combinaces lexicais, organizado em quatro grupos, representando as

colocaces um subtipo:

1. combinages livres;

2. expresses idiomticas;

3. colocages;

4. composto.

As combinaces livres lexicais so aquelas estruturas que ocorrem com

mais frequncia em discurso, uma vez que apresentam um grau reduzido de

coeso. por as suas hipteses combinatriasserem livres: Free combinations,

132

[...], consist ofelements that are joined in accordance with the general rules of

English syntax and freely allow substitution (Benson et alii, 1997:XV).

0 facto de determinadas combinages lexicais ocorrerem com frequncia

num corpus no nos autonza a afirmar, desde logo. estarmos perante

colocages. Com efeito, tais combinaces lexicais discursivas ou livres. que se

distinguem das colocages. unidades de lngua apresentando restriges

lexicais que permitem a sua identificaco e consequente delimitago. S estas

ltimas merecem um tratamento lexicogrfico. tendo. nesta ptica. a frequncia

um interesse relativo.

As expresses idiomticas que ocorremcom menor frequncia em discurso

so definidas por Benson como: [...] relatively frozen expressions whose

meanings do not reflect the meaning of their component parts (Benson,

1985:4).

A meio caminho entre a combinago livre e a expresso idiomtica est a

colocago que definida como: [...] semi-fixed combinations (Benson.

1997IX) Segundo este autor. a particulandade da colocago encontra-se no

facto de a totalidade do seu significado ser o resultado do significado individual

dos seus constituintes, o que permite distingui-la da sequncia livre.

Para alm do mais, no comum encontrarem-se sinnimos dos

significantes e dos conceitos veiculados pelas colocages, o que as torna

particulares.

Dentro desta categoria, Benson distingue as colocages gramaticais das

colocagoes lexcais. A colocago gramatical [...] is a phrase consisting of a

dominant word (noun. adjective, verb) and a preposition or gramatical structure

133

such as an infintive or clause (Benson. 1997.IX). enquanto a colocago iexical.

em contraste com a colocago gramatical. se define por: [...] normaly do not

contain prepositions. infimtives. or clauses. Typical lexical collocations consist

ofnouns. adjectives. verbs and adverbs (Benson. 1997:XXX).

Os compostos. a quarta categonaidentificada, definida por Benson como

completely frozen (Benson. 1985:4).

Para identificar as colocages de forma sistemtica numa perspectiva

lexicogrfica, Benson subdivide as colocages lexicais constitudas por [V + N]

em dois tipos. que designa de colocages CA e de colocages EN,

respectivamente. Estes tipos de colocagesso reconhecidas como tal, a partir

de uma tipologia de funges lexicais elaboradas por Benson, tendo por base a

tipologia de funges lexicais deMel'cuk (1984).

As colocages CA exprimem a fungo cnago (creation) (C) e a fungo

activago (activation) (A); as colocages EN so estruturas combinatnas

que traduzem a fungo irradiago (eradication) (E) e a fungo

neutralizago (nullification) (N).

Alm destas duas combinages lexicais que apresentam uma estrutura

idntica. mas um formalismo distinto, Benson identifica mais cinco tipos de

estruturas combinatonas, que do conta de relages paradigmticas e

sintagmticas que se estabelecem entre os lexemas, cuja delimitago se

fundamenta nas diferengas que permitem descrever as ligages entre os vrios

lexemas que const.tuem a colocago: [Adj+N]. [N+V]; [N+N]; [Adv+Adj] e

[Adv+V].

134

Nestes conjuntos apresentados. Benson imputa a um dos lexemas o papel

de determinante e a outro o de determinado. concedendo aos lexemas que

intervm na colocago o estatuto de um ou de outro. de acordo com a fungo

que Ihe e atnbuida: Lexical collocations [...] do not have a dominant word.

[...] (Bensonetalii, 1997;IX)

Em 1989, Hausmann define a colocago como: [...] /a combinaison

caractnstique de deux mots dans une des structures suivantes: a) substantif+

adjectif (pithte); b) substantif + verbe; c) verbe + substantif; d) verbe +

adverbe; e) adjectif + adverbe; f) substantif + (prp.) + substantih (Hausmann,

1989:1010). Para Hausmann, a colocago define-se por oposigo a

combinago livre e a expresso idiomtica, pela restngo combinatna das

unidades que compem a colocago. pela sua transparncia e pela sua no

coeso. sendo apreendida e utilizada como uma unidade de lingua e no como

uma unidade de paroe na acepgo saussunana. 0 facto de a colocago

poder assumir o estatuto de unidade lexicogrfica, implica, num determinado

momento. a passagem do discurso para a lngua.

Hausmann defende tal afirmago pelo facto de considerar que um

estrangeiro pode perceber o significado da colocago como um todo. acto que

resulta da sua transparncia, mas no acto da parole no ser capaz de utilizar

as combinatnas lexicais adequadas. o que comprova a imprevisibilidade da

colocago. Ele precisa aprender e memonzar as combinatrias lexicais para

poder us-las, do mesmo modo que aprende e memonza qualquer outro signo

lingustico: [...] parce que les langues. dans la totalit des combinaisons

logiquement possibles. fontun choix idiosyncratique (Hausmann, 1989:1010).

135

Para este autor a descodificago de uma colocago no traz qualquer tipo de

contranedade. A dificuldade situa-se ao nivel da codificago: [...] I'tranger ne

peut pas prvoir a l'aide de quelverbe la langue frangaise met fin au silence:

*briser. *casset: rompre le silence (Hausmann, 1997:282).

Hausmann considera que as colocages so identificveis atravs dos elos

que unem cada uma das suas unidades constituintes, o que designa por

Wortverbindungen. Assim, distingue as fixierte Wortverbindungen das

nicht fixierten Wortverbindungen. Nas unidades fixas. ele inclui expresses

como se laver la tte. assim como as tradicionais palavras compostas,

chambre forte. sendo as unidades fixas apreendidas como um nico signo

lingustico. enquanto as outras estruturas so apreendidas como dois signos

lingusticos distintos.

Independentemente de se tratarem de unidades fixas ou no, Hausmann

identifica trs tipos de combinages lexicais: a co-cnago (Ko-Kreationen), a

colocago (Kollokationen) e a contra-cnago (Konter-Kreation).

0 pnmeiro tipo de combinago lexical a co-cnago (Ko-Kreationen), que

Bahns interpreta do seguinte modo: Als Ko-Kreationen bezeichnet Hausmann

Verbindungen von Wrtern, deren Kombinationsfhigkeit praktisch unbegrenzt

ist; be'i 'ihrer Verbindungen sind ledigliche gewisse semantische Mindestregeln

zu beachten. [...] Ko-Kreationen werden entsprechend den Reglen des

Sprachsystems kreativ zusammen gestellh (Bahns, 1996:23).

As colocages (Kollokationen) resultam de relages de palavras que

possuem uma capacidade combinatria limitada. Por oposigo s co-criages,

136

as colocages no so construdas de forma cnativa. [...] sondern werden as

Kombinationen aus dem Gedchnis abgerufen (Bahns. 1996:24).

Por ultimo. temos as contra-cnages [Konter-Kreation): Be Konter-

Kreationen handelt es sich um d'ie Verbindungen zwischen einem begrenzt

kombinierbaren Wort und einem Wort, mit dem es normalerweise nicht

gemetnsam aufzutreten pflegh (Bahns. 1996:24). Normalmente. nestes casos

as regras semnticas so violadas. requerendo por parte do falante uma

capacidade cnativa supenor que activada no acto da co-criago.

Para Hausmann, uma colocago uma combmago onentada, isto , as

unidades que a constituem no tm o mesmo estatuto, sendo uma delas o plo

responsvel pelas relages lexicais pnvilegiadas que mantm com a sua

vizinhanga local. Por esse motivo. essencial distinguir a base do colocador

{Kollokaton>), equivalente s noges de n e de co-ocorrente. uma vez que a

sua identificago indispensvel para a descngo linguistica e o tratamento

lexicogrfico da colocago, assim como para a sua aprendizagem e

consequente assimiliago. Estes dois elementos que constituem a colocago

tm estatutos de parcena diferentes. sendo tambm diferente o tratamento a

que so sujeitos consoante a nfase seja dada base ou ao colocador.

A colocago , assim, constituda por uma base com autonomia sintctica e

semntica e por um colocador, que acrescenta uma caracterstica base, no

modificando a sua identidade.

Em 1997. Hausmann (1997:288) apresenta uma organizago hierrquica

das denominages das estruturas lexicais que, em parte, reflecte a teoria de

Mel'cuk. sendo. no entanto. a sua classificagomais pormenorizada:

137

lexia

lunidade lexical)

lexemafrasema

unidade monolexical) (unidade multilexical)

palavra composta

construgo / valncia

colocago

locugo

provrbio

citago

Adaptado de Hausmann (1997), Tou est idiomatique dans les langues, La locution entre

iangue et usages. Saint-Cloud.ENS ditions, p 288

Heid segue, parcialmente, a linha de pensamento de Hausmann,

destacando-se deste pelo facto de a sua abordagem colocago ser

terminolgica. Heid defende, explicitamente. que a colocago pode

corresponder a um termo com caractersticas e propriedades distintas das dos

termos identificados, tradicionalmente, comonomes compostos.

Heid (2001) tambm se refere polaridade da colocago. A colocago

constituda por dois lexemas e por possiveis determinantes. quantificadores e

preposiges, sendo um dos lexemas o determmado e o outro o determinante.

correspondendo estas noges ao node e ao collocate de Sinclair e

Basis e ao Kollokaton> de Hausmann.

Sendo a sua abordagem colocago terminolgica. um dos lexemas tem

de ser. obrigatoriamente, um termo, podendo ambos os lexemas assumir esse

estatuto.

Do ponto de vista lingustico, as colocages so [...] a phenomenon of

lexical combinatones: they involve the iexical, semantic. and syntactic

138

properties of lexical items and their syntagmatic co-occurrence (Heid,

2001:788). que tal como os signos lingusticos, resultam de uma convengo,

rather than being explicitly rule-governed (Heid, 2001 :788).

Os elementos que constituem uma colocago, podem. ja por si. ser

colocages que. recorrendo s mesmas estruturas, permitem a cnago de

novas colocages. Heid faz um levantamento das estruturas constituintes mais

relevantes das colocages:

1. [N+V]

2. [N+Adj]

3. [N+N]

Estas trs estruturas so as mais frequentes nas lnguas de especialidade e

so aquelas que, segundo Heid, constituem, regra geral. a estrutura das

unidades terminolgicas. Alm destas, ocorrem outro tipo de estruturas, menos

frequentes, contudo tambm representativas:

1. [V+Adv]

2. [Adj +Adv]

A identificago das propriedades lingusticas das colocages essencial

para o tratamento automtico das lnguas naturais. Por esse motivo. Heid

considera que as colocages so delimitveis e descntas atravs das suas

propriedades sintcticas, semnticas. mas tambm conceptuais.

139

Quando se refere as propnedades s.ntact.cas, He.destabelece uma relago

entre a colocago e a palavra composta. umavez que considera que

a escolha

das componentes dos compostos est determmada do ponto de vista

colocacional: The choice of the components in such noun groups. Iike the

choice of the components of the compounds. is often collocationally

determined: there are clear combinatory preferences, often merely

conventional. that in many cases go as far as the complete terminological

"fixing" of the coumpounds and noun groups (He.d, 2001 791 ).

Heid assume a dificuldade que sente em distinguir a colocago da

composigo com base em critrios meramente lingusticos, sabendo que a

fronteira , do ponto de vista terico, muito tnue. Numa perspectiva

terminolgica, tal distingo no se revela muito operacional, uma vez que em

terminologia a denominago que est na base da identificago da realidade

lingustica, independentemente. da etiqueta que Ihe atribuda: From a

terminological point of view, we may be more interested in whether the

combination of term and collocate can be seen as the domination of a new

concept 'in its own nghh (Heid. 2001:791). Numa perspectiva meramente

terminolgica, no podemos deixar de concordar com o seu posicionamento,

independentemente, de em fungo da estrutura lingustica, determinada

unidade ser considerada uma colocago ou um composto, o que nos motiva

verdadeiramente na abordagem terminolgica a denominago.

Contudo. na qualidade de linguistas, e numa perspectiva de tratamento

automtico da lngua natural, preocupa-nos encontrar os cntnos formais para

delimitar as fronteiras da expresso lingustica da denomingo que ocorre em

140

texto. So as teorias lingusticas que permitem a criago de formalismos

conducentes ao tratamento automtico das Iinguas naturais.

Por isso, pensamos no ser produtivo confundir o plano lingustico com o

plano extralingustico. sendo todavia essencial acautelar as suas

complementaridades.

No que diz respeito s propriedades semnticas, Heid inspira-se na teoria

de Mel'cuk. Mel'cuk defende que os falantes, no pleno uso da parole.

recorrem s colocages para expnmir a significago gennca, descrevendo

deste modo as colocages a partir de funges lexicais que Ihe permitem dar

conta dessa generecidade e que Heid expnme do seguinte modo: ln

lexicography, examples of collocations are usually treated 'in terms of a given

collocate with a g'iven base being arbitrary phenomenon that must be

memorized* (He\d, 2001:793).

Em lngua de especialidade, tal fenmeno tambm ocorre. com a diferenga

que a escolha do co-ocorrente , regra geral. o resultado de uma convengo e

no de um livre arbtno.

Desde modo, Heid (2001) e Martin (1992) distinguem as colocages lexicais

das colocages conceptuais, que Martin define como se segue: By conceptual

structure we can mean the semantic valency or argument structure of a concept

(or the conceptual meaning of a lexeme). This way modifying concepts in

"collocations" [...] are conditioned or expected from "definitional knowledge". In

other words: the conceptual meaning ofdisease contains a slot for CAUSE.that

of system contains one for FUNCTION. that of vowel one for articulation. that

the dictionary one for INFORMATION. etc. In this respect the above

'coliocations' are concept bound (Martin. 1992)

Segundo estes autores, as diferencas entre as colocages lexicais e as

colocages conceptuais prendem-se com o facto de as primeiras serem

determinadas por questes meramente lexicais e idiomticas, que ocorrem

com mais frequncia em lngua corrente.

Por seu turno, as colocages conceptuais so mais relevantes nas lnguas

de especialidade e podem assumir o estatuto de termos: Terminologically

relevant collocations are more often than not situated at the content-related end

of the spectrum. with the meaning of the coilocates fa'irly often dervable from

definitional elements of the base. its properties. typical actions usages. etc.

(Heid, 2001, 796) Em terminologia, a relago entre o conceito e as unidades

que constituem a colocago justificam a coeso lexical, uma vez que a base

subcategoriza determinadas unidades terminolgicas constituintes das

colocages, sendo a colocago um reflexo da conceptualizago.

A colocago conceptual um conceito que poder permitir a distingo

tenca entre colocago livre e colocago restrita numa perspectiva

puramente termmolgica. No entanto. rejeitamos tal denominago, uma vez

que confunde os dois planos de anlise que nos so muito caros: o lingustico

que se reflecte na colocago e o extralingustico que est presente no conceito

de conceptual.

Do ponto de vista da sua estrutura, a colocago organiza-se segundo as

regras da lngua, enquanto que o conceptual se rege por critrios

extralingusticos que, em lngua, denominado por signos lingusticos.

142

0 facto de uma colocago denominar um conceito, no nos impele a

consider-la conceptual. Preferimos consider-la uma colocago terminolgica.

estando, deste modo. a relago entre o termo e conceito ressalvada.

Tal como a nossa exposigo deixa antever, a colocago no definida, nem

entendida do mesmo modo por todos os autores, nem a realidade lingustica

para a qual remete consensual entre os especialistas.

Todos os autores citados abordam a colocago numa perspectiva lexical,

sendo. no entanto, as reas de investigago distintas: textual para Halliday.

lexicogrfica para Sinclair. Benson e Hausmann, terminolgica para Heid.

Para uns, a coeso o que justifica a existncia da colocago (Halliday),

para outros. a combinago restrita dos lexemas que a compem, sendo a

coeso uma caracterstica da locugo (Hausmann).

Quanto designago e ao valor que assumem cada uma das unidades que

constituem as colocages, tambm a os autores usam terminologias distintas.

Por outro lado. as tipologias das entidades lingusticas no so

consentneas umas relativamente s outras. Benson apresenta a sua tipologia

para a lngua inglesa, Hausmann e Heid para a lngua inglesa, francesa e

alem:

Benson

V^N_

ADJ__N_N + V

_

N + N

ADV + ADJ

ADVtV

Hausmann

V + N

N + V

N + ADJ

V + ADV

"

N + PREP + N

Heid

N + V

N + N

N + ADJ

V + ADV

ADJ + ADJ

143

Em sntese. conclumos que as colocages so constituidas por.

exclusivamente, dois lexemas. Tendo em conta as tipologias apresentadas

pelos autores, constatamos, com alguma perplexidade. que s a estrutura N+V

consensual. No que diz respeito s estruturas V+N; N+N: N+Adj e V+Adv, s

dois autores em trs esto em acordo. Hausmann apresenta ainda a estrutura

N+Prep+N, Benson as estruturas Adj+N e Adv+Adj e Heid apresenta a

estrutura Adj+Adj.

De todas as definiges de colocages apresentadas e respectivas

matrizes, s Heid faz referncia existncia de gramemas autnomos no seio

das colocages: Collocations involve two lexemes (plus possibly determiners,

quantifiers. and prepositions (Heid, 2001:788).

Curiosamente. nem todos os exemplos que Hausmann apresenta

correspondem fielmente sua tipologia, uma vez que neles inclui gramemas

autnomos. preposiges ou determinantes, que no esto representados nas

suas matrizes

A ttulo de exemplo, para a estrutura V + Adv apresenta o exemplo

em lngua francesa /7 pleut verse. onde ocorrem gramemas que no esto

representados. No entanto, apresenta a matriz N+Prep+N, estrutura em que a

preposigo claramente considerada uma classe gramatical de relevo. no

justificando do ponto de vista terico a sua incluso na matriz.

Desta diversidade terminolgica e conceptual, retemos os seguintes

cntrios para a definigo de colocago:

1 ser constituda por dois lexemas;

2 poder conter determinantes. preposigesou quantificadores;

144

3. ser o resultado de combinatnas lexicais;

4. ser apreendida pelo falante como um nico signo lingustico:

5. no caso da perspectiva terminolgica ser o resultado da

conceptualizago de um objecto.

2.5. Frasemas

Como j tivemos oportunidade de referir no ponto 1. deste captulo,

Mel'cuk considera a lexia o elemento de base de qualquer estudo lexicogrfico.

mdependentemente da sua forma lingustica. 0 Dicionrio Explicativo e

Combinatrio (DEC) um dicionrio de lexias, que pretende apresentar uma

teoria lexicogrfica, baseando-se numa descrigo semntica, combinatna e

explicativa das lexias de uma lngua natural: Un DEC se doit de dcnre non

seulement les lexmes de la langue L mais encore tous ses phrasmes (dont le

nombre est nettement suprieur celui des lexmes), en devenant de ce fait un

dictionnaire de MOTS et de PHRASMES. donc un dictionnaires de lexies

(Mel'cuk, 1995:45).

Mel'cuk refere-se co-ocorrncia lexical para dar conta da capacidade que

os lexemas tm de se combinarem em sintagmas, por forma a exprimirem uma

dada significago. Esta uma propriedade inerente a todos os lexemas.

No entanto, esta co-ocorrncia lexical considerada resthta quando [...]

un lexme A signifiant 'A' et un iexme B signifiant 'B' ne peuvent pas se

combiner pour expnmer le compos 'A + B\ cela n'tant pas interdit par la

syntaxe (Mel'cuk, 1984:4). Podemos, deste modo, concluir que sempre que

145

A+B * AB estamos perante uma co-ocorrncia lexical restrita. que Mei'cuk

denomina de frasema, caracterizada por, estruturalmente, ser uma unidade

multilexmica, que detm propriedades que no so dedutve.s a part.r da

interpretago dos seus constituintes.

Para Mel'cuk. o frasema um s.gno l.ngust.co: A linguistic sign is an

ordered triple: X = <'X'; /X/; Ix>, where 'X' is the signified of the sign X (= its

meaning), /X/ is its sigmfier (=its phonetic form), and Ix. its syntactics (= the set

ofdata on its co-occurrence with othersigns) (Mel'cuk. 1998:26).

Especifica trs tipos distintos de frasemas: os frasemas completos, os semi-

frasemas e os quase-frasemas (cf. Mel'cuk, 1995: 45-48).

Os frasemas completos correspondem s estruturas sintagmticas

compostas pelos lexemas AB, cuja significago igual a C, em que o C no

contm nem o significado de A, nem de B: C' u'A' & 'C' & 'B'

Os frasemas so um conceito equivalente s expresses idiomticas

definidas pela escola anglo-saxnica.

So considerados semi-frasemas todas as co-ocorrncias restritas,

constitudas pelos lexemas AB, cuja significago igual a 'AC' ou a 'BC': [...]

qui inclut le signifi de l'un des constituants. alors que l'autre ne garde pas son

sens, soit - mme s'il garde son sens - n'est pas slectionn libremenh

(Mel'cuk, 1995:46). Para este autor, semi-frasema sinnimo de colocago.

Por fim, apresenta os quase-frasemas, que se compem dos lexemas AB,

cuja significago corresponde a ABC. Assim, o frasema comporta o significado

dos respectivas lexemas A e B, sendo-lhe ainda acrescentado um outro

significado no dedutvel e imprevisvel, o significado C.

146

Nas definiges propostas dos diferentes tipos de frasemas, Mel'cuk no

identifica as categonas gramaticais, nem as funges smtcticas dos lexemas

que os constituem. Deste modo, no restnnge as hipoteses de classificago

dos lexemas. recorrendo em sua substituigo, a expresses semnticas que

Ihe permitem obter uma tipologia, cuja finalidade a descngo exaustiva das

lexias: [...] une descnption d'une langue L est un systme de rgles qui tablit

la correspondance entre ie sens et les textes de L. Le DEC de L dott fournir au

systme toutes les donnes sur les mots individuels, donnes indispensables

son fonctionnemenh (Mel'cuk, 1984:3).

Mel'cuk representa, esquematicamente. a classificago geral dos frasemas

do seguinte modo (cf. Mel'cuk, 1998:30).

Phrasemes

Pragmatic phrasemesSemantic phrasemes

Pragmatemes Idioms Collocation Quasi-idioms

Mel'cuk (1998), Collocations and Lexical Functions, Phraseology. Theory. analysis. and

applications ed A P Cowie, Oxford, Oxford University Press. p.30

No mbito desta dissertago e na sequncia das leituras efectuadas,

optmos por considerar frasemas ou unidades multilexmicas todas as

unidades terminolgicas nominais que so constitudas por. no mnimo. dois

lexemas ou unidades monolexmicas separados por um espago em branco,

147

resultando das suas combinatrias morfolexmicas e sintcticas numa

denominago.

Enquanto frasema, a denominago assume o estatuto de unidade

lexicogrfica e, em contexto terminolgico textual, desempenha a fungo de

uma un.dade monolexmica ou lexema.

3. Fraseologia

Ao reflectirmos sobre o conceito de fraseologia, verificmos que grande

parte dos autores consultados (Kjr (1990). Picht (1990), Rousseau (1993),

Roberts (1993), Rey (1997)), distinguem a fraseolog.a que ocorre em lngua

corrente. e que abordada de um ponto de vista lexicogrfico, da fraseologia

que ocorre em lngua de especialidade, e que objecto de estudo da

Terminologia.

Kjr aborda a fraseologia na sua dupla vertente torica e prtica. Considera

a fraseologia como uma teoria no seio da Lingustica e, simultanemante, como

um inventno de palavras combinadas. Do ponto de vista da teoria. a

fraseologia relaciona-se com: [...] syntagmatic combinations of words - or. to

be more precise, of lexical units. In this sense phraseology can be paraphrased

as the theory ofphraseology (Kjr, 1990:4).

Do ponto de vista prtico, a fraseolog.a, enquanto inventrio, diz respeito a

aphraseological word combinations no seio de uma lngua de especialidade, o

que leva esta autora a estabelecer um paralelismo com a terminologia.

148

af.rmando: /n this sense. phraseology is comparable to terminology as

denoting the inventory of terms of a sublanguage (Kjr, 1990:4).

Como refenmos oportunamente (cf. Captulo 1). no entendemos a lngua

de especialidade como uma sublngua. mas sim como a lngua utilizada em

especialidade. 0 que nos interessa aqui debater , no entanto, o conceito de

fraseologia enquanto objecto de estudo da Terminologia.

De forma pouco clara, Kjr tenta distinguir as combinages lexicais. objecto

de estudo da Lexicologia, das combinages lexicais terminolgicas. objecto de

estudo da Terminologia.

Numa perspectiva terminolgica, a fraseologia entendida como [...] the

object of linguitsic study [that] denotes the environment of the terms (Kjr,

1990:4), o conjunto das unidades lexicais combinadas, designadas por

terminological phrases ,em que o termo o ncleo ou o plo da fraseologia.

Num perspectiva lexicolgica, a fraseologia entendida numa dupla

acepgo: Phraseology denotes the branch of study concemed with the

analysis of word combinations with make up lexical units of which have the

character of f'ixed expressions for some reason other than their lexicalization

(Kjr, 1990:4). Desta afirmago inferimos que, em Lexicologia, a fraseologia

designa, por um lado. uma disciplina, por outro lado, as fraseologias que Kjr

ope s unidades lexicalizadas. designadas de multi-word units ou de fixed

multi-word expressions. As fraseologias desfrutamde caractersticas merentes

s expresses fixas, no ficando esclarecido quais os processes ou causas

que determinam a sua coeso.

149

Kjr recorre a mltiplas denominages para dar conta de fraseologias em

Lexicologia- frasemas, multi-palavras, expresses multi-palavras fixas -, que

insere num grande grupo: phraseological word combinations. da mesma

forma que Hausmann (1997) e Mel'cuk (1995) consideram frasema um

gnrico para colocages. palavras compostas ou locuges.

Picht (1990) aborda a fraseologia. numa perspectiva terminolgica, de uma

forma mais sistematizada. Tambm estabelece a distmgo entre a teoria e o

mventno de entidades lingusticas combinadas, sendo a LSP phraseology a

disciplina que se debruga sobre as LSP phrases:

Phraseology

LSP phraseology

(disciplina / teoria)

LSP phrases

(inventrio de proposiges)

Para Picht. a LSP phraseology corresponde a uma disciplina, que se

ocupa do estudo das lnguas de especialidade, e que opera com os seguintes

aspectos: [...] with deals on the on hand, with syntactic links which appear 'in

LSP as expression level, their synonymy and equivalence. and on the other

hand, with the conceptual relationships and their modifications of those LSP

elements which may be combined so as to create a proposition which is both

valid according to the percepts of the special f'ield, and linguistically correch

(Picht, 1990:43).

150

0 objecto de estudo da LSP phraseology . para P.cht. a LSP

phrase. que def.ne como [...] the product of a syntactic linkage between at

least two elements in a propos,t,on with an LSP content. whose inner coherence

depends upon conceptual connectability (Picht, 1990:43).

Sendo assim. a LSP phrase deve ser analisada tendo em conta o

nivei do conceito e o nivel da expresso que. conjuntamente. formam uma

proposigo

No plano conceptual, Picht refere as propriedades combinatnas dos

conceitos que se definem por possuirem caractersticas inerentes aos objectos:

[...] the first type of relational charactenstics are instrumental for the ordering

of concepts. the second for the creation of a proposition with an LSP contenh

(Picht. 1990:37).

Em segundo lugar, identifica as propriedades dos conceitos com

caractersticas de verbos. que se diferenc.am das caractersticas dos objectos

por darem conta de uma acgo: [...] all concepts which are expressed by

means of a verb possess at least one characteristic which distinguishes them

from the first category and which is essential for the creation of a proposition:

the notion of DOING - the essential action (Picht, 1990:37). De facto, nas

lnguas de especialidade h determinados verbos que so claramente de

especialidade, devendo ser tratados como termos. No caso da Detecgo

Remota, verbos como digitalizar e colonr so recorrentes, porque

conceptualmente impenosos, merecendo um tratamento terminolgico ao

mesmo nvel dos substantivos.

151

No que concerne a abordagem conceptual da LSP phrase. h que ter

em considerago a existncia de uma conexidade entre, pelo menos. dois

conceitos no seio de uma proposigo: [...] where both concepts exhibit

relational characteristics which render capable of being joined together so as to

form a proposition which fulfills the special requirements to the subject fteids

(Picht, 1990:37-38).

Pensamos. ser este um dos cntrios mais relevantes para distinguir

fraseologia de todos os outros conceitos apresentados nos pontos antenores, e

que iremos ter em especial considerago, no desenvolvimento desta

dissertago.

Ao nvel da expresso. a proposigo a manifestago de um relago

lingustica entre uma expresso nominal e uma expresso verbal: At this level

a proposition manifests itself as the linguistic linkage of one term whcih is

nominal in character. be it a simple or a compound term, an abbreviation, etc,

with another. verbal in character and expressed by means of a verb or a verbal

group, [...]. (Picht. 1990:38).

Segundo Picht. para estarmos perante de uma fraseologia necessrio

a congregago de dois conceitos numa nica proposigo, sendo um dos

conceitos expresso por um verbo ou grupo verbal e o outro por um nome ou um

grupo nominal. Os exemplos que apresenta so os seguintes: to forge iron;

elevar un bomba; der Strom flie/t; to retneve data.

Mais uma vez. nem todas as definiges de fraseologia so concensuais

e autores como Greciano (1993, 1997) referem-se ainda a fraseotermos e a

fraseolexemas para designar termos, lexemas, frasemas, fraseologias, entre

152

outros. Mas no vamos desenvolver todas estas perspectivas, porque no se

evidenciam produtivas, nem em termos tencos. nem em termos

metodolgicos.

Parece-nos que a proliferago de terminologias, reflexo de uma profuso de

teonas, vem dificultar o estabelecimento de cntnos fundamentais para a

identificago das realidades lingusticas estruturalmente complexas.

S iremos deter-nos nas denominages, isto , nas unidades terminolgicas

multilexmicas e nas suas combinatnas a fim de entendermos e

descrevermos o seu comportamento num contexto textual terminolgico, com o

intuito de procedermos ao seu tratamento automtico.

A extenso sintagmtica das unidades terminolgicas multilexmicas ou

frasemas terminolgicos so imprevisveis, sendo as fronteiras entre elas e a

fraseologia fluidas. Cowie (1998:5) designa as primeiras. genericamente, por

Word-like (or semantic) unih e as segundas por sentence-like (or pragmatic)

unih.

Assim. entendemos a fraseologia como um conceito operatrio que, no

mbito desta dissertago, serve para designar frasemas que possuem

estruturas proximas da frase. entendida, neste contexto, como: Elemento

terico abstracto. no interior do qual funcionam outros elementos menores,

[,..] (Xavier, Mateus, 1990:185).

Tendo por base este pressuposto terico, podemos definir a fraseologia

como uma parte de frase, ou proposigo, que se caracteriza por ser constituda

por vrias denominages ligadas entre si por elementos gramaticais que, regra

geral. so extrnsecos s unidades terminologicas multilexmicas.

153

As denominages por sua vez so constituidas por unidades terminolgicas

monolexmicas e unidades terminolgicas multilexmicas.

Pensamos. assim, que a denominago denomina uma realidade

extralingustica. que pode ser tratada como unidade lexicogrfica, enquanto a

fraseologia constituida por vrias denominages, ligadas entre si por

elementos caractersticos de frases.

Utilizaremos ainda o termo colocago para dar conta de sequncias de

lexemas terminolgicos que co-ocorrem, frequentemente, mas que no

designam conceitos. no podendo desta feita ser confundidos com unidades

terminolgicas multilexmicas.

Numa perspectiva de terminologia textual e de tratamento automtico da

lngua natural, a fraseologia deve ser identificada como um todo, uma vez que

as denominages surgem em discurso de forma encadeada, por vezes de

forma ocasional, outra vezes de forma sistemtica. podendo o seu conjunto ter

interesses diversos para a tradugo automtica, para a constituigo de bases

de dados terminolgicas, para tradutores humanos e para o tratamento da

informago.

154

Captulo IV

Etiquetador gramatical automtico: EtiqueLex

1 . Tratamento do corpus informatizado

2. Tabela de etiquetas

3. Constituigo dos dicionrios

3.1 . Dicionrio de formas simples flexionadas

3.1.1. Desdobramento de formas

3.1.2. Variantes ortogrficas

3.2. Dicionrio de locuges

3.3. Dicionrio de unidades terminolgicas multilexmicas da Detecgo Remota

4. Etiquetador gramatical: EtiqueLex

5. Tipologia de matrizes terminognicas

5.1. Tipologia elementar

5.2. Anlise da composigo das unidades terminolgicas multilexmicas

5.3. Tipologia de base

5.4. Dicionrio de estruturas tipo

Captulo IV - Etiquetador gramatical automtico:

EtiqueLex

1. Tratamento do corpus informatizado

Para tirar o mximo proveito do corpus informatizado, necessrio

procedermos sua preparago, por forma a podermos explorar todas as suas

potencialidades

0 objectivo desta dissertago o tratamento automtico dos signos

lingusticos que compem o texto. Mas o texto de especialidade caracteriza-

se por ser constitudo por outros smbolos, que no os signos lingusticos, tais

como imagens, frmulas, grficos, mapas, esquemas,entre outros.

Assim, a primeira tarefa a de subtrair ao texto todo e qualquer elemento

que no seja considerado lingua natural, para dar incio pr-fase da

automatizago. que se traduz na constituigo de dicionrios.

Os dicionrios foram elaborados a partir do corpus. Para o efeito,

utilizmos o Hyperbase, um programa de tratamento documental e estatstico

que foi concebido para o tratamento de grandes corpora.

Com este programa obtivemos todas as ocorrncias do corpus, isto ,

235.893 ocorrncias para 12888 formas, que so apresentadas por ordem

alfabtica.

Apesar das sucessivas correcges pelas quais passouo corpus, ainda

permaneceram elementos parasitrios. que s se tornaram visveis no

dicionrio. Da totalidade das formas constavam a pontuago, os ordinais, a

156

indicago de alneas, as citages em lngua estrangeira, os erros ortogrficos,

as gralhas, os nomes de autores citados, etc.

Muitas destas formas foram, postenormente, supnmidas para que so

subsistissem vocbulos, tendo sido. por esta via, eliminadas cerca de 1500

formas.

Cada uma das formas acompanhada da respectiva frequncia, isto ,

do nmero de vezes que cada uma dessas formas ocorre no corpus:

FormasFQ.

Total

FQ.

T1

FQ.

T2

FQ.

T3

FQ.

T4

FQ.

T5

FQ.

T6

a 6909 3815 80 601 945 748 720

a 25 13 0 5 1 2 4

a 931 509 9 76 83 90 164

abaixo 5 2 0 0 2 0 1

abandonado 1 1 0 0 0 0 0

abandonadas 3 3 0 0 0 0 0

abandono 2 0 0 0 0 1

abarcando 1 0 0 0 0 0

abarcar 1 0 0 0 0 0

abastecer 1 0 0 0 0 0

abcissas 1 0 0 0 0 0

aberrantes 1 0 0 0 0 0

aberta 1 0 0 0 0 0

aberto 5 5 0 0 0 0 0

abertos 3 3 0 0 0 0 0

abertura 39 35 0 1 0 1 2

aberturas 5 5 0 0 0 0 0

aborda 1 0 0 0 1 0 0

abordada 1 0 0 0 0 0 1

abordados 5 2 0 0 0 2 1

abordagem 17 9 0 0 2 2 4

A primeira coluna contm as formas, a segunda a frequncia total com

que uma forma ocorre na totalidade do corpus. ao passo que as restantes

157

seis colunas indicam a frequncia com que cada forma ocorre em cada sub-

corpus.

0 dicionno das formas , assim. constitudo. numa primeira instncia,

por todas as formas flexionadas que compemo corpus.

Para que este dicionno cumpra a sua fungo. mdispensvel atribuir

etiquetas a cada uma das formas. o dicionrio de formas flexionadas

etiquetadas que est na base do EtiqueLex.

2. Tabela de etiquetas

Atribuir uma etiqueta aos diversos funges gramaticais que uma forma

pode assumir. implica uma reflexo sobre o conjunto de etiquetas que deve

ser criado, em consonncia com os objectivos que nos propomos atingir.

Assim, a quantidade e o grau de explicitago da etiqueta devem adequar-

se aos objectivos do tratamento dos dados lingusticos. No til

sobrecarregar o dicionrio de informago metalmgustica e,

consequentemente. o corpus, se ela no tiver uma funcionalidade

comprovada.

Por este motivo, ao longo de todo o processo de etiquetagem do dicionrio

e do corpus, fomos adaptando a bateria de etiquetas s nossas necessidades

de investigago.

Passamos a apresentar os resultados deste processo e a reflexo que

presidiu criago das etiquetas.

Numa primeira fase. seleccionmos as classes gramaticais principais:

158

6

Classes gramaticais

Adjectivo

Advrbio

Artigo

Conjungo

Nome

Preposigo

Pronome

Verbo

Etiquetas

Adj

Adv

Art

Conj

N

Prep

Pron

V

As preposiges sofrem um tratamento particular. Optmos por

desdobrar a etiqueta em duas sub-etiquetas e Foram

etiquetadas com as preposiges. tais como de, em, com, trs, etc,

enquanto que todas as contracges das preposiges foram etiquetadas com

Alm destas classes gramaticais. seleccionmos Outros elementos

gramaticais', que pnvilegimos ao mesmo nvel das classes gramaticaisacima

referidas:

6

Outros elementos gramaticais

Gerndio

Locugo

Nome proprio

Numeral

Particpio passado

Sigla

Etiquetas

Ger

Loc

Np

Num

Pp

Sigla"

159

A etiqueta e atribuda a todas as locuges. independentemente

do seu fungo gramatical. no fazendo qualquer distingo entre elas.

Numa primeira mstncia. a etiqueta atribuda ao particpio

passado. independentemente de ter uma valor adjectival ou verbal. Aps o

levantamento de ambiguidades entre um e outro, atnbuimos a etiqueta

aos particpios passados com valor verbal e a etiqueta aos participios

passados com valor adjectival.

A etiqueta , por sua vez. atribuda a toda as formas abreviadas.

sejam elas, truncages, siglas, acrnimos, ou outras.

Consideramos, no entanto, que para a extracgo automtica de

unidades terminolgicas complexas, as classes gramaticais seleccionadas.

assim como as classes que classificmos com 'Outros elementos gramaticais',

so demasiadamente genricas. Acrescentmos, a todas as classes que o

permitem, a indicago de gnero, de nmero e de pessoa:

Gnero

masculino

feminino

dois gneros

invanavel

Etiquetas

m

2gen

mv

Nmero

smgular

plural

dois nmeros

Etiquetas

pi

2num

160

Pessoa Etiquetas

1 1apessoa i 1p_i

2 2a pessoa 2p

3 3a pessoa 3p

Aos verbos. adicionmos a seguinte informaco:

Conjugaco Etiquetas .

1 conjuqado cj

2 infinitivo inf

As etiquetas atribudas aos verbos so muito pouco descritivas e

precisas. uma vez no ser necessria mais informago do que aquela que

est mencionada na tabela para a extracgo que pretendemos efectuar.

Para os artigos, que designam 'modo indeterminado', crimos as

etiquetas:

Definido / Indefinido Etiquetas

1 definido def

2 indefinido indef

Os pronomes podem ser pessoais. possessivos ou demonstrativos:

Pronomes Etiquetas

1 pessoais pes

2 possessivos poss

3 demonstrativo dem

161

Combinando todas as propnedades que cada uma das classes

gramaticais pode assumir, chegmos a 168 etiquetas, que apresentamos no

quadro seguinte:

10

11

12

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

13

14

15

16

Classes gramaticais

Outros elementos gramaticais

Adjectivo

Adjectivo

Adjectivo

Adjectivo

Adjectivo

Adjectivo

Advrbio

Artigo

Artigo

Artigo

Artigo

Artigo

Articjo_

Artic|o_

Artigo

Conjungo

ConjungoGerndio

Locugo

Nome

Nome

Nome

Nome

Etiquetas

_

Adj:m:s

Numeral

Numeral

Participio passado

Participio passado

Particpio passado

Particpio passado

Preposigo

Preposigo

Preposigo

Adj:m:pl

Adj:Ls_

Adj:f:pl

Adj_2g_en._sAdj:2gen:pl

Adv

Art:def:m:s

Art:def:m:plArt:def:f:s

Art:def:f:plArt:indef:m:s

Art:indef:m:plArt:indef:f:s

Art:indef:f:pl

Conj:e

Conj:ouGer

Loc

N:m:s

N:m:plN:f:s

N:fl_Nome N:m:2num

Nome N:f:2num

Nome N:2gen:s

Nome N:2gen:pl

Nome prprio Np

Num:ord

Numxard

Pp:m:s

Pp:m:pl

Pp:f:s

Pp:f:pl

Prep1:a

Prep1:aps

Prep1:at

162

38 Preposico Prep1:com

39 'j40

Preposigo

Preposico i

Prep1:conforme

Prep1:consoante

41 i Preposigo

Preposigo

Prep1:contra

42;

Prep1:de

43 Preposigo Prep1:desde

44 Preposigo PrepV.durante

45 Preposico PrepT.em

46 Preposigo PrepT.entre

47 Preposigo PrepTexcepto

48 Preposico Prep1:fora

49 Preposigo PrepTmenos

50 Preposigo Prep1:para

5'

Preposigo Prep1:perante

52 | Preposigo PrepTpor

53 Preposigo PrepTsem"

54 Preposigo PrepTsob

55 Preposigo Prep1:sobre

56 Preposigo PrepT.trs

57 Preposico Prep2::f:s

58 I Preposigo Prep2:ao:m:s

59 Preposigo Prep2:aos:m:pl

60 Preposigo Prep2:quela:f:s

61 Preposigo Prep2:quelas:f:pl

62 Preposigo Prep2:s:f:pl

63 Preposigo Prep2:da:f:s

64 Preposigo Prep2:da

65 Preposigo Prep2:daquela:f:s

66 Preposigo Prep2:daquelas:f:pl"

67 Preposigo Prep2:daquele:m:s

68 Preposigo Prep2:daqueles:m:pl

69 Preposico Prep2:daqui

i 70 Preposigo Prep2:daquilo

71 Preposigo Prep2:das:f:pl

72 Preposigo Prep2:dela:f:s

73 Preposigo Prep2:delas:f:pl

74 Preposigo Prep2:dele:m:s

75 Preposigo Prep2:deles:m:p!

76 Preposigo Prep2:dessa:f:s

77 Preposigo Prep2:dessas:f:pl

78 Preposigo Prep2:desse:f:s

79 Preposigo Prep2:desses:f.pl

80 Preposigo Prep2:desta:f:s

81 Preposigo Prep2:destas fpl

82 Preposigo Prep2:deste:m:s

83 Preposigo Prep2:destes:m:pl

163

84

85

86

87

"88

89

90

91

92

93

94

95

96

97

98

99

100

_101_102

103

104

105

'106

107

108

109

110

111

112

113"

114

115

116

117

118

119

120

121122

123

124

125

126

127

128

129

Preposigo

Preposigo

Preposigo

Preposigo

Preposi_go

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Preposigo

Prep2:disso

Prep2:do:m:s

Prep2:dos:m:pl

Prep2:doutra:f:s

Prep2:doutras:f:pl

Prep2:doutro:m:s

Prep2:doutros:f : pl_

Prep2:dum:m:s

Prep2:duma:f:s

Prep2:dumas:f:pl

Prep2:duns:f:pl

Prep2:na:f:s

Prep2:nalguma:f:s

Prep2:nalgumas:f:pl

Prep2:nalgum:m:s

Prep2:nalguns:m:pl

Prep2:naquela:f:s

Prep2:naquele:m:s

Prep2:nas:f:pl

Prep2:nela:f:s

Prep2:nelas:f:pl

Prep2:nele:m:s

Prep2:neles;m:pl

Prep2:nessa:f:s

Prep2:nessas:f

Prep2:nesse:m

Prep2:nesses:f

pl

pi

Prep2:nesta:f:s

Prep2:nestas:f:pl

Prep2;neste:m:s

Prep2:nestes:f:pl

Prep2:no:m:s

Prep2:nos:m:pl

Prep2:noutra:f:s

Prep2:noutras:f:pl

Prep2:noutro:m:s

Prep2:noutros:m:pl

Prep2:num:m:s

Prep2:numa:f:s

Prep2:numas:f:pl

Prep2:nuns:m:s

Prep2:pela:f:s

Prep2:pelas:f:pl

Prep2:pelo:m:s

Prep2:naquelas:f:pl

Prep2:naqueles:f:s

164

130 Preposico Prep2:pelos:rr?pi

131 Pronome Pron:pes:1p:s

i132

'

Pronome Pron;pes:1p:pl

133 Pronome Pron:pes:2p:s

134 Pronome Pron:pes:2p:pl

135

'

Pronome Pron:pes:3p:m:s

136

'

Pronome Pron:pes:3p:m:pl

137 Pronome Pron:pes:3p:f:sI

"

v.s

V38

"

Pronome Pron.pes 3p:f:p

139 Pronome Pron:poss:1p:n

140 Pronome Pron:poss:1p:m:pl

141 Pronome Pron:poss:2p:m:s

142 Pronome Pron:poss:2p:m:pl

143 Pronome Pron:poss:3p:m:s

144 Pronome Pron:poss:3p:m:pl

145 Pronome Pron:poss:1p:f s

I 146 Pronome Pron:poss:1p:f P' ,

147 Pronome Pron:poss:2p:f s

148 Pronome Pron:poss:2p:f pl

149

150

Pronome Pron:poss:3p:f s

Pronome Pron:poss:3p:f pl

151 Pronome Pron:dem:1p:m:s

152 Pronome Pron:dem:1p:nT-Pl .

i:sf~T53 Pronome Pron:dem:2p:n

154 Pronome Pron:dem:2p:m:pl

155 Pronome Pron:dem:3p:m:s

156 Pronome Pron:dem:3p:m:pl

157 .

Pronome Pron:dem:1p:f s

158 Pronome Pron:dem:1p:f pi

159" Pronome Pron:dem:2p:f s

160 Pronome Pron:dem:2p:f pi

161 Pronome Pron:dem:3p:f s

162 Pronome Pron:dem:3p:f pl

163 Sigla Siglai

1 164 Verbo V:cj

165 Verbo V:inf

A relevncia que assumem as preposiges nas unidades

terminolgicas multilexmicas e, consequentemente, na constituigo das

tipologias, levou-nos a discriminar mmuciosamente as preposiges, por forma

165

a obter melhores resultados na apiicago das regras lingusticas no momento

da concepgo do ExtracTerm (cf. Capitulo IV, ponto 5 e Captulo V).

Tambm desdobrmos os pronomes. por serem classes gramaticais

que se encontram na proximidade contextual de nomes. adjectivos e

preposiges. que so as classes mais frequentes nas matnzes que

constituem a tipoiogia. sendo necessno levantar ambiguidades com base

nestas etiquetas (cf. Captulo V).

A informaco metalinguistica. sob forma de etiqueta, foi adicionada

manualmente a todas as formas constituintes dos dicionrios.

3. Constituico de dicionrios

Aps madura reflexo, optmos por construir trs dicionrios distintos,

mas complementares. que so os pilares do EtiqueLex:

1 . um dicionrio de formas simples flexionadas:

2. um dicionrio de locuges;

3. um dicionrio de termos complexos da detecgo remota.

3.1. Dicionrio de formas simples flexionadas

3.1.1 Desdobramento de formas

Tal como j demos conta no ponto 1 deste captulo. o dicionno que

construimos a partir do corpus. com a ajuda do Hyperbase. const.tuido.

166

exclusivamente, por formas simples que ocorrem no corpus Aps sucessivas

fases de eliminago de rudo. o dicionno de formas acumula.

aproximadamente, 10.800 formas.

A cada uma das formas encontradas no dicionno atnbuda uma

etiqueta. necessno proceder-se ao desdobramento de cada uma das

formas registadas a fim de obter todas as suas formas flexionadas.

Do dicionno elaborado a partir de um corpus pode. por exemplo.

constar unicamente a forma ,sendo preciso acrescentar a sua forma

no plural,

No caso do adjectivo . adicionmos a sua forma plural.

assim como a forma feminina no singular e no plural, e

Nas situages em que uma mesma forma pode assumir funges

gramaticais distintas. impenoso desdobr-la e etiquetar as formas

resultantes do desdobramento efectuado, com todas as etiquetas gramaticais

correspondentes s funges gramaticais que podem assumir em diferentes

contextos

o que acontece com as formas etiquetadas com as etiquetas e

Formas Etiquetas

colorida Adj:f:s

colorida Pp:f:s

coloridas Adj:f:pl

coloridas Pp:f:pl

colorido Adj:m:s

colorido Pp:m:s

coloridos

coloridos

Adj:m:pl

Pp:m:pl

167

A forma foi pnmeiro desdobrada em duas. para assumir o valor

de adjectivo e o de particpio passado. De seguida, acrescentmos a forma

masculina plural. assim como as formas femininas no smgular, e o plural para

cada uma das classes gramaticais.

3.1.2. Variantes ortogrficas

Os termos cujas grafias no esto fixadas levam o especialista a

hesitar no momento da redacgo. Desta hesitago nascem diversas variantes

ortogrficas para um mesmo termo, em textos redigidos pelo mesmo autor.

Assim. o acrnimo [ 1 importado do ingls para o

sistema lingustico portugus. surge no corpus com as seguintes grafias:

Formas Frequncia

pixel 198

pixel 2

pixels 88

pixeis 51|

pxeis 16

A nogo de acrnimo j se perdeu. sendo este termo sentido como

uma unidade monolexmica. No estando o termo normalizado. os

especialistas optaram pelas distintas situages, acima indicadas:

V mantm a grafia inglesa, sendo o seu singular. e o seu plural

. Em termos de frequncia, esta a opgo mais recorrente;

168

2 efectuam um decalque e acentuam o /. assinalando uma vogal

aberta no tonica. . passando o termo a pertencer classe das

palavras graves. formando-seo seu plural de acordo com a regra

de formago do portugus:

Nenhuma das outras opges desejvel, na medida em que nem

respeitam a grafia portuguesa, nem a grafia inglesa.

Mas como a nossa fungo no normalizadora, decidimos etiquetar

todas as variantes ortogrficas do termo que ocorrerem no corpus.

Enquanto para a grafia da forma ,a hesitago dos especialistas

justificada, outras situages h em que a hesitago advm de

desconhecimento das regras da lngua.

Que fazer perante termos da especialidade sistematicamente mal

grafados? Temos o caso de e toda a sua famlia morfolgica

que est, frequentemente, grafadacom um s r, numa s palavra. Nestes

casos, decidimos corngir o corpus, por consideramos estar perante um erro

ortogrfico. Mantivemos. no entanto, as vanantes ortogrficas:

Formas

geo-referenciago

geo-referenciada

geo-referenciada

geo-referenciadas

geo-referenciadas

geo-referenciados

geo-referenciados

Etiquetas

N:f:s

Pp:f:s

Adj.f.s

PpT.pl

AdjT.pl

Pp:m:pl

Adj:m:pl

169

geo-referenciado Pp:m:si

Georreferenciado Adj:m:s

Georreferenciago

Georreferenciada

Georreferenciada

N:f:s

Pp:f:s

dj:f:s

Pp:f:pFGeorreferenciadas

Georreferenciadas Adj:f:pii

Georreferenciados Pp:m:pi

Georreferenciados Adj:m:pl

Georreferenciado Pp:m:s

Georreferenciado Adj:m:s

Tal como podemos venficar. a partir do exemplo antenor. o especialista

junta o formante sua base. recorrendo ao hfen ou ao processo

tradicional da derivago por prefixago.

Neste corpus, estas situages so muito frequentes, uma vez que a

terminologia da Detecgo Remota recorre com alguma regulandade a

formantes, tais como: , , , .. .

Em todas estas situages, mantivemos a dupla grafia:

Formas

Multibanda

multi-banda

Multibandas

Etiquetas

N:f:s

N:f:s

N:f:pl

multi-bandas NT.pl

Multiespectral

multi-espectral

Adj:2gen:s

Adj:2gen:s

Multiespectrais

multi-espectrais

Adj:2gen:pl

Adj:2gen:pl

170

Por este processo, o dicionnode formas flexionadas foi drasticamente

aumentado, perfazendo a totalidade do dicionano, aproximadamente, 17200

formas.

3.2. Dicionrio de locuges

No captulo dedicado s expresses nommais complexas debatemos

demoradamente as terminologias e os pressupostos tencos que Ihes esto

subjacentes. utilizados pelos diversos autores para designar expresses

coesas. Atravs da bibliografia consultada, verificmos que. para muitos

autores, palavra composta. colocago, lexia complexa, frasema ou locugo

remetem para estruturas morfolgicas. lexicais e sintcticas coesas (cf.

Captulo 3. p.113). sendo, frequentemente, empreguescomo smnimos

Porm. reservamo-nos o direito de conservar o termo locugo para dar

conta de uma sucesso de elementos lexicais e gramaticais que co-ocorrem

de forma constante. no podendo os seus elementos constituintes ser

actualizados mdividualmente, desempenhando o seu conjunto a fungo de um

gramema. Estamos a refenr-nos s locuges prepositivas. s locuges

conjuncionais. assim como s locuges adverbiais. Esclarece-nos Rey [1997]

a este respeito: Locution (du iat'm locutio . de ioqui. parler) est exactement

maniere de dire. manire de former le discours, d'organiser les lments

disponibles de la langue pour produire une forme fonctionnelle. Ceci pourquoi

on peut parler de locutions adverbiales ou prpositives, alors que ces

171

mots grammaticaux ne seraient jamais appels des expressions (Rey.

1997A/I).

Os elementos que constituem cada uma destas locuges pertencem a

diversas classes gramaticais. ou podem amda, isoladamente, no ter

autonomia na lingua. Este caso venfica-se com o elemento , que s

tem existncia enquanto constituinte das locuges prepositivas

ou da locugo conjuncional

A locugo prepositiva composta por um conjunto de unidades que

tm o valor de uma s preposigo. Regra geral. a locugo prepositiva

constituida por um advrbio ou por um nome seguido da preposigo ,ou

: .

A

locugo prepositiva pode ainda ser constituda por duas preposiges:

As componentes das locuges conjuncionais so adjectivos, advrbios

e nomes seguido da conjungo ,.

Por sua vez, as locuges adverbiais incorporam preposiges seguidas

deumnome: , , ,. ... que no seu conjunto

desempenham a fungo de um advrbio. 0 nome que co-ocorre pode estar

no masculino ou no feminino. no singular ou no plural.

O facto de os elementos componentes das locuges pertencerem s

classes gramaticais que, maioritariamente, esto na base da estrutura dos

termos complexos. isto , preposiges, nomes e adjectivos, levou-nos a trat-

las diferenciadamente.

172

Uma locugo como seria etiquetada pelo

EtiqueLex da segumte forma:

Se a forma que preceder a preposigo for um nome e a

forma que suceder a preposigo for um nome, o ExtracTerm gerar um

falso termo, porque a regraum dos tipos que esta

mcludo no dicionrio de tipologias, sobre o qual ir actuar o ExtracTerm

Assim, a etiquetagem prvia das locuges permite a redugo do rudo

no resultado da extracgo dos termos. o que justifica a criago de um

dicionrio de locuges.

Em entrada, o dicionno de locuges apresenta a seguinte

constituigo:

a fim de@Loc

frente da@Loc

frente das@Loc

frente de@Loc

frente do@Loc

a frente dos@Loc

a jusante@Loc

medida de@Loc

medida que@Loc

a par com@Loc

a par de@Loc

parte@Loc

a ponto de@Loc

a princpio@Loc

a propsito de@Loc

a propsito@Loc

173

a respeito da@Loc

a respeito das@Loc

a respeito de@Loc

a respeito do@Loc

a respeito dos@Loc

Este dicionno sera o primeiro a ser comparado com o corpus. 0

EtiqueLex procede identificago da sucesso de elementos que se

encontram no eixo smtagmtico. Ao encontrar as locuges registadas no

dicionno, o EtiqueLex prossegue, unindo os elementos constituintes com o

sinal . dando. deste modo, conta da sua coeso. acrescentando a etiqueta

,sendo o formato de sada o seguinte:

Neblinas ligeiras, poetras, fumos mesmo no detectveis na imagem da

banda visivel so, susceptveis de distorcer bastante a

temperatura aparente do solo verdadeiro. No se pode,

comparar directamenteo mapa de registo termogrfico de um

espago continental com o construdo por interpolago a partir dos clssicos

registos meteorolgicos pontuais.estes no pretendem

traduzir a temperatura da superfcie terrestre mas

escapar s suas irregulandades e fornecer a temperatura do ar, mantido

sombra do abngo e um metro solo.

Esta etiquetagem evita que na comparago do corpus com o dicionno

de formas flexionadas. o EtiqueLex atnbua, autonomamente. etiquetas aos

elementos constituintes das locuges.

Deste modo. previne-se uma etiquetagem errada, reduzindo a margem

de erro do ExtracTerm. Ao ser-lhe vedado a hiptese de etiquetar os

174

constitu.ntes das locuges. o ExtracTerm encontra-se na impossibilidade de

aplicar as regras linguisticasdo qual depende. em parte. a sua existncia.

3.3. Dicionrio de unidades terminolgicas multilexmicasda detecgo

remota

A criago de um dicionuo de unidades terminolgicas complexas de

uma rea de especialidade s pertinente caso haja recursos lingusticos j

disponveis. Pensamos. efectivamente.ser proveitoso em tempo e em esforgo

recorrer a trabalho previamente desenvolvido.

Os recursos lingusticos da Detecgo Remota que dispomos so o

resultado de um projecto, desenvolvido no seio do Praxis1. Para o efeito

cnmos uma base de dados terminolgicos. utilizando para o efeito uma

metodologia de processamento semi-automtico de corpora. As unidades

terminolgicas recolhidas por este processo j foram. parcialmente, validadas

por especialistas. o que nos permite utiliz-las com seguranga.

Deste modo. chegamos ao terceiro dicionno que, tambm ele, faz

parte do EtiqueLex. Tal como para o dicionno das locuges, este dicionno

tem o propsito de fazer ganhar tempo ao ExtracTerm. evitando que ele

aplique regras lingusticas a estruturas que.a priori, j conhece.

O recurso a este dicionrio s faz sentido se o corpus tratado for da

rea de especialidade correspondenteaos recursos lingusticos j existentes.

'

Arquivos Electrnicos de Terminologias e -corpora"*, PRAXIS XXI (Projecto PRAXIS

xxi INICT n CSH - 717 - 95 U.N.L). Projectos de InvestigacoCientlfica e Tecnoiogica de

pequena e mdia dimenso. direcco c.entif.ca a cargo da ProfaDoutora Maria Teresa Rijo

da Fonseca Lino.

175

0 dicionno contem a seguinte informago:

absorgo atmosfnca@N:f:s

agregago de objectos@N:f:s

agregago espacial@N:f:s

gua lquida@N:f:s

gua profunda@N:f:s

amplitude trmica@N:f:s

ngulo azimutal@N:m:s

ngulo de iluminago@N:m:s

ngulo de varrimento@N:m:s

ngulo zenital de iluminago@N:m:s

ngulo zenital@N:m:s

assinatura espectral@N:f:s

detecgo remota@N:f:s

filmes pancromticos@N:m:pl

filmes pancromticos@N:m:pl

filtragem de imagens@N:m:s

filtragens de imagens@N:m:s

fluxo de calor@N:m:s

fotointerpretago assistida por

foto-interpretago assistida por

imagem de textura@N:f:s

computador@N:f:s

computador@N:f:s

Tal como tivemos oportunidade de referir. o frasema, na sua totalidade,

pode em situago textual comportar-se como uma unidade monolexmica.

Assim, ao conjunto do frasema atribuda uma nica etiqueta,

correspondente fungo gramatical que desempenha no texto

176

No momento em que o EtiqueLex compara o corpus ao respectivo

dicionno e estabelece a correspondncia. o formato final que se alcanga e o

seguinte:

Incluram-se, nesta unidade, os pequenos bancos de ostra da Palma,

Zambujal. Carrasqueira e Comporta. que. por estarem cobertos de algas

verdes e castanhas, apresentamsemelhante a

vegetago supenor halfita. Na -a

metodologia seguida foi semelhante usada na

Itendo-se escolhido os limites

das classes de acordo com os histogramas bidimensionais, as

e os perfis radiomtricos.

No caso do lexema que segue ou antecede a unidade etiquetada ser

um elemento que conste numa das estruturas que constitui a matriz

terminognica, o sistema reconhece a totalidade do frasema como um e

opera sobre esta damesma forma que opera sobre um lexema.

Apesar do termo ser identificado como um

o EtiqueLex tambm identifica e

noutros contextos, uma vez que eles se encontram no dicionrio de formas

flexionadas. Assim, registamos todos os frasemas em que ocorrem os

lexemas terminologicos e ,embora no estejam

armazenados no dicionno de Detecgo Remota.

Este sistema permite-nos uma constante actualizago do dicionrio de

frasemas. uma das possveis aplicages resultantedeste sistema.

177

4. Etiquetador gramatical: EtiqueLex

0 EtiqueLex foi concebido e construido tendo por base os trs dicionrios

acima descntos. Na atribuigo de etiquetas, o etiquetador EtiqueLex percorre

o corpus. comparando este com os contedos do dicionno de locuges e do

dicionno de Detecgo Remota. uma vez que a estrutura de dados a

mesma.

Se, no momento da comparago, a pnmeira forma do corpus encontrada

corresponder primeira forma da sequncia que constitui as locuges e os

frasemas que constam dos devidos dicionrios, o EtiqueLex continua a sua

comparago no eixo sintagmtico, at atingir o fim da sequncia comparada,

assinalando-a com a etiqueta correspondente, unindo os seus elementos com

um

Caso a forma encontrada no corpus no corresponda pnmeira forma de

uma locugo ou de um frasema previamente identificado, o EtiqueLex passa

de imediato comparago com o dicionno de formas simples flexionadas,

atribuindo a etiqueta correspondente. As formas no etiquetadas equivalem a

formas que no se encontram em nenhum dos dicionrios.

Desta feita, o EtiqueLex percorre o corpus uma s vez. executando, em

complementaridade, os dicionrios de locuges e de frasemas e o dicionrio

de formas simples flexionadas.

0 algontmo que permite desempenhar esta tarefa o seguinte:

CDicionricEx*

dicLccucoesFrasenas;

178

.i: : str ir.a].,

xre:. -i ,

r =c:e:&_:ra:acics-

u;

i c : : ve :tor<XF:::r..:aa> : : i rera

os civid i c: ;>? _ C .-

h a r

r c : :ve:'.ur<stc: : st r i r:g> : : : ter

;: d : : vec:or<s:c : : s". r ing>

.Enf rada

r ioFticueoas;

.:t.pcJr.: 11C

_mp; Fin. [ 10

. ique tc? ;

icbraraca;

dicLccucoes:- raserr.as= i^jicior.o r :o _.__"' .

::_Dicicr.arics i FFASE:-'.A::_LOC'JCOES ] ;

d:cFt:cueoas= rri iicicnarios .

FLEXICii-.DAS] ;

s t 'i : '. vect c r < s z : : s t r i r. c > : t = o i c E t : qu e t a s-

>Devclve_:.iq"Jeta : "os" j ;

boc s . : : t : ke r. i z e r < > t o Ik ( n _Co r pu s . ;

s t r : i rce 1 1 e~

po I r. i ) ;

std::cout << te::ir,clr:i <<"

: Ir.iczo etique: agez. corpus caoa

lOOk tratacos)" << stc:

Lrost : tc?enizero: : rteratcr De:= tc'? . beqi r. i ) ; bec

o? . er.c

okcnlC-; =- '\r.'

tir.pFntrada . entraca = "<br>";

trr.oFnt r._;d.. . '-! icueta=- vazi o_e:iqu'~'t a s ;

tnicint rada . or guet.scc= :a_se;

rr,_c::rpus_divid:co.pusn_cac< i trr.pEntraca , ;

roken = t oken . substr 1, tokeri . ler.gtr: ( ) ; str

tmpTok= token. c_s:r ( ; ;

vvhile ( dicLocccoesFraserr.as-

> :-; rocu raEr.tr 3 da : striwr ( :.cnar zmpTc-:. c_s"

er.t rada . tx.sh b<

-

tccj ;

token = *oeg ;

::up7ok=

tc:.er..c_:

179

:,: rajc

i t= <:-

er.r raaa .

zmpEr.t rada . e r_:r=da - :.*it

r.crad . end i' )-

:.Zip_.ntraa . et.icueta . pusn_oac< (etiquei

trrzEntraca . e'. iquetad: = :. rue;

m_ zorpus_di vi

ent rada . clea:

:u s n ba c ? tmo F n : r a d o )

r ;,. : = er.trada . cec::_ ( ; :: != en: rada . eno i. ) ;

C F n-

r a da t rr.pE n z r ada ;

:mp . c.-:= : -z i c_ sti i . ;

cmpEr.trada.er.trada= trr.pTc k . c_st r i. j

:z.pEr.zrada.eticue:a= cicEr. iquets-

DevclveEtiqueta (_striwr ( (cr.ar'i t~pTok. c_st r . . ) ) ;

if : tmpEntraca . etiqueza . size ( ) > 0

tnipFntrada . et iquet ado= true;

:::pEn:racs .etiquetaco= :"a~se

rus civzciz n back ( zmpEnt. rad<

-.-.- ra:a . :. '.'. r . .) ;

; f zoker. ienqth : : < 102 4 ;

tir.oiok = L' U

tr'ip.En: rada . er.t rada = to?en;

zncEr.r rada . eti que'.a= dicFtiquet. as-

>DevclveEtiqueta (_strlwr : 'char* ) tzip'Tok. c_s:r . ) ) : ;

i: tr.pEntraca . et. iqueta . size ( ) > 0

tmpFn z rad a . e 1 1 qu e t a oo= t r u e ;

e_se

tnpEnzrada . et ;. quetade= false;

m ccrpus c:vic:d: . push_cac.?'

tn.pEntrada ) ;

rsr: f.ro: itacos 1-- . size 1; // conu- :r,ai

spacoi

180

102

caraozeres tratacos= 0;

stc: :cout <<"

";

100

szrtime ( tenpctim; ;

std::ccut << std: :er.dl << te

;rpus .

"<< std::endi;

<<"

: Firr. eticuetage:

Para cada forma encontrada, o EtiqueLex atribui todas as etiquetas

correspondentes a essa mesma forma,sendo o resultado como se segue:

A Utilizago Possvel

dos Registos de Satlites em

Infravermelho Trmico na

Climatologia Regional

Os satlites destinados

afacilitar a

1previso dc t tempo

registam ,em geral , conjuntamente

no comprimento de ondas que

corresponde viso humana

e ao mximo da radiaco

solar (Visvel e Infravermelho

prximo ,entre 0

,4 e 1

,1 ( m ) e

no correspondente janela

atmosfrica (entre 10 e 12 ,5 (m) que

deixa escapar

espaco uma

irradiaco da

(Infravermelho

em direcc-o ao

parte da

superfcie terrestre

mdio [Adj] ou trmico

181

Partindo da observaco dos resultados obtidos com o EtiqueLex. falta-nos

percorrer duas grandes etapas.

A primeira etapa consiste no estabelecimento de matnzes terminognicas

que contenham as tipologias correspondentes s estruturas morfolexicais

mais produtivas desta terminologia.

A segunda etapa consiste no estabelecimento de regras lingusticas que

nos permitam levantar as ambiguidades das classes gramaticais por forma a

obtermos o maior nmero possvel de frasemas correctos. de acordo com a

tipologia estabelecida.

5. Tipologia de matrizes terminognicas

5.1. Tipologia elementar

No mbito desta dissertago. pretendemos identificar e delimitar os

frasemas que, num contexto terminolgico textual, assumem o estatuto de

denominaces. Partimos do pressuposto terico de que o frasema remete

para um nico conceito, correspondendo a sua denominaco a uma unidade

terminolgica. As unidades terminolgicas so denominaces que, sendo

monolexmicas, assumem, maioritariamente, o estatuto de nome. No caso de

serem unidades multilexmicas comportam-se em contexto textual como uma

unidade monolexmica, sendo, por esse motivo. a sua forma base um nome.

Considera Sager que: Du point de vue formel. le terme est [...] un signe

linguistique (il se prsente alors sous la forme d'un nom). [...]. Dans le

discours crits ces signes sont considrscommes des noms [...]. S'il [terme]

182

est pns comme un signe linguistique et comme une unit syntagmatique. le

terme est une varit fonctionnelle du nom comum (Sager. 2000:53).

Na observaco do corpus da Detec^o Remota. tal como j tinha

acontecido com o corpus da Economia Monetna (Costa, 1993). venficmos

que. na constituico das unidades termmolgicas, as classes gramaticais

mais produtivas so os nomes, os adjectivos e as preposices, que fazem

parte das 100 formas mais frequentes do corpus:

Ordem

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

J__

2___28

Frequncia

13072

11938

9166

7762

5411

3932

3825

3626

3266

3157

2814

2708

2633

2540

2028

1942

1875

1831

1812

1769

1664

1607

1592

1554

1413

1337

1228

1031

Forma

de

da

_____

_que_

se

em

os

uma

para

______

As

um

com

por

das

no

na

imagem

ou

183

29 1010 imagens

30 987i

31 931

806

791

782

767

32 1

33"

34 nao

35 ao

36 766 como

37 758

38 716 2

ser

so

39 700

40 685

41 628 mais

42 607 informago43 577 3

44 552 entre

45 538 dados

satlite46 512

47 488 sobre

48 445 cada

49 414 energia

50 401 valores

51 378 pode52 377 pela53 363 este

54 360 foi

55 356 pelo56 353 sua

57 346 solo

58 345 sistema

59 343 forma

60 342 detecco

61 336 reas

62 333

63 328 X

64 323 anlise

65 322 4

66 319 superfcie67 316 i68 314 regio

69 306 terreno

70 305 classificagonas71 297

72 296 diferentes

73 294 tem

74 281 nos

^84

75

76

77

_78_

_7$__80

81

278

274

270

264^

26^261

260

0

Utilizaco

rea

foram

resoluco

conjunto

tipo

82 260 agua

83 257 5

84 252 remota

85 252 partir

86 252 bandas

87 251 podem

88 249 reflectncia

89 247 m

90 246 tambm

91 243 s

92 242 esta

93 236 espectro

94 233 assim

95 231 sistemas

96 231 pontos

97 230 Terra

98 228 /

99 226 banda

100 225 espectral

Alm destas classes, privilegimos os nomes prprios e as siglas que

tambm desempenham um papel relevante nesta terminologia.

Partindo deste conhecimento, elabormos uma primeira matnz que d

conta das estruturas elementares das unidades terminolgicas.

Obtivemos a seguinte tipologia:

185

A tipologia . deste modo. constituda por sete tipos principais,

correspondentes s estruturas elementares das unidades terminolgicas que

desempenham a fungo de uma unidade monolexmica em texto.

5.2. Anlise da composigo das unidades terminolgicas

multilexmicas

A extenso sintagmtica das unidades terminolgicas multilexmicas

imprevisvel, sendo as fronteiras entre a colocago. o frasema e a fraseologia,

a fraseologia e a proposigo nem sempre muito transparentes. Identificar e

proceder ao processamento automtico das unidades terminolgicas no seio

destas diferentes realidades lingusticas, constitui um grande desafio, inerente

ao tratamento automtico dos textos de especialidade.

Em lngua de especialidade, as denominages so na sua essncia

constitudas por lexemas e frasemas, podendo da sua conexidade resultar

fraseologias. Apesar de, do ponto de vista terico, a distingo entre umas e

outras estar estabelecida, na prtica as diferengas nem sempre so

facilmente detectveis.

Em 1991, Jacquemin (in Daille, 1994) utiliza o conceito de

sobrecomposigo para dar conta da forma como as estruturas elementares se

conjugam entre si, dando origem a novas unidades multilexmicas.

De acordo com a tese defendida por Jacquemin. a sobrecomposigo

recorre a duas operages: a sobrecomposigo por justaposigo e a

186

sobrecomposigo por cobertura (recouvremenh). podendo esta ser

parcial.

Estamos perante um processo de sobrecomposigo por justaposigo

quando, por exemplo, se acrescentaum adjectivo a uma estrutura elementar

j atestada. No exemplo

adjectivo adicionado unidade terminolgica

cuja estrutura corresponde a uma das estruturas

elementares que constam da tipologia acima apresentada:

A sobrecomposigo por cobertura (recouvremenh) equivale jungo

de duas unidades terminolgicas j atestadas, deixando cair o segundo

elemento da primeira unidade ou o pnmeiro elemento da segunda unidade:

e resulta

no termo Que corresponde a uma das seguintes

estruturas: N. ou ento N2

Daille reformula o conceito de sobrecomposigo. Aceita a

sobrecomposigo por justaposigo, rejeita a sobrecomposigo por cobertura

(recouvremenh). preferindo neste caso utilizar o conceito de

sobrecomposigo por substituigo, que define do seguinte modo: [...] tant

donn un nom compos de longueur 2, l'une des units lexicales pleines est

substitue par un nom compos dont la tte est cette unit lexicale (Daille,

1994:58).

Podemos ilustrar esta definigo com o exemplo seguinte:

+ -> , cuja tipologia corresponde

seguinte estrutura:+ ~*

187

A unidade terminologica retoma. assim. o primeiro lexema

da pnmeira unidade muitiiexmica e o ltimo lexema da segunda unidade

multilexmica sendo cnado, desta forma. um novo frasema. Este tipo de

composigo possvel quando o termo base desempenha a fungo de

hipernimo. sendo este o caso de . termo extremamente produtivo na

rea da Detecgo Remota.

Mas, para Daille, o conceito de sobrecomposigo insuficiente para

dar conta dos processos de modificago operados sobre os tiposelementares

por esta autora definidos: Les modificateurs apparaissent avant, l'intrieur

ou aprs le nom compos. Les modificateurs qui apparaissent avant ou aprs

ne cassent pas la structure, au contraire de ceux qui apparaissent l'intrieur.

Ces deux cas de modifications peuvent donner l'ieu de nouveaux noms

composs [...] (Daille. 1994:59).

Mas a distingo entre a sobrecomposigo e a modificago tambm no

satisfatria, uma vez que um processo muitas das vezes pressupe o outro,

o que no os torna totalmente operativos. A prpria autora assim o considera:

Ces deux phnomnes ont des dfintiions linguistiques diffrentes mais les

donnes tudies rvelent que ia frontire rlle est floue. (Daille, 1994:66).

Pensamos que o conceito de sobrecomposigo pode ser utilizado

como um gennco, para dar conta de processos morfolgicos que permitem

combinar entre si as vrias estruturas que compem as matrizes

terminognicas. O resultado desses processos morfolgicos redundam em

sequncias que designamos por colocages, frasemas ou fraseologias.

consoante os casos em anlise.

188

Passamos a analisar algumas das estruturas que as unidades

terminolgicas complexas ou 'frasemas terminolgicos' podem assumir e as

diferengas que estes apresentamrelativamente s fraseologias.

Para ilustrar os nossos propsitos. partimos de um enunciado retirado

do corpus em Detecgo Remota Assinalmos a azul as sequncias que

correspondem aos tipos que constituem a tipologia elementar e a vermelho as

formas que se repetem no fim e no pnncpio de dois tipos distintos:

De entre os vnos sistemas de mais geral utilizago destacam-se os que

permitem medir astonalidades [N]

(os microdensitmetros). efectuar a

composigesde imagens de vrias

do espectro.

De acordo com a tipologia elementar (cf. Captulo IV, ponto 5. 159),

obtm-se as seguintes sequncias:

(1) densidades das tonalidades

(2) tonalidades das imagens

(3) anlise estereoscpica

(4) pares de fotografias

(5) obtengo de composiges

(6) composiges colohdas

(7) bandas distintas

Apesar das sequncias (1) e (2) obedecerem estrutura elementar e

dos lexemas que as compem serem terminolgicos, no podemos

189

consider-las unidades terminolgicas complexas, porque no denominam

nenhum conceito. Como o ltimo lexema da pnmeira sequncia corresponde

ao pnmeiro lexema da segunda sequncia, podemos fundir os dois tipos

elementares. para passar a ter um estrutura combinada que integrar a

tipologia de base (cf. Capitulo IV. ponto 5.3. p. 170):

N2 + N2 + -> N2

Esta fuso d origem sequncia tonalidades

que no corresponde a uma unidade terminolgica. nem a uma

fraseologia. Podemos considerar esta sucessode lexemas uma 'sequncia

terminolgica livre', pois embora a concentrago de lexemas monolexmicos

terminolgicos no eixo sintagmtico seja elevada, da proximidade destes no

resulta qualquer coeso. no podendo a sequncia ser confundida com um

colocago terminolgica. um frasema terminolgico ou uma fraseologia.

Procedendo da mesma maneira para as sequncias (5) e (6),

alcangamos, porm, resultados diferentesdos anteriores:

N2 + N2 * N2

A sequncia obtida composiges

Neste caso, consideramos estar perante um exemplo de fraseologia,

da qual se pode extrair uma unidade terminolgica complexa

na medida em que esta ltima denomina um conceito. Identificamos

190

na sequncia composiges ,uma fraseologia. por o

lexema ser um nome deverbal. que denva do participio passado do

verbo . denotando este tipo de nome acgo.

Assim. estamos perante dois conceitos, umcom caracterstica de verbo

(cf. captulo 3, ponto 3) se bem que expresso por um nome. ,outro

com caracterstica de objecto, sendo expresso por uma unidade terminologica

complexa0 nome ,

facilmente. pode ser

substitudo pelo verbo , passando a sequncia a se

A obtengo e a aquisigo de informago esto na base da Detecgo

Remota, o que justifica a frequncia dos paradigmas dos verbos e

Num corpus, que conta com 12.888 formas, o nome tem

um frequncia de 77 ocorrncias, o particpio passado ... tem uma

frequncia 364 e a totalidade das formas conjugadas ocorre 129 vezes,

perfazendo um total de 647 ocorrncias.

As fraseologias, as colocages e algumas sequncias terminolgicas

livres, embora no correspondam a unidades terminolgicas, tm uma

importncia crescente em terminologia textual, uma vez que nos permitem

identificar unidades discursivas recorrentes numa rea de especialidade,

fundamentais para o processamento automtico da informago.

Em (sequncia 3), identificamos dois lexemas

terminolgicos. sendo o primeiro um termo gennco de onentago cientfica

geral, considerando que utilizado, em reas to diversas como a literatura, a

qumica, a psicanlise,...

191

Em contrapartida. o adjectivoum lexema

terminolgico da Detecgo Remota. No entanto. a sequncia no corresponde

a uma unidade terminolgica, podendo ser retida como uma colocago,

porque emborano seja um termo especificamente da especialidade.

tem uma frequncia 323 (cf. Captulo 4, ponto 5.1), sendo a sexagsima

quarta frequncia mais elevada do corpus. Em conformidade com esta

estrutura, encontramos sequncias como: ,

e

, ..., comprovando a produtividade desta combinatria.

No entanto, mais uma vez as realidades lingusticas em anlise so

djstintas e so frasemas terminolgicos,

enquanto queuma colocago que est ao mesmo

nvel que. Os dois primeiros denominam conceitos, os

dois ltimos no.

Estas distinges compreendem-se pelas caractersticas dos adjectivos

que modificam os nomes. Os adjectivos e so relacionais,

porque derivam de uma base nominal, posicionando-se sempre direita do

nome, no aceitando gradago:

Por outro lado, so sempre subcategorizados pelos substantivos que

modificam, mas no qualificam, podendo esta subcategorizago dar conta de

192

uma relago estvel ou efmera entre o substantivo e o adjectivo. Se a

relago for estvel [...] /a lexicalisation entraine le blocage de la formule. qui

ne peut subir aucune modification sans perdre sa rfrence habituelle [...].

(Noailly. 1999:22), se: em contrapartida. a relago for efmera [...] une

paraphrase rintroduisant enjeu le substantif qui est la base de la drivation

permet de restituer le sens souhait sans problme (Noailly. 1999:22).

No caso de , pensamos que a relago efmera

por dois motivos: o primeiro, prende-se com uma questo extralingustica:

esta combinago de lexemas no coesa, porque no d conta de nenhum

conceito.

0 segundo motivo, de ordem lingustica. Os adjectivos relacionais

indicam uma relago com o referente do nome do qual derivam. 0 nome

no subcategoriza o adjectivo . j que neste caso o

resultado da observago de e no o

resultado da anlise de uma tcnica em si. Assim, no podemos substituir

por*

,ou ainda

por*

Em compensago. os termos e

referem-se a anlises de resultados obtidos sobre o espectro e sobre a

textura, podendo por estes motivo serem substitudos por

e . constituindo, e os equivalentes

sintcticos e semnticos de um complemento de nome.

S o nome . lexema base da sequncia seguinte (4),

, que permite a subcategorizago do adjectivo

193

que este sim. uma unidade terminolgica, cuja estrutura elementar

corresponde expresso

0 frasema sofreu um processo de elipse. sendo o

lexema termmolgico. ,omitido. 0 termo , assim,

. sendo a sua estrutura

que no est contemplada na tipologia elementar.

Caso juntemos as sequncias (3) e (4) obtemos a sequncia

, cuja estrutura tambm no pertence

aos registos da tipologa elementar:

0 adjectivo relacional est sintacticamente mal

colocado, no podendo este ficar separado do lexema ,uma vez que

por ele subcategorizado, concordando o adjectivo em nmero e em gnero

com o respectivo nome. Apesar desta m colocago sintctica somos

induzidos a fazer o levantamento desta sequncia, uma vez que ela ocorre tal

e qual no corpus e com ela que temos que operar:

(D

(2)

->

Nestes dois exemplos, estamos perante duas fraseologias.No primeiro

exemplo, a fraseologia constituda por uma colocago,

, que atravs da anlise se demonstrou ser incorrecta no seu

194

processo de formago. e uma unidade terminolgica complexa,

. No segundo exemplo, a fraseologia constituida por uma unidade

terminolgica simples. . e por uma unidade terminolgica complexa,

Em ambos os casos estamos perante a jungo de dois conceitos. com

caractersticas de objecto.

Se o processo de elipse acima operado sobre for

aplicado neste contexto fraseolgico, obtemos as seguintes variantes:

(3)

(4)

A sequncia 3 continua inaceitvel, uma vez que o adjectivo continua

mal colocado. Por sua vez. a sequncia 4, sem a omisso , equivale

a um encunciado correcto, deixando de o ser com a aplicago do processo

elptico. Neste contexto, a elipse no desejvel, uma vez que altera a

correcgo sintctica do enunciado, trazendo essa modificago alterago ao

nvel do conceito. introduzindo ambiguidade no discurso.

Resta-nos ainda analisar o ltimo exemplo, que

corresponde a uma sequncia livre de lexemas: um lexema

terminolgico monolexmico, acompanhado de um outro lexema, um

adjectivo qualificativo de uso corrente.

195

No entanto, se juntarmos tal sequncia seguinte

obtm-se uma combinatria interessante a reter

. que corresponde seguinte estrutura: Neste

caso concreto. h o encaixe do adjectivo que vem modificar.

temporanamente. o termo base da unidade terminolgica

multilexmica ,acarretando, neste caso, uma alterago na

sua estrutura tipo. Esta unidade faz parte das estruturas que nos interessa

reter, podendo ser representada da seguinteforma:

Destas anlises retemos alguns fundamentos para a construgo do

ExtracTerm:

(i) As estruturas que compem a tipologia elementar podem ser

combinadas por forma a obter sequncias mximas, colocages

e fraseologias, que se revelam ser contextos minimos de

frasemas terminolgicos.

(ii) O alargamento da tipologia elementar impe-se. As

combinatrias gramaticais e estruturais comprovam-se

profcuas, originando uma tipologia de base, derivada da

tipologia elementar. que estar na cerne do dicionrio de

matrizes sobre o qual concebido o ExtracTerm.

(iii) A comprovago da importncia das colocages e fraseologias

para a identificago de frasemas terminolgicos e para a

apreenso de estruturas discursivas mais alargadas que podem

servir, entre outros, a tradugo automtica.

196

'

5.3. Tipologia de base

Com base na tipologia elementar. crimos a tipologia de base que

reflecte, com uma maior fidelidade. as estruturas morfossintcticas das

unidades terminolgicas da Detecgo Remota,

Da observago e anlise desenvolvidas ao longo deste captulo,

elabormos a seguinte tipologia:

Ni + Adji

=> [satlite meteorolgico ]

=> [sistema [multi- espectral ] ]

=> [sistema [multi- cmara ] ]

N^ + Adji + Adj2

=> [[filmes infravermelhos ] coloridos ]

N^ + Adji + Adj2 + Adj

=> [[[banda espectral ] infravermelha ] prxima ] ]

N^ + Adji + Conj + Adj2

=> [filmes preto e branco ]

Ni + Adji + Prep + N2

=> [[tratamentos numricos ] por computador ]

197

Ni + Adji + Sigla^

=> [[magens digitalizadas ] Landsat ]

Ni + N2

=> [imagem textura ]

Ni + hfen + N2

=> [imagem- textura ]

=> [imagens- carta ]

Ni + N2 + Adji

=> [imagem satlite ] digitalizada ]

Ni + N2 + Siglai

=> [[imagens textura ] Spot ]

Ni + Prep + N2

=> [imagem de satlite ]

Ni + Prep + Np^

=> [lei de Planck ]

Ni + Prep + Npi + Conj + Np2

=> [efeito de Doppler e Lorentz ]

N, +Npi

=> [efeito Doppler ]

Ni + Npi + Conj + Np2

=> [efeito Doppler e Lorentz ]

Ni + Siglai

=> [imagem Landsat ]

Ni + Siglai + Adji

=> [[imagem SPOT ] colorida]

Ni + Siglai + Sigla2

=> [[imagem Landsat ] MSS ]

Sigla^ + Sigla2

=> [Landsat TM ]

Acrescentando as siglas e os nomes prprios s trs classes

gramaticais, nomes. adjectivos e preposiges, construmos a tipologia de

base, que conta com 19 matrizes, que resultam de processos de

199

sobrecomposigo e de combinatrias de 7 estruturas elementares (cf.

Captulo IV. ponto 5.1.).

5.4. Dicionrio de estruturas tipo.

Os 19 tipos de base que compem a matriz terminognica foram

desdobrados em todas as suas variantes, tendo em conta as regras da lngua

portuguesa e de acordo com a informago contida na tabela de etiquetas (cf.

Captulo 4, ponto 2).

Alm das variantes, demos conta de todas as suas combinatrias, o

que resultou num dicionrio de estruturas tipo de unidades terminolgicas

complexas.

0 Dicionrio de tipologias , por conseguinte, constitudo por 666

matrizes, do qual apresentamos uma amostra exemplificativa:

N + Adj

N:m:s Adj:m:s

N:m:pl Adj:m:pl

N:f:s Adj:f:s

N:f:pl Adj:f:pl

N:2gen:s Adj:2gen:s

N:2gen:pl Adj:2gen:pl

N+Prep+N => N + Prepl de + N

N:m:s Prepl de N:m:s

N:m:s Prepl de N:m:pl

N:m:s Prepl de N:f:s

N:m:s Prepl de N:f:pl

N:m:s Prepl de N:2gen

N:m:s Prepl de N:2gen

N:m:pl Prepl de N:m:s

200

N:m:pl PrepT.de N:m:pl

N:m:pl Prep1:de N:f:s

N:m:pl Prep1:de N:f:pl

N:m:pl Prep1:de N:2gen:s

N:m:pl Prep1:de N:2gen:pl

N:f:s Prep1:de N:m:s

N:f:s PrepTde N:m:pl

N:f:s PrepT.de N:f:s

N:f:s PrepTde N:f:pl

N:f:s Prep1:de N:2gen:s

N:f:s PrepTde N:2gen:pl

N:f:pl PrepTde N:m:s

N:f:pl Prep1:de N:m:pl

N:f:pl PrepTde N:f:s

N:f:pl PrepTde N:f:pl

N:f:pl PrepTde N:2gen:s

N:f:pl PrepTde N:2gen:pl

N:2gen:s PrepTde N:m:s

N:2gen:s PrepTde N:m:pl

N:2gen:s PrepTde N:f:s

N:2gen:s PrepTde N:f:pl

N:2gen:s PrepTde N:2gen:s

N:2gen:s PrepTde N:2gen:pl

N:2gen:pl PrepTde N:m:s

N:2gen:pl PrepTde N:m:pl

N:2gen:pl PrepTde N:f:s

N:2gen:pl PrepTde N:f:pl

N:2gen:pl PrepTde N:2gen:s

N:2gen:pl PrepT.de N:2gen:pl

N + Adj + Prep + N => N + Adj + Prep1:pelo + N

N:m:s Adj:m:s Prep2:pelo:m:s N:m:s

N:m:pl Adj:m:pl Prep2:pelo:m:s N:m:s

N:f:s Adj:m:s Prep2:pelo:m:s N:m:s

N:f:pl Adj.fpl Prep2:pelo:m:s N:m:s

N:2gen:s Adj:2gen:s Prep2:pelo:m:s N:m:s

N:2gen:pl Adj:2gen:pl Prep2:pelo:m:s N:m:s

com base neste dicionrio de estruturas tipo que o ExtracTerm

efectuar a primeira identificago de frasemas. (cf. Captulo V).

201

Captulo V

Extractor automtco de unidades

terminolgicas multilexmicas: ExtracTerm

1 . Concepgo do ExtracTerm

1.1. Aplicago do dicionrio de tipologias

1.2. Anlise dos resultados

2. Regras de desambiguago

2.1 . Preposigo, artigo definido feminino singular e pronomes

2.1.1. Regras lingusticas de aprendizagem

2.2. Adjectivo e participio passado ps-nominal.

2.2.1. Regras lingusticas de aprendizagem

2.3. Nome e adjectivo

2.3.1 . Regras lingusticas de aprendizagem

3. ExtracTerm: utilizago das regras de aprendizagem

3.1. Anlise dos resultados

3.2. Teste do ExtracTerm sobre um corpus alargado

3.2.1. Anlise dos resultados

Captulo V Extractor automatico de unidades

terminolgicas multilexmicas: ExtracTerm

1. Concepgo do ExtracTerm

1.1. Aplicago do dicionrio de tipologias

0 ExtracTerm foi concebido tendo por base conhecimentos previamente

adquiridos na observago de textos de especialidade. 0 seu funcionamento

assenta num dicionrio de tipologias terminognicas flexvel. que pode ser

alterado em qualquer momento do processo. 0 ExtracTerm funda-se em

princpios tericos deterministas. segundo os quais as condiges de existncia

de um fenmeno so determinadas e fixadas, de tal forma que o fenmeno

ocorre de modo obrigatrio.

Extrair sequncias reconhecidas como colocages, frasemas terminolgicos

ou fraseologias o objectivo que nos propomos alcangar com o ExtracTerm,

que opera, exclusivamente. sobre textos etiquetados.

Com base nos textos etiquetados, o ExtracTerm aplica as matrizes contidas

no dicionno de tipologias (cf. Captulo IV, ponto 5.4), apresentando o algoritmo

correspondente a essa fungo o seguinte cdigo:

ior iterat cr_ccrpus_divicidc=

corpus_diviGidc . begir: ( ;

iterator_corpus_divicido := ccrpus_divicidc . enc : : ;

iteratcr_ccrpus_d: vicico^- )

I

1 1 e r 3 1 o r_

c c rpu s_

c i v i d i c o ;

203

's T 3 t C i

Prrsl i j? d:

r.ei

i. c r

irstor cor

-

:.,];

*

'= "rr..__. uivigg: . ;:.. .;ir.

_ _ eratcr cc rpu.-: =.i _i v: dico2-- ;

"<r loc kcu: ; -

"

;

: : erot cr_ccrpus ajvidicoc =

noc.2; :~ei 3\cr_ccrpu=_ divididco=

dc; it.cratcr ccrpus c__vid:cc : ++ '.

i' b. ua

: : iterdi ci c,rpus_civGidcJ->errr.

out <<" "

<< neratcr ccrpus

:G3 <<

ou*. <' "< /fciock .uote

o.:* << "<_";!' ><c>";

for : iieradcr_tipclocias= tr._tipoiogia . beqm ; ;

i:eracor_iipclcgias : '- nr,_t ipclogia. er.d t : ; : teradcr__t ipclogis-i--)

I

'"/ r'a:iZS partes rem est-j regra

ini paries= i :.erador_: ipjicgias->si ze

' ) ;

i: iterator_corcus_dividido->Ccrr.cara_Eciqueta"

oiioci as j'

0 1 j ;,

""

:t srcCor_.

I

fcv:i enccritre:= true;

i:ert or_corpu s_d i vi di co i=

1 1 e r a t o r c o rpu s _d i v i d r do ;

;:il:.c - itera:or_ccrpus_d: vididcl ->entrada ;

fcr ( itEtiquetas=

;~iterator_cciL js _civ i ci do i ; . eriqueta . becir, ( ) ; LtEticut-tas ! =

'

" "

r erar.or cciujs oivicido': .r-r iqur- a . end ( ) ; itEt quetas1

-

(

dbq-=

"

<:or.t ccior=\"-C0 C6 "J\"> i"

'oc * = :.'

z Et quet a s ) ;

cbq + ="

| < i on t > ";

irpus div: . enc .

i .;._... a i."

teracor

..:::. __

= 1; i < partes ; i~~

i: :. itei'atcr_ccrpus_divicido .

i z e r a t o r_cc rpu s_d i v i d i dc 1

i: ! i ;. eratcr_ccrpus_civicGOi: i p..;i l.-u i.-ss ) _

i : ; )

CT'iCOV. r e .: Ld.S,'

204

>er."." r

1 L t ):_:"" i_

~crc :_:_- ^x-.r

;r -- r r-:

- -

r ccrcjs divicid-

crc-=

i:ertor_corr.us c_.

-* .end : j ; : cE: :qu&: as- 4

.

': l. _tiCU'(;:

i</:cnt:> ";

,,cr= \,,=CGCCCO\"

'iterador ::

out << c;:g <<"

<cr_:

*

c r i r. z i = C ; i < c a r t e s ; i + +

cu: <<

:ias! [i] . etiquef s ;0] ;

if ( i < parr.es-*

)

cur <<"

- ";

>

cu: << "i</for.t> <fcr>";

dt' c =

" "

;

paiavrss ti:itacas+~;

:: caiavias :ra:. aca. JCO

palavras_:ra:adas= 0;

stc: : cout <<"

.

"

;

o comportamento das formas base. etiquetadas come que, no

mbito desta dissertaco. nos interessa observar.

0 ExtracTerm procede ao reconhecimento consecutivo de cada forma

contida no corpus. acompanhada da etiqueta metalinguistica ou

sendo estas duas etiquetas os pontos em que o programa se detm para iniciar

o processo subjacente extracco

205

Assim, o extractor micia a seu percurso detendo-se no pnmeiro ou

que encontrar Venfica se a sequncia de etiquetas que se posiciona

direita do ou corresponde primeira das 666 sequncias matriciais

contempladas no dicionno.

Se a pesquisa for profcua. o ExtracTerm extrai a sequncia, acompanhada

da matnz correspondente sua estrutura. para um ficheiro HTML. Caso no

encontre a estrutura correspondente, passa regra seguinte, at percorrer as

666 matrizes. Esta operaco repete-se, sequencialmente, para todas as

etiquetas e de uma pontuaco forte a outra pontuaco forte.

Assim, ao enunciado,

Teledetecgo em reas periurbanas: combinaco de ndices temticos para

localizar a mudanca de uso do solo com recurso s imagens digitais SPOT

HRV.

aplicado o EtiqueLex, sendo o formato de sada, como se apresenta de

seguida

Teledetecco em reas periurbanas

combinaco de ndices temticos para

localizar a

mudanga de uso [N:m:s] [V:cj] do solo

com recurso s imagens digitais

SPOT HRV

Com base no texto etiquetado, o ExtracTerm efectua a seguinte extracgo:

206

1 . Teledetecgo em

2. reas penurbanas

3. combinago de

4 combinago de

Prepfde + N m.pl + Adj m:pl}

5. indices temticos

6. mudanga de

7. uso

8. solo

9. imagens

lO.imagens

H.imagens

do

com

digitais

digitais

digitais

Adj.2gen pl + Sigia*

Sigls}

12.SPOT HRV

areas

{N' p "r Adjf

ndices

ndices

{N f.s -

Prepl em* h pi}

N:f. 'recl :ie- N m pl}

temticos ;n*'s

{N nrp' + Aaj'm.pl}

USO {Nfs + Drep1 de - N:rr s}

SOlo {N rr. s-

Prep2 dorrs- N.m s}

recurso {N m s-

Prepl com- N m s)

{N: p + Adj.2gen pl}

SPOT {N:

pl + Adj:2gen pl + Sigla}

SPOT HRV {Nfpl

{Siga + Sig'a)

0 texto a preto corresponde s sequncias extradas, a informago a

azul, entre parntesis rectos, contm a mformago metalingustica e a

informago a vermelho, entre chavetas, equivale s regras que o ExtracTerm

aplicou.

Os resultados obtidos, exemplificados com este pequeno enunciado,

permitem-nos avangar com a sua anlise, explanando o funcionamento

dinmico do ExtracTerm.

1.2. Anlise dos resultados

Retomamos o exemplo apresentado no ponto 1.1. de forma a comentar

os resultados obtidos a partir do funcionamento do ExtracTerm

207

Para ilustrar o nosso propsito, apagrnos parcialmente a informago

metalmgustica do texto etiquetado. deixando exclusivamente as etiquetas

e

Teledetecgo em reas penurbanas. combinago de

indices temticos para localizar a mudanga de uso do

solo com recurso s imagens digitais SPOT

HRV

0 ExtracTerm comparou o corpus ao dicionno de tipologias. Sempre

que direita do se encontra uma etiqueta que corresponde s sequncias

registadas no dicionno de tipologia, ele efectua uma extracgo. Foi o que

sucedeu com com mas no aconteceu com o

nome por na tipologia no estar prevista uma sequncia

Para os restantes , o ExtracTerm extraiu todas as sequncias

previstas no dicionrio de tipologias.

Vejamos as sequncias (2). (3) e (4), que correspondem ao enunciado

(2) combinagode ndices {N:f:s+ Prepfde

-

N:m:p}

(3) combinago de ndices temticos {N:f:s*

Prepl :de + N:m:pl + Adj:m:pl}

(4) ndices temticos {N:m:pl + Adj.m.pl}

Para extrair a sequncia mxima

aplicmos uma regra complexa {N:f:s + PrepVde + N:m:pl + Adj:m:pl}, que

208

resulta de duas regras elementares {Nfs + PrepVde + N:m:p} e {N:m:pl +

Adj:m:pl}.

Nesta situago, verificmos que a regra {N:f:s + PrepVde - N:m:pl+

Adj:m pl} dispensvel. uma vez que a fraseologia recuperada com as

primeira e terceira regras. 0 resultado desta opgo a seguinte:

(2) combinago de ndices {Nf.s+ PrepV.de + N:m:p}

(4) ndices temticos {N:m:pl+ Adj:m:pl}

0 reconhecimento da fraseologia resulta do facto de o ltimo da

primeira regra coincidir com o primeiro da segunda regra. obtendo-se a

sequncia ndices ,em que um dos

eliminado no momento da interpretago do contexto que envolve o e

que designamos de contexto lexical: Although not as common, the lexical

context of a unit can be defined as the set of words, terms or candidate terms

which appear in the same given dependency relation within a syntactic

structure. For example, the lexical context of a noun could be defined as all the

distinct nouns that adjoin onto it to make a compound noun (Bourigault, D. et

aln, 200VXIII).

No obstante. preferimos manter as trs regras, apesar da redundncia

manifesta da regra {N:f:s + PrepVde + N:m:pl + Adjmpl} e desta estrutura

corresponder, no a uma unidade terminolgica mulitlexmica, mas a uma

fraseologia, Em nosso entender, prefervel que o resultado da extracgo

contenha mais rudo e menos silncio.

209

Enquanto a primeira extracgo, {N f:s + Prepl :ae

+ N m p} deve ser ignorada. por corresponder a uma 'sequncia livre

terminolgica', a aplicago da segunda regra provocou a extracgo de uma

fraseologia composta pelo lexema ,termo genrico de onentago

cientfica, e pelo frasema terminolgico Consideramos,

assim, a fraseologia um contexto mnimo do frasema terminolgico. ou seja, um

contexto lexical. porque, em acordo com Boungault: [...] the lexical context of

a unit is the set of words which occur in the same dependency relation with ih

(Bourigault, D. et aln, 200VXVI).

A composigo da fraseologia pode ser representada desta forma:

N:f:s + PrepVde + N:m:pl + Adj:m:pl

Das trs sequncias que se seguem:

(5) mudanga de uso {N ,f s + Prepi de + N-m.s}

(6) USO do solo {N.m s + Prep2 dom s + N n.s}

(7) solo com recurso {N rr s + Prepl com + N m s}

a sequncia (6) e (7) so excludas de per se, na medida em que as

classificamos como 'sequncias livres terminolgicas'.

No entanto, a sobreposigo da matnz aplicada em (5) com a matriz

aplicada em (6) permite-nos chegar a uma interpretago prxima da anterior:

210

uma fraseologia da qual se pode extrair o termo

N:f:s + PrepVde + N:m:s + Prep2:do + N:m:s + PrepVcom + N:rrvr

Neste caso, a pnmeira regra retm . a segunda regra

retm a sequncia . a combinago de duas regras que nos

permite isolar a unidade terminolgica, sendo o termo,o de ligago

entre as duas regras: Nms +

As sequncias e so 'sequncias

livres terminolgicas'. por a sequencialidade dos seus lexemas corresponder a

um corte sintctico pertinente no texto, no havendo, no entanto, combmages

lexicais que os solidarizem. e tm

ambos frequncia 1 e ocorrem em contextos em que os seus especificadores,

que se apresentam sua direita. so omissos. por terem sido amplamente

referenciados antes.

0 mesmo no acontece com . Neste caso, a estrutura

ocasiona uma ciso errnea de duas sequncias

sintcticas coesas: a unidade terminolgica e a locugo

preposicional

Tal facto sucedeu. por o ExtracTerm se deter em e constatar que a

expanso direita corresponde a uma matnz pr-registada. A falha deve-se,

essencialmente, a dois factores.

211

0 pnmeiro, relaciona-secom o facto de termos includo a preposigo

na lista dos gramemas pertinentes para constituigo de unidades

terminolgicas multilexmicas. Da observago dos resultados, venficmos que

ela no uma preposigo constituinte. mas uma preposigo cuja fungo e a

de associar dois frasemas. como podemos comprovar com os exemplos

seguintes:

com

com

com

com

A preposigo tem a fungo de associar no eixo sintagmtico dois

termos dotados ambos de autonomia semntica.

0 segundo factor, diz respeito no incluso da locugo no

dicionrio das locuges, o que levou o EtiqueLex a etiquetar

agindo, desta feita, o ExtracTerm sobre a locugo preposicional como se de

uma sequncia livre se tratasse.

Em resultado desta anlise, acrescentmos a locugo . no

dicionno de locuges e eliminmos as mathzes que continham a etiqueta

na medida em que o rudo provocado por esta matriz superior

ao silncio provocado pela sua ausncia.

212

As quatro ltimas sequncias so exemplos de uma extracgo fina, bem

q

sucedida:

(9) imagens digitais {N:f:pl+ Adj:2gen:pl}

(10) imagens digitais SPOT {N:f pl + Adj.2gen:pl+ Sigla}

(11) imagens digitais SPOT HRV {N:f:pi - Adj:2gen:pl+ Sigla + Sigla}

(12) SPOTHRV{Sigla-Sigla}

Neste caso, os quatro exemplos correspondem a quatro unidades

terminolgicas multilexmicas. uma vez que correspondem a quatro

denominages distintas, sendo que as expanses direita de (10) e (11) vm

especificar o tipo das .tendo. para estes casos, o ExtracTerm

funcionado de acordo com as suas mximas potencialidades.

[[[imagens digitais ] [[SPOT ] HRV ] ]

Se entendermos que desempenha a fungo de um nome.

podemos. por extenso, considerar que e desempenham a

fungo de 'siglas epitetos' ao mesmo nvel dos substantivos eptetos: Les

substantifs pithtes, s'ils passent un statut d'adjectif, le font donc toujours

par le truchement de la fonction pithte. C'est en s'attachant directement un

substantif recteur qu'ils se dchargent de leur poids rfrentiel et deviennent

progressivement des tndicateursde propnts (Noailly, 1999:24).

Para o especialista, o adjectivo pode ser omisso, sem que a

ambiguidade conceptual se estabelega. De facto,todas as imagens de satlite

so, actualmente. digitais (forma de registo dos dados), podendo ocorrer o

213

termo sendo que a sigla ,nome do satlite francs.

qualifica o nome ou o nome

Por sua vez, a sigla . que significa Haute Rsolution dans ie

Visible. um sistema de aquisigo de imagem inerente ao o que

nos permite inferir que a sigla desempenha a fungo de um adjectivo

qualificativo, tendo consequentemente. de ser subcategorizado por um nome

ou por outro elemento que desempenhe a fungo de um nome, sendo este. na

realidade. o caso da sigla

A sequncia uma unidade terminolgica e pode,

consequentemente. ser classificada como um nome. o que nos permite atribuir-

Ihe a fungo de nome epteto, ao mesmo nvel da sigla ,uma vez que.

inequivocamente, qualifica o termo

A extracgo correcta destes quatro exemplos leva-nos a concluir que as

regras tm em determinadas condiges uma boa aplicabilidade, o que nos

induz a melhor-las.

Nestes ltimos exemplos apresentados, as regras permitiram extrair

todos as unidades multilexmicas da sequncia mxima, partindo do menos

complexo , para atingir o mais complexo.

e , voltando, novamente, ao menos

complexo. , ficando assim exploradas todas as hipteses deste

contexto lexical:

N:f:pl + Adi:2qen:pl + Siq a + Siqla

214

Uma das caractersticas do ExtracTerm podermos visualizar todos os

momentos de um processo que resultam do encaixe sucessivo de matrizes,

permitindo-nos decidir. de entre o leque apresentado, quais as sequncias a

reter. Neste caso. o encaixe decorreu de um processo morfolgico. Com

excepgo do ltimo termo, este processo pode ser considerado um processo

de sobrecomposigo. na medida em que cada expanso a direita, permite a

especificago de um conceito. o que em termos Iingusticos resulta numa nica

denominago.

Com o ExtracTerm extramos:

i. colocages

ii. frasemas terminlogicos

111. fraseologias

No entanto, tambm extraimos sequncias menos interessantes tais

como 'sequncias livres terminolgicas' e correntes, unidades multilexmicas

correntes, bem como sequncias resultantes de cortes mal efectuados.

Para que os resultados tenham uma melhor resolugo necessrio

melhorar a qualidade da matria prima do extractor: o texto etiquetado.

Se o ExtracTerm funcionar sobre informago metalingustica

desambiguada, as hipteses de erro so mais reduzidas. Pretendemos, assim

criar regras de desambiguago. exclusivamente aplicadas a determinadas

classes gramaticais.

215

2. Regras de desambiguagao

0 EtiqueLex atribui a cada forma todos os funges gramaticais que esta

pode assumir nos diferentes contextos. podendo uma forma estar marcada por

diversas etiquetas metalingusticas. Esta etapa equivale pnmeira fase de

procedimento do ExtracTerm, que foi concebido para extrair informaco tendo

por base textos etiquetados. 0 EtiqueLex tem, assim, a particularidade de

funcionar como ferramenta autnoma ou, ainda, como ferramenta integrada do

ExtracTerm.

Aps a etiquetagem efectuada, o ExtracTerm parte do dicionrio de

tipologias. que contm as estruturas que nos interessa identificar no corpus.

Quando uma forma est duplamente etiquetada, o ExtracTerm extrai duas

vezes a mesma sequncia. caso esta corresponda a uma das matrizes contida

no dicionrio de tipologias

Assim, para a sequncia ,em que

acompanhada da etiqueta e da etiqueta ,o ExtracTerm aplica

duas regras de reconhecimento: {N:f:s + N fs} e {N:f:s + Adj:f:s extraindo,

desnecessanamente, duas vezes a mesma sequncia, estando neste contexto.

a classificago errada para o lexema

Todavia, esta classificago desacertada no afecta o resultado da

extracgo. na medida em que ao especialista s interessa saber se a realidade

lingustica extraida ou no uma denominago, independentemente da

classificago gramatical atribuda a cada um dos seus elementos constituintes

216

De entre estas classes gramaticais. s nos interessa

distinguir a preposigo, uma vez que esta uma das classes que consta no

dicionrio de regras de reconhecimento.

Neste corpus. a forma tem frequncia 7762. no nos sendo possvel

saber quantas vezes ocorre cada uma das classes gramaticais. A primeira

consequncia contraproducente desta indeterminago desconhecermos a

posigo diferencial que cada uma das classes ocupa no eixo sintagmtico,

sendo difcil a avaliago da sua importncia na constituigo das unidades

termmolgicas multilexmicas. Deste desconhecimentodecorre a dvida sobre

a pertinncia da elaborago de regras de reconhecimento que contemplem a

etiqueta

S depois da aplicago das regras de desambiguago que iremos

decidir se a estrutura assim como as suas combinatrias,

so regras enriquecedoras para a extracgo automtica ou se, pelo, contrrio,

so geradoras de rudo.

Tomemos como exemplo o enunciado seguinte:

[...] combinago automtica

temticos calculados

[Pron:dem:f:s] [Prepl :a] partir de

Neste enunciado ocorrem duas formas, s quais so atribudas mais do

que uma etiqueta e

Embora a distingo entre particpio passado verbal

e particpio passado adjectival seja tratada no ponto 2.2, importa desde j

220

de ndices

a

[...].

No entanto. a dupla extracgo no tem qualquer utilidade: sobrecarrega

os resultados, aumentando, naturalmente. o volume de informago a

descodificar.

Se neste contexto, o resultado no afectado, outras situages h em

que tal sucede. Notexto:

[...] permite

extracgo

do

Contudo

obtidos

quanto_aos

dos niveis

coberto

. os

se_bem_que

nveis de

de reflectncia

vegetal

resultados

elucidativos

actividade clorofilina

identificmos diversas situages de etiquetagens erradas, que influenciaram

negativamente a extracgo:

1) nveis

coberto

resultados

de reflectncia

vegetal

do

obtidos

No primeiro exemplo, o lexema est duplamente mal etiquetado.

Na construgo do dicionrio de formas flexionadas. a forma no foi

marcada com a etiqueta , porque descontextualizada no a reconhecemos

como um lexema da especialidade.

217

0 efeito imediato desta etiquetagem errada reflectiu-se na incapacidade

do ExtracTerm extrair a unidade terminolgica multilexmica

por a etiquetagem atnbuda. automaticamente. a esta sequncia, no

corresponder a nenhuma matriz pr-determinada.

Tambm o lexema est duplamente etiquetado. mas de forma

correcta, embora, neste contexto, a etiqueta seja inadequada. uma vez que

se trata, inequivocamente, de um

No caso do ltimo exemplo, a sequnciao resultado

da aplicago de uma regra elementar {Nm.pl + Adj:m:pl}. A etiqueta

ignorada, uma vez que no faz parte das classes constituintes mestras das

unidades terminolgicas multilexmicas retidas e, deste modo, obtm-se uma

sequncia livre de lexemas. Nesta fase, o ExtracTerm ainda no detm a

informago necessna para distinguir um participio passado com valor verbal

de um particpio passado com valor adjectival, o que resulta numa extracgo

no produtiva.

0 nosso objectivo o de aumentar ao mximo a correcgo lingustica,

para diminuir o erro na extracgo. Para esse efeito. imprescindvel reduzir a

ambiguidade provocada pela atribuigo de mltiplas etiquetas a uma mesma

forma, porque quanto mais monoetiquetadas forem as formas. mais

probabilidades o ExtracTerm tem de melhorar a qualidade da extracgo.

Desta feita. preciso criar regras que permitam levantar as

ambiguidades entre as diferentesclasses gramaticais.

218

Para levar a cabo tal procedimento, tivemos que deliberar sobre que

classes gramaticais devem incidir as regras de desambiguago e em que

momento aplic-las.

Assim, optmos por associar as regras de desambiguago ao processo

da etiquetagem 0 EtiqueLex identifica os contextos lexicais das classes

gramaticais a desambiguar e aplica as regras, de maneira a conceder uma

nica etiqueta a cada forma para um dado contexto.

A partir do momento em que o corpus esteja, parcialmente,

desambiguado, o ExtracTerm tem menos etiquetas a percorrer, uma vez que

as formas monoetiquetadas provocam uma quebra do nmero de

combinatrias possveis, reduzindo ainda o seu tempo de pesquisa.

As regras de desambiguago foram elaboradas a partir de uma primeira

extracgo (cf. Anexo 2) que fizemos sobre corpus no desambiguado (cf.

Anexol). Dessa observago. constatmos que os conjuntos de classes

gramaticais sobre as quais pertinente criar regras so:

particpios passados ps-nominais e adjectivos

artigos, pronomes e preposiges

nomes e adjectivos.

2.1. Preposico, artigo definido feminino singular e pronomes

No dicionrio de formas flexionadas. forma esto associadas quatro

etiquetas metalingusticas:

219

De entre estas classes gramaticais. s nos interessa

distinguir a preposigo, uma vez que esta uma das classes que consta no

dicionrio de regras de reconhecimento.

Neste corpus, a forma tem frequncia 7762, no nos sendo possvel

saber quantas vezes ocorre cada uma das classes gramaticais. A primeira

consequncia contraproducente desta indeterminago desconhecermos a

posigo diferencial que cada uma das classes ocupa no eixo sintagmtico,

sendo difcil a avaliago da sua importncia na constituigo das unidades

terminolgicas multilexmicas. Deste desconhecimentodecorre a dvida sobre

a pertinncia da elaborago de regras de reconhecimento que contemplem a

etiqueta

S depois da aplicago das regras de desambiguago que iremos

decidir se a estrutura assim como as suas combinatrias,

so regras enriquecedoras para a extracgo automtica ou se, pelo, contrrio,

so geradoras de ruido.

Tomemos como exemplo o enunciado seguinte:

[...] combinago automtica

temticos calculados

[Pron:dem:f:s] [Prepl :a] partir de

Neste enunciado ocorrem duas formas. s quais so atribudas mais do

que uma etiqueta e

Embora a distingo entre particpio passado verbal

e particpio passado adjectival seja tratada no ponto 2.2, importa desde j

de ndices

220

referir que a identificago inequvoca da preposigo em determmados

contextos pnmordial para a elaborago das regras de desambiguago entre

outros conjuntos de classes gramaticais.

Com base na regra de reconhecimento {N;m:pl- Adj:m:pl + Adj: nr.pl}, o

ExtracTerm extrai a sequncia uma vez que a

regra no contempla a etiqueta . 0 facto de a classe gramatical que est

direita da forma ser uma forma multietiquetada dificulta a criago de

uma regra de desambiguago para distinguir o do . Deste modo,

julgamos pertinente, a criago de uma regra de desambiguago que permita

distinguir a preposigo das outras classes gramaticais, de maneira a criar

regras para o conjunto de classes gramaticais seguintes.

2.1.1. Regras lingusticas de aprendizagem

As regras lingusticas de aprendizagem so construdas a partir da

anlise do contexto lexical da forma a desambiguar. Sempre que o Extracterm

identifica a classe gramatical a desambiguar, ele pesquisa esquerda e

direita da forma e aplica as regras, optando pela etiqueta adequada ao

contexto em questo.

As regras podem, assim, ser construdas pela positiva. Quando se

realiza a condigo A e a condigo B, obtm-se a situago C :

Em determinados contextos mais produtivo construir regras pela negativa.

Deste modo, quando se realiza a condigo A e a condigo B, no se obtm a

situago C : '

221

Regra 1

Leitura da Regra 1:

Sempre que a forma etiquetada com

e a classe gramatical que se encontra sua direita

acompanhada da etiqueta ,ento o ExtracTerm selecciona a etiqueta

em detrimento das outras.

Exemplo:

Regra 2

Leitura da Regra 2:

Sempre que a forma etiquetada com

e a classe gramatical que se encontra sua direita

acompanhada da etiqueta ,ento o ExtracTerm selecciona a etiqueta

em detrimento das outras.

Exemplo: [...] []

Regra 3

Leitura da Regra 3:

222

Sempre que a forma etiquetada com

e a classe gramatical que se encontra sua esquerda

acompanhada da etiqueta , e a classe gramatical que se encontra sua

direita ento o ExtracTerm selecciona a etiqueta em

detrimento das outras.

Exemplo:

Regra 4

Leitura da Regra 4:

Sempre que a forma etiquetada com

e a classe gramatical que se encontra sua direita

acompanhada da etiqueta . ento o ExtracTerm selecciona a etiqueta

em detrimento das outras.

Exemplo: [...]

Regra 5

Leitura da Regra 5:

223

Sempre que a forma etiquetada com

e a classe gramatical que se encontra sua direita

acompanhada da etiqueta ,ento o ExtracTerm selecciona a

etiqueta em detrimento das outras.

Exemplo:

Com os resultados obtidos com a aplicago destas cinco regras de

aprendizagem, que permitem desambiguar a forma em cinco contexto

diferentes. pensamos poder testar a matriz (cf. ponto 2.5.)

2.2. Adjectivo e particpio passado ps-nominal

0 adjectivo , a par do nome, a classe gramatical que nos interessa

identificar, na medida em que inclui as matrizes que constituem o dicionrio de

tipologias.

A distingo entre adjectivo verbal e particpio passado com valor verbal

impe-se.

0 particpio passado uma forma verbal que participa da natureza do

verbo e do adjectivo, sendo denominado particpio passado verbal no primeiro

caso e particpio passado adjectival, no segundo; ambas as formas do

particpio passado so variveis em nmero e em gnero.

Os particpios passados verbais caracterizam-se por no poder, regra

geral, desempenhar a fungode adjectivos e contriburem para exprimir valores

224

temporais e aspectuais. Podem. por um lado, participar dos tempos compostos.

por outro. podem ocorrer isoladamente. exprimindo deste modo uma acgo

temporal.

Formados a partir de verbos, os particpios passados adjectivais

cumprem a fungo de adjectivos qualificativos. em posigo atributiva ou

predicativa, expnmindo propriedade

De acordo com os objectivos preconizados no nosso estudo, interessa-

nos exclusivamente, observar o comportamento dos particpios passados que

ocorrem em posigo ps-nominal, por terem um comportamento idntico aos

dos adjectivos eptetos.

Relembramos que o EtiqueLex atribui a dupla etiqueta e a

formas como No momento da desambiguago

automtica, a nossa opgo consiste em atribuir a etiqueta aos particpios

passados verbais e a etiqueta aos particpios passados adjectivais, uma

vez que estes ltimos tm uma fungo qualificadora, ao mesmo nvel dos

adjectivos qualificativos.

Para o tratamento automtico das unidades terminolgicas

multilexmicas. a distingo entre particpio passado com valor verbal e

particpio passado com valor adjectival passa pela anlise do contexto lexical

que antecede e sucedeo particpio passado.

Se o particpio passado construdo com um complemento, introduzido

por uma preposigo. considera-se queo particpio passado tem um valor verbal

e, por isso, etiquetado com a etiqueta Caso o particpio passado ps-

225

nominal seja construido sem complemento. ele assume valor adjectival e,

consequentemente. deve ser etiquetado com a etiqueta

Perante a aplicago desta regra de aprendizagem, o EtiqueLex opta.

exclusivamente. por atribuir uma das etiquetas respectiva forma. Desta

maneira, a informago metalingustica acrescentada ao corpus simplificada.

aumentando a preciso e a correcgo da etiquetagem.

As regras de aprendizagem tm como consequncia imediata um

melhoramento da qualidade dos dados obtidos com o ExtracTerm, uma vez

que este se depara com menos etiquetas, aplicando as regras de

reconhecimento sobre formas monoetiquetadas, reduzindo as hipteses de

extracgo erradas ou de duplas extracges. Por no se deter na etiqueta

o ExtracTerm reduz o tempo de pesquisa.

2.2.1. Regras lingusticas de aprendizagem

Para o texto no etiquetado,

A informago obtida sobre o uso do solo, por segmentago e interpretago de

fotografia area, extraordinariamente precisa e exaustiva e a unidade de

anlise, a zona urbana homognea, responde satisfatoriamente abordagem

do crescimento urbano das periferias.

obtm-se a seguinte etiquetagem:

A

obtida sobre

uso

segmentago e

226

informago

o

do solo , por

interpretago de

fotografia area ,extraordinariamente precisa

exaustiva e a

unidade de anlise ,a

zona urbana

homognea , responde satisfatoriamente

abordagem do crescimento urbano

das periferias

Com base na regra de reconhecimento {N::s + Adjfs} o ExtracTerm

extrai a sequncia . .ue no

corresponde a nenhuma realidade lingustica que nos interesse reter.

Aps a aplicago da regra de aprendizagem, o EtiqueLex opta por

marcar a forma com a etiqueta ,uma vez que a sequncia

no contemplada no dicionrio de tipologias, levando o ExtracTerm a ignorar

todas as sequncias que obedecem a esta estrutura tipo.

Com base no que expusemos, crimos as seguintes regras de

aprendtzagem:

Regra 1

->

->

->

->

->

->

227

->

-

->

->

->

->

Leitura da Regra 1:

Sempre que uma forma etiquetada com a dupla etiqueta e

a classe gramatical que se encontra sua esquerda um e a classe

gramatical que se encontra sua direita um ,ento o ExtracTerm

selecciona a etiqueta em detrimento da outra.

Exemplo (1):

][-];

Exemplo (2):

[...]

228

0 asterisco. que acompanha o e o ,o smbolo que nos permite

representar todas as realizages possveis das formas abstractas e

assim como das combmatnas entre elas.

Recorremos ao astensco, em todas as regras, sempre que as

complexidade das actualizages e das combinatnas. assim o exigiram.

Regra 2

-

->

-

-

-

->

->

229

->

->

->

->

->

-*

->

->

^

->

Leitura da Regra 2:

Sempre que uma forma etiquetada com a dupla etiqueta

a classe gramatical que se encontra a sua esquerda um e a esquerda

deste um e a classe gramatical que se encontra sua direita um

e

230

ento o ExtracTerm selecciona a etiqueta em detrimento da

outra.

Exemplo:

Regra 3

->

->

->

->

->

->

->

->

Leitura da Regra 3:

Sempre que uma forma etiquetada com a dupla etiqueta e

a classe gramatical que se encontra sua esquerda um e a classe

gramatical que se encontra sua direita um . ento o ExtracTerm

selecciona a etiqueta em detrimento da outra.

231

Exemplo (V):

Exemplo (2):

Regra 4

}

->

->

->

->

^

->

->

->

232

-}

Leitura da Regra 4:

Sempre que uma forma etiquetada com a dupla etiqueta e

a classe gramatical que se encontra sua esquerda um e esquerda

deste um e a classe gramatical que se encontra sua direita um

ento o ExtracTerm selecciona a etiqueta em detrimento da

outra.

Exemplo:

[]

Regra 5

Leitura da Regra 5:

Sempre que uma forma etiquetada com a dupla etiqueta e

a classe gramatical que se encontra sua esquerda um e a classe

gramatical que se encontra sua direita um ,ento o ExtracTerm

selecciona a etiqueta em detrimento da outra

Exemplo:[...] []

233

Regra 6

Leitura da Regra 6:

Sempre que uma forma etiquetada com a dupla etiqueta

a classe gramatical que se encontra sua direita uma e

desta se encontre um .ento o ExtracTerm selecciona a etiqueta

em detrimento da outra.

Exemplo: [...]

[]

Regra 7

->

Leitura da Regra 7:

Sempre que uma forma etiquetada com a dupla etiqueta

a classe gramatical que se encontra sua esquerda um

ExtracTerm selecciona a etiqueta em detrimento da outra.

Exemplo: [...]

Regra 8

Leitura da Regra 8 :

Sempre que uma forma etiquetada com a dupla etiqueta

a classe gramatical que se encontra esquerda um ento o

ExtracTerm selecciona a etiqueta em detrimento da outra.

234

e

,ento o

Exemplo

Regra 9

Leitura da Regra 9:

Sempre que uma forma etiquetada com a dupla etiqueta e

a classe gramatical que se encontra esquerda um . e a classe

gramatical que se encontra sua direita um . ento o ExtracTerm

selecciona a etiqueta em detrimento da outra.

Exemplo:

Regra 10

Leitura da Regra 10:

Sempre que uma forma etiquetada com a dupla etiqueta e

a classe gramatical que se encontra sua esquerda um ,e a classe

gramatical que se encontra sua direita um ,ento o ExtracTerm

selecciona a etiqueta em detrimento da outra.

Exemplo:

235

2.3. Nome e adjectivo

0 nome e o adjectivo so duas classes gramaticais que mantm

relages muito estreitas entre si, sendo frequente a concentrago numa nica

forma das duas classes de palavras. S a observago do contexto lexical

permite a identificago da classe gramatical do lexema, tendo em conta a sua

fungo sintctica no enunciado. Desde modo. o nome pode desempenhar a

fungo de adjectivo e o adjectivo a fungo de nome.

Vejamos o caso do lexema que, no dicionrio de formas

flexionadas. foi marcado com duas etiquetas e

0 nome um termo que d conta da cincia que tem por

objecto elaborar tais estatsticas, determinar correlages que apresentem os

seus dados e tirar delas as suas consequncias para descrigo e explicago do

que passou e previso e organizago do futuro (Porto Editora, 8a Edigo). 0

adjectivo correspondente, na sua forma feminina, grafado da mesma

maneira, sendo, do ponto de vista morfolgico, um homnimo: . A

pandade das duas formas faz com que s o contexto lexical nos permita

identificar claramente a respectiva classe gramatical, mediante a intervengo

de uma anlise sintctica. No exemplo ,o lexema

desempenha, inequivocamente, a fungo de um adjectivo epteto

relacional, por se encontrar em situago ps-nominal, indicando uma relago

com o referente do nome do qual deriva.

Esta questo no pode, no entanto, ser confundida com as sequncias

cuja estruturas apresentam ordem gramatical . Em

236

o substantivo um substantivo epteto, que tem o estatuto de

adjectivo relacional, at porque, neste contexto. o substantivo pode ser

substitudo pelo adjectivo

Assim. tem uma vanante ortogrfica

e uma vanante grfica . sendo um sinnimo

das trs variantes.

No entanto, para o ExtracTerm esta situago no ambgua, uma vez

que forma corresponde exclusivamente a uma nica etiqueta

apesar de tal forma poder assumir a fungode

Outras formas h que esto lexicograficamente registadas com duas

etiquetas metalingusticas distintas, por corresponderema definiges distintas.

o caso. por exemplo, do lexema . adjectivo que significa que

varia ou pode variar e do substantivo ,termo da Matemtica que se

define como: (mat.) smbolo- geralmente uma letra - com que se designa

qualquerdos elementos de um conjunto, (domnio da varivef) (Porto Editora,

8a Edigo). No seio de cada uma das classes gramaticais, o lexema

polissmico.

Para o funcionamento do ExtracTerm, s construmos regras de

aprendizagem que nos permitem distinguir, em alguns contextos. o adjectivo do

susbstantivo, no nos detendo na distingo das polissemias no seio de cada

classe gramatical.

237

2.3.1. Regras lingusticas de aprendizagem

Tanto o nome como o adjectivo ps-nominal so as duas classes

gramaticais plenas. que constam da tipologia de regras de reconhecimento.

Como tai, importante que elas sejam. tanto quanto possvel. monoetiquetadas

para que o ExtracTerm actue correctamente sobre o maior nmero possivel de

lexemas.

Regra 1

Leiturada Regra 1:

Sempre que uma forma etiquetada com a dupla etiqueta

a classe gramatical que se encontra sua esquerda uma

Extracterm selecciona a etiqueta em detrimento da outra.

Exemplo: [...]

Regra 2

-

Leitura da Regra 2:

Sempre que uma forma etiquetada com a dupla etiqueta

a classe gramatical que se encontra sua esquerda uma

Extracterm selecciona a etiqueta em detrimento da outra.

Exemplo:

e

ento o

e

ento o

238

Regra 3

->

Leitura da Regra 3:

Sempre que uma forma etiquetada com a dupla etiqueta e

a classe gramatical que se encontra sua esquerda uma ,ento o

Extracterm selecciona a etiqueta em detrimento da outra.

Exemplo:

Regra 4

->[

Leitura da Regra 3:

Sempre que uma forma etiquetada com a dupla etiqueta

a classe gramatical que se encontra sua esquerda uma

Extracterm selecciona a etiqueta em detnmento da outra.

Exemplo:

Regra 5

Leitura da Regra 5:

Sempre que uma forma etiquetada com a dupla etiqueta e

a classe gramatical que se encontra sua esquerda um e a classe que

se encontra sua direita um . ento o Extracterm selecciona a etiqueta

em detrimento da outra.

e

,ento o

239

Exemplo:

3. ExtracTerm: utilizago das regras de aprendizagem

A partir das regras de aprendizagem constitumos um dicionrio de regras

de desambiguago, que o ExtracTerm aplica logo aps a primeira

multietiquetagem. De ora em diante, deixamos de nos referir ao EtiqueLex,

para s referirmo-nos ao ExtracTerm, sendo a etiquetagem, assumidamente.

uma fase prvia ao funcionamento do ExtracTerm.

Assim, a ordem de aplicago das regras altera-se:

(i) etiquetagem do corpus: corresponde atribuigo de todas as

etiquetas metalingusticas que uma dada forma pode assumir,

independentemente do contexto em que ocorre;

(ii) aplicago das regras de desambiguago: o ExtracTerm aplica as

regras de desambiguago, cuja finalidade a de anular as

multietiquetas, para poder proceder aplicago das regras seguintes

(cf. anexo 6);

(iii) aplicago das regras de reconhecimento: a aplicago destas regras

consiste na identificago das estruturas pr-definidas que podem

assumir as unidades terminolgicas multilexmicas;

(iv) levantamento das unidades terminolgicas multilexmicas (cf. anexo

7).

240

S acedemos aos resultados que decorrem da aplicago das regras de

desambiguago (ii) e do levantamento das unidades terminolgicas

multlexmicas (iv), ambos apresentados em ficheiros HTML.

As regras de aprendizagem esto registadas no dicionrio de regras de

desambiguago, que estruturmos do modo que se segue:

[Art:def:][Pron:pess:][Pron:dem:][PrepVa]>[N:f:s]@[Art:def:]

[Art:def:][Pron:pess:][Pron:dem:][PrepVa]<[Ger]@[Art:def:]

[Art:def:][Pron:pess:][Pron:dem:][PrepVa]<[Pp]>[Pron:poss:]@[Art:def:]

[Art:def:][Pron:pess:][Pron:dem:][PrepVa]<[N]>[V:inf]@[Art:def:]

[Art:def:][Pron:pess:][Pron:dem:][PrepVa]>[Art:indef:]@[PrepVa]

[Adj:][Pp: <[N:]>[PrepV.a]@[Pp:]

[Adj:][Pp:] <[N:]>[PrepVaps]@[Pp:]

[Adj:][Pp: <[N:]>[PrepVat]@[Pp:]

[Adj:][Pp: <[N:]>[Prep1 :conforme]@[Pp:]

[Adj:][Pp: <[N:]>[Prep1 :consoante]@[Pp:

[Adj:][Pp: <[N:]>[Prep1 :contra]@[Pp:]

[Adj:][Pp: <[N:]>[PrepVdesde]@[Pp:]

[Adj:][Pp: <[N:]>[Prep1 :durante]@[Pp:]

[Adj:][Pp: <[N:]>[PrepVentre]@[Pp:]

[Adj:][Pp: <[N:]>[PrepVexcepto]@[Pp:]

[Adj:](Pp: <[N:]>[PrepVfora]@[Pp:]

[Adj:][Pp: <[N:]>[Prep1 :menos]@[Pp:]

[Adj:][Pp: <[N:]>[PrepVpara]@[Pp:]

[Adj:][Pp: <[N:]>[Prep1 :perante]@[Pp:]

[Adj:][Pp: <[N:]>[PrepVpor]@[Pp:]

241

0 algoritmo correspondente a aplicago das regras de desambiguago

apresenta o seguinte cdigo:

b c c 1 CAr.i: i j u :Coe s : : c c nc i cac ap i i c a v e 1 ; C.-jnc i g u i dac e <_

ni^iauicce , stc : : vectcr<CEr_t :aaa> : : teratci & it)

I

std: : vector<CEr.trada> : : iteratcr it_tmp= it;

std: : vec: or<std: : s: ring> : : iterat c< it_rgrs_esq, it_rgrs_dir;

//' nas mesir.as pcsicces dcs vectcres de etiquetas ca regra

//std: :

>et icueta ! ;

cunp_er.tr ada=

durr.p_st rVector_2_s:rinq ;it_tnp-

or ! i:_rgrs_esc= anbiguicace . r_co.ncicao_esquerda . begin ; ; ;

it_rgrs_esq != anbiguidade .m_cor:dicac_esquerda . end ( : ; ic_rgrs_esq-+ )

{

it_trrx--;

/Vstd: :string durr.p_curr=

dump_strVector_2_strmg ( it_ticp-

>etiqueta ) ;

//std: : string duiTip_esq

dump_strVector_2_string (ambiguidade . m_ccndicao_esquerca ) ;

if ( ! i t_trnp->Ccnter_Etiqueta : ( *it_rgrs_esq) . }

return false;

it_tir.p=

t;

fcr ( it rgrs_dir= amc iguidade .m_condicac_direita . begin ; ) ;

it rgrs cir != i.r.biguicade .m_cor.dicac_direita . end ( ) ; it_rgrs_dir+- )

[~it tmp+- ;

/ /s:.a: : string durr.p_curr=

cump_st rVector_/_ st r ir.g it_tnp

>etiqueta ) ;

//std: : string dump_dir

cum.p strVeccor 2 st ring (ambiguidade .m_cor.dicao_direita ) ;

if ; : i t_tmp->Contem_Etiqueta ( ( *it_rgrs_dir ) ) )

return false;

// Se cneguei aqui pq a cor.dic

direita, vou trocar etiqueta

if : ambcguidade . m sinai_resolucao ;

se aplica esquerda e a

std:

std:

std:

CEntrada

copia entrada;

ofstream out ;

vectcr<std: :string>: riteratcr itEt iquetds ;

veci"or<std: : st ririo : : i i. eratcr iter ;

242

copia_e.it rada= 'it';

out.opcr. ; "AmbiOut . txt"

, std: : ics_base : : app. ;

cut << "Arr.oiguidade:"

<< cop:..a_er.t rada . encracla;

for ;tEticuetas copia_entrada.eticueta.begm

rEtiquetas != copia ent rada . ecicueta .er.d ( .: ; itEtiquetas + + )

out "[";

c-ut << (+itE_iquetas) ;

out << "1 ";

it->et_queta . ciear ( ) ;

for [ ter= ambiguidace . ::_resciucao . beqir. ( ) ; iter

ar.biguicade.m_resolucao.end '. . ; iter++ i

stc: : string trr.c

cocia ertrada.Cevoive Etiqueta_Semeinar.te { (*

iter ; );

it->etiqueta .push _

oack (tmp. ;

out <<"

XrResclucc:"

<< (*

: t ) . entrada;

for ( itEticuetas= (Tit ) . etiqueta .begir. ( ) ;

t) .etiqueta . end ( : ; itEticuetas+- )

{

out "[";

out << (*itEtiquetas) ;

out << "] ";

itEtiquetas !=

re'

out << std: : endl ;

out . ciose ( ) ;

i t r u e ;

stc: :vectcr<std: :string>

CAiribicuidades: : P-esolve_Ambiguidade (std : : vector<CEntrada> : :iterat

orS it)

sta :

stc:

stc:

vector<stc: :strmg> novas_etiquetas ;

vec t c r < CAmb i gu idace> arr.bi gu idades ;

vectcr<C.Ambicuidade>: : iterator it.Anbiguidade;

ambiguicaces= Existe_Am:biguidade ( it->etiqueta );

if ( ambiguidades . size { ) > 0 )

{

for ( itAmbiguitade= ambiguidades . begm ( ) ; itAnioiguidaae

!= arabig_idaces.er.dO; itAmbiguidade+f )

if (concicac_dpiicave: ( ( *itAr.biguidace) , t) )

return it ->et iqueta;

return it- ->etiqueta;

243

A extracgo obtida com a aplicago destas regras permite-nos avaliar a

eficcia da metodologia adoptada.

3.1. Anlise de resultados

Para avaliar com rigor o campo de actuago do extractor, comparamos

um exemplo de corpus etiquetado antes da aplicago de regras de

ambiguidades e o mesmo exemplo depois da aplicaco das regras de

ambiguidades.

Assinalamos a vermelho, as etiquetas metalingusticas sobre as quais as

regras de desambiguago iro actuar:

A [Art:def:f:s] [Pron:pess:3p:f:s] [Pron:dem:3p:f:s] [Prepta] figura [N:f:s] [V:cj] 2

mostra os resultados

obtidos [Pp:m:pl] [Adj:m:pl] para a [Art:def:f:s] [Pron:pess:3p:f:s]

[Pron:dem:3p:f:s] [Prep1:a] zona da rea em

estudo . A [Art:def:f:s] [Pron:pess:3p:f:s] [Pron:dem:3p:f:s]

[Prep1:a] preto [Adj:m:s] esto representadas [Pp f pl] [Adj:f:pl] as

reas homogneas do ponto

de vista [N;f:s] [Pp:f:s] [Adjfs] radiomtrico ,a [Art:def:f:s]

[Pron:pess:3p:f:s] [Pron.dem:3p:f:s] [Prep1:a] branco as

transiges ] radiomtricas fortes

O mesmo texto etiquetado com o ExtracTerm, que agora contempla as

regras de desambiguago, apresenta o seguinte formato de sada:

244

A [Art:def:f:s] figura [N:f:s] 2 mostra os

resultados obtidos [Pp:m:pl] para a [Art:def:f:s]

zona da rea em estudo . A

[Prep1:a] preto [Adj:m:s] esto representadas [Pp:f:pl] as

reas homogneas do ponto de

vista [N:f:s] radiomtrico . a [Prep1:a] branco as

transiges ] radiomtricas fortes

As regras permitiram levantar a ambiguidade de 9 formas, reduzindo

consideravelmente, a margem de erro na extracgo de unidades

terminolgicas.

Para o levantamento das 9 formas. foram aplicadas as seguintes regras

de desambiguago:

[Art:def:][Pron:pess:][Pron:dem:][Prep1:a]>[N:]@[Art:def:]

Ex: a figura; a zona; a cor

[N:][V:cj]<[Art:def:]@[N:]

Ex: a figura

[Pp:][Adj:]<[N:]>[Prep1:para]@[Pp:]

Ex: os resultados obtidos para

[Art:def:][Pron:pess:][Pron:dem:][Prep1 :a]>[Adj:]@[Prep1 :a]

Ex: a preto esto ... ; a branco esto ...

[Pp:][Adj:]@<[V:cj]@[Pp:]

Ex: esto representadas

[N:][Pp:][Adj:]<[Prep1:]@[N:]

Ex: ponto de vista

245

Apesar de os resultados serem encorajadores, consideramos que as

regras de desambiguago carecem de aperfeigoamento. Tal melhoramento s

ser atingido com o estudo mais aprofundado do comportamento de cada uma

das entidades que constituem as classes gramaticais.

As regras que concebemos no abarcam todas as situages de

ambiguidade em que ocorrem cada uma das classes gramaticais que fazem

parte das regras de desambiguago. A titulo de exemplo. a identificago das

diferengas entre e no exaustiva, o que tem por consequncia o

no levantamento de ambiguidades em situages como as que passamos a

apresentar:

seguida [Adj:f:s] da [Prep2:da:f:s] Eroso [N:f:s] por [Prep1:por] B do

[Prep2:do:m:s] conjunto [N:m:s] obtido [Pp:m:s] [Adj:m:s].

ou ainda

seguido [Adj:m:s] da [Prep2:da:f:s] Dilatago [N:f:s] por [Prep1:por] B do

[Prep2:do:m:s] conjunto [N:m:s] obtido [Pp:m:s] [Adj:m:s] e [Conj:e] cuja

[Pron:rel:f:s] notago ...

Apesar de as regras de desambiguago no estarem esgotadas, o

ExtracTerm actua sobre todas as sequncias que contm ambiguidades,

correspondentes s regras identificadas.

A comparago entre os resultados obtidos com ExtracTerm sem

aplicago das regras de ambiguidades:

246

resultados obtidos {N.mpl + Adj:m:pl}

rea em estudo {N:f:s + Prept.em + N m:s}

reas homogneas {N f pl-

Adjfpi}

ponto de vista {N:m:s + Prepl de + N:f:s}

transiges radiomtricas {N:f:pl + Ad;:f:pl}

e os resultados obtidos com o ExtracTerm com as regras de desambiguago:

area em estudo {N:f s + Preptem + N :m:s}

reas homogneas {Nfpl + Adjfpl}

transiges radiomtricas {N fpi + Adj:f:pl}

permitem-nos corroborar a vantagem desta metodologia. De seis propostas

iniciais de unidades terminolgicas multilexmicas, passamos a trs, o que

demonstra ser uma redugo notvel no esforgo de anlise e de validago dos

dados por parte do especialista.

3.2. Teste do ExtracTerm sobre um corpus alargado

Atingindo este ponto, necessrio fazer incidir o ExtracTerm sobre

novos textos. por forma a verificar a sua exequibilidade.

Assim, optmos, por fazer correr o ExtracTerm a partir de uma tese

para obtengo de grau de especialista categoria de Investigador Auxiliar do

Laboratrio Nacional de Engenharia Civil (Fonseca, 1998). Este texto

constitudo por 49834 ocorrncias para 4330 formas.

247

3.2.1. Anlise dos resultados

Este texto ento varrido pelo ExtracTerm. Verificmos que, das 49834

ocorrncias. 3040 no foram etiquetadas, o que corresponde.

aproximadamente, a 937 formas, aps a eliminago de nmeros, alneas,

palavras estrangeiras, erros grficos e ortogrficos, entre outros.

As palavras no etiquetadas correspondem ausncia de registo no

dicionrio de formas flexionadas. Aps verificago de tal facto, adicionmos

uma fungo ao etiquetador. Optmos por extrair para um ficheiro todas as

formas no etiquetadas. Desta forma, podemos atribuir etiquetas

metalingusticas a estas formas e, posteriormente. adicion-las ao dicionrio de

formas flexionadas. Deste modo, o EtiqueLex, numa fase final, ou o

ExtracTerm numa fase inicial. permite a auto-alimentago do dicionrio de

formas flexionadas.

Exemplifiquemos com o corpus teste, a qualidade da etiquetagem:

A aquisigo de imagens por

Detecgo Remota ( DR ) baseia-se no facto

de os objectos

da superfcie terrestre reflectirem

radiago_electromagntica ( REM ) proveniente do

Sol e emitirem eles

prprios REM . A intensidade e

composigo espectral da REM emitida

assim_como a percentagem de

REM reflectida dependem das

caractersticas fsicas e qumicas

do objecto . Assim, possvel

inferir das caractersticas fsicas

e qumicas de objectos

superfcie da Terra atravs da

REM proveniente desses

248

objectos e registada por sensores

a bordo de satlites artificiais

da Terra , designados

satlites de Detecgo Remota

A extracgo obtida a partir deste pargrafo a seguinte:

aquisigo de imagens {N-f.s + Prepl de + N fpl}

Detecgo Remota {N:f s + Adjf s}

objectos da superfcie {N:m:pl + Prep2:da:f s + Nfs}

superficie terrestre {N:f:s + Adj:2gen:s}

composigo espectral {N:f;s + Adj:2gen s}

superfcie da Terra {N::s * Prep2:da:f:s + Nfs}

bordo de satlites {N:m:s + Prepl de + N:m:pl}

satlites artificiais {N:m:pl + Adj:2gen:pl}

satlites de Detecgo {N:m:pl + Prep tde + N:f:s}

satlites de Detecgo Remota {N:m:pl +

Preptde + N:f:s + Adj:f:s}

Detecgo Remota {N:f:s + Adj:f:s}

Com cada corpus novo podemos enriquecer os dicionrios de base, o

que nos garante, partida, a qualidade da etiquetagem, facto que tem

consequncias na qualidade da extracgo. Quanto mais alargado for o nosso

corpus. menores so as hipteses de encontrar formas no etiquetadas e

maiores as hipteses de identificar neologismos terminolgicos.

Com esta amostra, podemos verificar que, na globalidade, a quantidade

de formas no etiquetadas no muito elevada. Tal facto permite-nos concluir,

de forma empirica, que o corpus de partida representativo no que conceme a

terminologia utilizada pelo especialistas em Detecgo Remota.

249

Concluso

Concluso

Na dissertago que ora apresentamos debatemos um conjunto de

pressupostos tericos cuja reformulago se revelou de importncia fundamental

no desenvolvimento da metodologia que esteve na base da concepgo e da

construgo de dois programas informatizados para o tratamento automtico da

lngua de especialidade: um etiquetador, o EtiqueLex. e um extractor, o

ExtracTerm.

Os resultados, que consideramos bastante satisfatrios. obtidos a partir

do funcionamento destes dois produtos, so, em parte, consequncia do

estabelecimento de critrios rigorosos no que diz respeito selecgo dos textos.

Por outro lado, a identificago. do ponto de vista terico, das entidades

lingusticas sobre as quais incidiu o nosso estudo, as unidades terminolgicas

multilexmicas, permitiu-nos isolar as estruturas terminognicas mais frequentes

no nosso corpus.

A partir da observago deste mesmo corpus, elabormos as regras de

reconhecimento que permitiram ao ExtracTerm reconhecer todas as estruturas

previamente contempladas no dicionrio de regras de reconhecimento por ns

concebido.

Tambm as regras de desambiguago foram elaboradas a partir da

observago dos primeiros resultados obtidos com o ExtacTerm.

O ExtracTerm um programa dinmico. Os dicionrios que estona base

do seu funcionamento, isto , o dicionrio de formas flexionadas, o dicionrio de

251

locuges e o dicionno de Detecgo Remota, so dicionnos abertos. aos quais

possvel a qualquer momento adicionar informago, sempre que tal se revele

necessrio.

A funcionalidade que permite ao ExtracTerm extrair todas as formas no

etiquetadas para um ficheiro de uma enorme utilidade, uma vez que possibilita

acrescentar etiquetas metalingusticas a todas as formas presentes nesse

ficheiro e adicion-las posteriormente ao dicionrio de formas flexionadas. Deste

modo, o ExtracTerm proporciona uma actualizago permanente do dicionrio,

garantindo a qualidade da etiquetagem dos textos de uma determinada rea de

especialidade.

No se verifica qualquer impedimento do ExtracTerm ser aplicado a

outras reas de especialidades. No caso de, por exemplo, recorrermos ao

ExtracTerm para a etiquetagem de um corpus em Medicina, empregamos a

mesma metodologia, sabendo a priori que as formas no etiquetadas sero, no

nicio, em nmero superior.

Todos os dicionrios que suportam o ExtracTerm encontram-se

actualmente em ficheiros TXT, sendo a sua capacidade virtualmente infinita,

limitados. exclusivamente, ao espago do disco rgido em que se encontram

instalados.

0 acrscimo de textos ao corpus, bem como o enriquecimento gradual do

dicionrio de formas flexionadas, so mecanismos que permitem uma

actualizago constante da terminologia empregue pelo especialista. Perante tais

252

circunstncias. o ExtracTerm ir encontrar cada vez menos formas no

etiquetadas, sendo a probabilidade de vir a encontrar nenimos considervel.

No podemos, no entanto, descuraruma observago minuciosa e regular

aos corpora, a fim de detectar eventuais inovages smtcticas ao nvei da

estrutura das unidades terminolgicas multilexmicas. Caso tais movages se

verifiquem. acrescentar-se-. no dicionnos de regras de reconhecimento, a

regra que d conta desses processos inovadores, para que o ExtracTerm possa

proceder ao levantamento das unidades que encontram correspondncia nas

novas matrizes terminognicas. Os bons resultados obtidos com a aplicago

desta metodologia, no nos impedem, porm. de apontar algumas lacunas que,

conscientemente, no foram preenchidas, por ultrapassarem claramente o

mbito desta dissertago. Reconhecemos, no obstante, a necessidade de

continuarmos a desenvolver uma reflexo apurada em torno de tais lacunas

como um factor imprescindvel para o futuro aperfeigoamento da metodologia

que ora utilizmos e, consequentemente, para um meihoramento das

potencialidades deste programa.

Neste estudo, pnvilegimos uma aproximago lexical s unidades

terminologicas multilexmicas cuja base um nome, por serem as mais

representativas de qualquer terminologia.No podemos, contudo, ignorar outras

classes gramaticais que, embora menos frequentes,so de extrema importncia

para o tratamento automtica da lngua natural. Estamos, por exemplo, a

referirmo-nos aos verbos que, embora com propriedades distintas, tambm

253

denommam conceitos fundamentais para o entendimento de uma lingua de

especialidade.

Assim, o estudo das unidades termmolgicas multilexmicas no ficou

esgotado. Consideramos de uma grande utilidade o aprofundamento do

comportamento lingustico assumido isoladamente pelas classes gramaticais

mais frequentes: os nomes. os adjectivose as preposiges.

As regras de desambiguago que concebemos foram criadas a partir da

observago que efectumos ao contexto lexical em que ocorrem as unidades

terminolgicas multilexmicas. No fomos exaustivos no levantamento das

ambiguidades para cada classe gramatical atribuda a uma mesma forma: por

exemplo, no identificmos todas as situages lexicais em que um se

confunde com um . 0 levantamento dos contextos lexicais em que ocorrem

as ambiguidades pnmordial para a concepgo de regras de desambiguago

mais rigorosas e abrangentes.

Tambm no fazia parte dos objectivos desta trabalho estabelecer

critnos e elaborar regras que permitissem distinguir o comportamento de um

do comportamento de outro . A equipa de G. Gross visa obter a descrigo

exaustiva de todas as unidades lexicais, procedendo a uma classificago

semntica e sintctica, tendo por base o conceito de classes de objectos. Tal

descrigo lingustica tem por finalidade a construgo de dicionrios electronicos.

De acordo com esta metodologia, considera-se que um nome pertence. por

exemplo, classe dos meios de transporte <mt>. que por sua vez se divide em

meios de transporte em comum <mt-a>. meios de transporte areos <mt-a>,

254

etc Todas as unidades lexicais esto associadas, desta forma, a classes e

subclasses (cf. Blanco, 1999).

Passamos a ilustrar com algumas entradas lexicogrficas, a construgo

de um dicionrio electrnico bilingue, francs- espanhol:

auto huit cylindres/G:nf/T:inc/C:mt-tmi/D:transp.ter/Es: coche de ocho cilindros

auto arodynamique/G:inf/T:inc/C:mt-tmi/D:transp ter/Es:coche aerodinmico

auto de course/G:inf/T:inc/C:mt-tmi/D:trasnp:ter/S:voiture de course/Esxoche de carreras

Embora esta metodologia tenha sido concebida para a construgo de

dicionrios electrnicos monolingues e bilingues, julgamos que esta descrigo

sintctico-semntica pode ser utilizada para descrever as unidades

terminolgicas e elaborar regras de desambiguago. Esta descrigo de tal

forma minuciosa que nos permite distinguir o comportamento lingustico das

unidades de classe de objecto para classe de objecto.

Por outro lado, a nossa metodologia pode funcionar como uma

metodologia complementar da de G. Gross. As unidades lexicais - muitas

delas terminolgicas- descritas pela equipa de G. Gross so retiradas de

dicionrios j existentes. 0 levantamento automtico de unidades a partir de

corpora permite um aumento das unidades a descrever para uma determinada

rea do conhecimento.

No obstante, uma inevitvel da metodologia, consideramos os

resultados obtidos muito encorajadores: a forma de funcionamento do programa

255

est estabelecida. dependendo da qualidade da sua actuago exclusivamente

do melhoramento da descrigo lingustica.

Resta-nos. ainda, fazer uma referncia utilizago diminuta que fizemos

da estatstica. Tal opgo metodolgica, no invalida a futura utilizago de uma

abordagem estatistica mais desenvolvida, no em substituigo da aproximago

lingustica, mas em complementaridade a esta.

Acreditamos que a estatstica pode validar os resultados obtidos atravs

da anlise lingustica, na medida em que permite quantificar a taxa de sucesso

do etiquetador ou de uma determinada regra. Com o recurso estatstica,

podemos saber em percentagem o valor que assume uma determinada classe

gramatical no corpus ou ainda se uma determinada estrutura merece ser melhor

observada com vista criago de regras de desambiguago.

Este tipo de informago permite-nos gerir a investigago em fungo da

repercusso que pode ter o estudo de uma entidade lingustica num

determinado corpus e deste modo estabelecer prioridades de investigago.

Com esta dissertago, pretendemos demonstrar que o tratamento

automtico da lngua natural a consequncia de uma acgo concertada

transdisciplinar, que resulta da fuso do saber lingustico com o saber

informtico. Do saber lingustico resulta a anlise lingustica, do saber

informtico a construgo dos algoritmos que permitem a aplicago das regras

lingusticas.

256

Bibliografia

Bibliografia de referncia

AARTS, Jan (1990), Corpus Linguistics: An Appraisal, Computers in Literary

and Linguistics Research, Proceedings of the International Conferences of the

Association for Literary and Linguistic Computing, Paris-Genve, Hamesse, J.,

Zampolli, A., pp. 13-28.

AARTS, Jan (1996), Grammatical Annotation, ICAME Journal No. 20,

ICAME, The Norwegian Computing Centre for the Humanities, Norway, Bergen

University, pp. 104-107.

AARTS, Jan (1991), lntuition-based and observation-based grammars,

English Corpus Linguistic. Studies in Honour of Jan Svartvik, ed. by Karin

Aijmer & Bengt Altenberg, London and New York. Longman, pp. 44- 62.

ADAM, Jean-Michel (1990), lments de linguistique textuelle. Thorie et

pratique de l'analyse textuelle, Lige, Mardaga, 265 p.

ADAM, Jean-Michel (1997), Les textes: types et prototypes. Rcit, description,

argumentation, explication etdialogue, Paris, Nathan,223 p.

ADAM, Jean-Michel (1999), Linguistique textuelle, des genres de discours aux

textes, Paris, Nathan, 208 p.

AMOSSY, Ruth; PIERROT, Anne Herschberg (1997), Strotypes et clichs.

Langue, discours, socit, Paris, Nathan,128 p.

ASCOMBRE. Jean-Claude (1999), Le jeu de la prdication dans certains

composs nominaux, Langages, n 122, Le groupe nominal: contraintes

distnbutionnelles et hypothses de descriptions, sous la direction d'Anne

Daladier, Paris, Larousse, pp. 52- 69.

258

ASSADI, Houssem: BOURIGAULT, Didier (2000), Analyses syntaxique et

statistique pour la construction d'ontologies partir de textes. Ingnere des

connaissances, volutions rcentes et nouveaux dfis, Ed. Jean Charlet,

Manuel Zacklad, Gilles Kassel, Didier Bourigault, Paris, Eyrolles, pp.243 - 256.

AUGER, Pierre; DROUIN. Patrick; L'HOMME, Mane-Claude (1991),

Automatisation des Procdures de Travail en Terminographie, META, Vol.

36, n 1. Montral, PUM, pp. 121- 127.

BACELAR, Feranda; PEREIRA, Lusa; SARAMAGO, Joo (2000),

Portuguese corpora at CLUL, Proceedings of the Second Intemational

Conference on Language Resources and Evaluation, Vol. III, Athens, Greece,

pp. 1603-1607.

BAHNS, Jens (1996), Kollokationen als lexikographisches Problem. Eine

Analyse allgemeiner und spezieller Lernerwrterbucher des Englischen,

Tbingen, Max Nieymer Verlag, 135 p.

BAKHTINE. Mikhal (1984), Esthtique de la cration verbale, Paris, Gallimard,

400 p.

BAKHTINE, Mikhal (2000) The problem of the speech genres, The

Discourse Reader, Ed. Adam Jaworski and Nikolas Coupland, New York,

Routledge, pp. 121 -132.

BALDINGER, Kurt (1984), Vers une semantique moderne, Paris, Klincksieck,

255 p.

BARNBROOK, Geoff (1996), Language and Computers, A Pratical Introduction

to the Computer Analysis of Language, Edinburgh, Edinburgh University Press,

209 p.

259

BARREIRO, Anabela Marques (1998), Propriedades Sintctico-Semnticas

dos Padicipios Passados em Portugus Europeu, Dissertago de Mestrado em

Lingustica, Universidade Nova de Lisboa, 149 p.

BEACCO. Jean-Claude (1995), propos de la structuration des

communauts discursives: beaux-arts et apprciatif, Les enjeux des discours

spcialiss. Coordination ditoriale, Jean-Claude Beacco. Sophie Moirand,

Paris. Presses de la Sorbonne Nouvelle. pp. 135- 157.

BEACCO, Jean-Claude, MOIRAND. Sophie (1995), Autour des discours de

transmission de connaissances. Langages n 117, Paris, Larousse, pp. 32 -

53.

BECHARA, Evanildo (2001), Moderna Gramtica Portuguesa, Rio de Janeiro,

Ed. Lucerna, 672 p.

BJOINT, Henri (1997), Regards sur la dfinition en terminographie, in

Cahiers de Lexicologie, Vol. LXX 1997 - 1, Pans, Didier Erudition, pp. 19- 26.

BJOINT, Henn (1993), La dfinition en terminographie,Aspects du

vocabulaire, Arnaud, P. et Thoiron (ds), Lyon, PUL, pp. 19- 26.

BJOINT, Henn. THOIRON, Philippe (1997), Modle relationnel, dfinition et

dnomination, Autour de la Dnomination, Boisson, H., Thoiron, Ph. (ds)

Lyon, PUL, p. 187-204.

BENNETT, Paul (1993), Noms composs, termes,dnominations complexes:

problmatiques linguistiques et traitements automatiques, Traitement

Automatique des Langues, 34, 2. Paris, Revuede l'ATALA, pp. 43 - 58.

260

BENSON, Morton: BENSON, Evelyn, ILSON, Robert (1997), The BBI

Dictionary of English Word Combinations. Amsterdam / Philadelphia, John

Benjamins, pp. VII- XXXIX.

BESS, Bruno de (1990), La dfinition terminologique, Actes du Colloque La

Dfinition, Paris, Larousse, pp. 252- 261.

BIBER, Douglas; CONRAD, Susan; REPPEN. Randi (1998), Corpus linguistics:

investigating language structure and use, Cambridge, Cambridge University

Press, 300 p.

BLANCO, Xavier (199), Lexicographie bilingue frangais-espagnol et classes

d'objets, Barcelona, Universitat Autnoma de Barcelona. 87 p.

BONNAFOUS, Simone, TOURNIER, Maurice (1995), Analyse su discours,

lexicomtrie, communication et politique, Langages n 117. Paris, Larousse,

pp.67-81.

BOUILLON, Pierrette (1998), Traitement automatique des langues naturelles,

Paris, Bruxelles, Co-dition AUPELF- UREF, 245 p.

BOURIGAULT, Didier (1993), Analyse syntaxique locale pour le reprage de

termes complexes dans un texte, Traitement Automatique des Langues, 34, 2,

Paris, Revue l'ATALA, pp. 105-118.

BOURIGAULT, Didier (1994), LEXTER un Logiciel d'Extraction de

TERminologie. Application l'extraction des connaissances partir de textes,

Paris, Thse en mathmatiques, informatique applique aux sciences de

l'homme, cole des Hautes tudes en Sciences Sociales

BOURIGAULT, Didier (2001), lntroduction, Recent Advances in

Computational Terminology, Ed. by Didier Bourigault, Christian Jacquemin,

261

Mane-Claude l'Homme, Amsterdam / Philadelphia, John Benjamins, pp. VIII -

XVIII.

BOURIGAULT, Didier; SLOZDIAN, Monique (1999), Pour une terminologie

textuelle, Terminologies Nouvelies, N 19. Bruxelles. Revue codit par

l'Agence de la Francophonie et Communaut frangaise de Belgique. pp. 29-

32.

BOUTET, Josiane; GARDIN. Bernard; LACOSTE, Michle (1995), Discours

en situation detravail, Langages, n117, Paris, Larousse, pp. 12-31.

BRONCKART, Jean-Paul (1994) - Le fonctionnement des discours. Un modle

psychologique et une mthode d'analyse. Lausanne. Delachaux & Niestl. 175 p.

BRONCKART, Jean-Paul (1997), Activit langagire, textes et discours. Pour

un interactionisme socio-discursif. Lausanne, Delachaux & Niestl, 351 p.

BUDIN, Gerhard (1990), Terminological Analysis of LSP Phraseology, in

Journal of the Intemational Institute for Terminology Research- IIITF - Vol. 1,

no 1-2, Wien, Intemational Network for Terminology (TermNet), pp. 64-69.

BUDIN. Gerhard; BHLER, Hildegund (1999), Grunstze und Methoden der

neuen Terminographie, Hoffmann, L.; Kalver-Kmper. H.; Wiegand, H. E.

[eds.]. Fachsprachen. / Languages for Special Purposes. Ein internationales

Handbuch zur Fachsprachenforschung une Terminologiewissenschaft. Berlin /

New York, deGruyter, pp. 2097- 2108.

BUVET, P- A. (1998), Dtermination et classes d'objets, Langages, N 131,

Les classes d'objets, sous la direction de Denis Le Pesant et Michel Mathieu-

Colas, Paris, Larousse, pp. 91- 102.

262

CABR, Teresa (1993). La Terminooga. Teoria, metodologia. aplicaciones,

Barcelona, Editorial Antrtida/Emprries, 529 p.

CADIOT. Pierre (1992). entre deux noms: vers la composition nominale.

Lexique. n 11. Les prpositions. Mthodes d'analyse. Lille, Presses

Unviersitaires de Lille, pp. 193- 240.

CADIOT, Pierre (1997), Les prpositions en frangais, Paris, Armand Coiin, 295 p.

CARAQA, Joo (1997), 0 que a cincia, Lisboa, Difuso Cultural, 111 p.

CARNAP, Rudolf (1997), Signification et ncessit, Paris, Gallimard, 382 p.

CARR, Ren; DGREMONT, J.-F.; GROSS, Maurice et al. (1991), Language

Humain et Machine. Paris, Presses du CNRS. 298 p.

CHARAUDEAU, Patrick (1995), Une analyse smiolinguistique du discours,

Langages n 1 1 7. Paris, Larousse, pp. 96- 1 1 1 .

CHARAUDEAU, Patrick (1997J, Les discours d'information mdiatique. La

construction du miroir social, Paris, Nathan, 286 p.

CHARLET, Jean, ZACKLAD, Manuel, KASSEL, Gilles, Bourigault, Didier (2000)

lngnerie des connaissances: recherches et perspectives... , Ingnerie des

connaissances, volutions rcentes et nouveaux dfis, Ed. Jean Charlet,

Manuel Zacklad, Gilles Kassel, Didier Boungault, Paris, Eyrolles, pp. 1 - 24.

CHOMSKY, Noam (1980), Estruturas Sintcticas, Lisboa, Ed. 70, 126.

CINTRA, Lindely, CUNHA, Celso (1994), Nova Gramtica do Podugus

Contemporneo, Lisboa, Ediges Joo S da Costa, 734 p.

263

CONCEIQO, M. Clio (1996), Terminologie et transmission du savoir:

(re)construction(s) de concepts, Daylang, Smatique des termes et

construction des connaissances, dir. Delavigne V., e Bouveret M.T Rouen,

Universit de Rouen, pp. 33- 42.

CONCEIQO, M. Clio (1997), La mmoire des termes: analyse

conceptuelle. Mmoire des mots, Actes des Vmes Journes Scientifiques du

Rseau LTT de l'AUPELF-UREF, Tunes, AUPELF-UREF, Serviced, pp. 369-

376.

CONCEIQO, M. Clio (2000), Terminologie, connaissance et industrie,

Actas da Conferncia sobre cooperago no domnio da terminologia na Europa,

dir S. Lervad. Paris, Unio Latina, AET, pp. 91- 96.

CONDAMINES, Anne, REBEYROLLE, Josette (2000), Construction d'une

base de connaissances terminologiques partir de textes: exprimentation et

dfinition d'une mthode. Ingnerie des connaissances, volutions rcentes et

nouveaux dfis, Ed. Jean Charlet, Manuel Zacklad, Gilles Kassel, Didier

Bourigault, Paris. Eyrolles, pp. 225- 242.

CORBIN, Danielle (1992), Hypothses sur les frontires de la composition

nominale, Cahiers de Grammaire, n 17, pp. 26- 55.

CORBIN, Danielle; TEMPLE. Martine (1994), Le monde des mots et des sens

construits: catgories smantiques, catgories rfrentielles, Cahiers de

Lexicologie, n 65, Paris, Didier, 5 -28.

CORBIN, Danielle (1997) Locutions, composs, units polylexmatiques:

lexicalisation et mode de construction, La Locution entre langue et usages,

Fontenay Saint-Cloud, ENS ditions, pp. 53- 102.

264

CORMIER, Monique; RIOUX. Louis-Paul (1991), Procds de Formation et

Matrices Termmogniques en Terminologie des Systmes Experts. META,

Vol. 36, n 1 . Montral. PUM. pp.248- 268.

COSTA. M. Rute V. (1990)- "A coeso interna das lexias complexas enquanto

unidades terminolgicas", Actas do Colquio de Lexicologia e Lexicografia,

Lisboa, Centro de Estudos Comparados, Linha de Acgo 2 - INIC, pp. 167 -

122.

COSTA. M. Rute V. (1993). Terminologia da Economia Monetria. Relages

conceptuais e semnticas numa sistemtica terminolgica e lexicogrfica,

Dissertago de Mestrado em Lingustica, Universidade Nova de Lisboa, 191 p.

COSTA. M. Rute V. (1994), Bases de donnes textuelleset automatisation en

terminographie. Terminologie et Phrasologie. Acteurs et amnageurs.Actes

de la Deuxime Universit d'Automne en Terminologie, Paris, La Maison du

Dictionnaire, pp. 83- 92.

COSTA, M. Rute V. (2001)- "0 termo como veculo de especificidades

conceptuais e semnticas", Polifonia, UNIL,N 4, Lisboa. Colibn, pp. 199

- 204.

COSTA, M. Rute V. (2001), 0 conceito, a denominago e a definigo

terminolgica, Terminologias 12, Termip, Lisboa, Colibri (no prelo).

COSTA, M. Rute V. (2001)- "Contribuigo para a delimitago do texto de

especialidade", L'loge de la diffrence: la voix de l'autre, Actas das Vles

Journes scientifiques du Rseau Lexicologie, Terminologie et Traduction,

organizado pela Agence francophone pour l'enseignement suprieur et ia

recherche, l'cole de traducteurs et d'interprtes de Beyrouth (ETIB) de

l'Universit Saint-Joseph, Beyrouth, 11-13 novembre 1999, (no prelo).

265

COSTA, M. Rute V., LINO, M. Teresa, CONCEIQO, M. Clio (1996)- (em

colaboragoj "Terminologia, Informtica e Multimdia', Jornada Panllatina de

Terminologia. Perspectives i camps daplicaci. Barcelona. Institut Universitari

de Lingistica Aplicada, Universitat Pompeu Fabra. pp. 73-81.

COUTINHO, M. Antnia (1999), Texto(s) e competncia lexical, Tese de

Doutoramento em Lingustica, Universidade Nova de Lisboa, 413 p.

COWIE, A. P. (1998), lntroduction, Phraseology, Theory, Analysis, and

Applications, Oxford, Oxford University Press. pp. 1 - 20.

COWIE, A. P. (1998), Phraseological Dictionaries: Some East-West

Comparisons, Phraseology, Theory, Analysis, and Applications, Oxford, Oxfod

University Press, pp. 209- 228.

CUSIN-BERCHE, Fabienne (1999), La noton d'unit lexicale en linguistique

et son usage en lexicologie, Statut de l'unit lexicale, Revue LINX, n 40, sous

la direction de Grard Petit, Nanterre, Univerist Paris X, pp. 11 - 31.

CRISPIM, Maria de Lourdes; XAVIER, Maria Francisca (1999), Constitution

(et utilisation d'un corpus de portugais mdival, Revue frangaise de

linguistique applique, IV-1,Amsterdam, Ed. 'De Werelt', pp. 41

- 45.

CZAP, H. (1989), Le concept de concept, in Terminologie Diachronique,

Actes du Colloque organis Bruxelles les 25 et 26 Mars 1988, Centre de

Terminologie de Bruxelles, Institut Marie Haps, Conseil Intemational de la

Langue Frangaise, pp. 69- 70.

DAHLBERG, I. (1981), Les objets, les notions, les dfinitions et les termes,

Textes choisis de terminologie, I. Fondements thoriques de la terminologie,

dir. V.l. Siforov, Qubec. GIRSTERM, pp. 221- 282.

266

DAILLE, Batrice (1994), Approche mixte pour l'extraction de terminologie:

statistique lexicale et filtres linguistiques. Thse de doctorat en informatique

fondamentale, Universit Paris VII, 228 p.

DAILLE. Batnce (1995), Reprage et extraction de terminologie par une

approche mixte statitsique et linguistique. Traitement Automatique des

langues. 36, 1 - 2, Paris, pp. 101-118.

DAILLE, Beatrice (1996), Study and Implementation of Combined Techniques

for Automatic Extraction of Terminology, The Balancing Act. Combining

Symbolic and Statistical Approaches to Language, ed. by Judith L. Klavans and

Philip Resnik, Cambridge, Massachusetts, London, England, The MIT Press,

pp. 49- 66.

DAILLE, Batrice (1996), Study and Implementation of Combined Techniques

for Automomatic Extraction of Terminology, The Balance Act: Combining

Symbolic ans Statistical Approaches to Language. ed. Judith L.KIavans, Philip

Resnik, London, The MIT Press, pp. 49- 66.

DANISH STANDARDS ASSOCIATION (1991), SGML - ODA. Prsentation des

concepts et comparaisons fonctionnelle, Paris, AFNOR, 87 p.

DANLOS, Laurence (1988), lntroduction: lexique-grammaire des expressions

figes, Langages, n 90, Les expressionsfiges, sous la direction de Laurence

Danlos, Paris. Larousse, pp. 5- 6.

DANLOS, Laurence (1994), Coder les informations monolingues sur les noms

pour viter des rgles bilingues sensnibles du contexte, Le traducteur et

l'ordinateur. Langages. n 116. sous la direction de Jean-Ren Lamiral, Paris,

Larousse, pp. 95-110.

267

DARMSTETER, Arsne (1967), [18/4], Trait de la formation des noms

composs, Pans, Champion, 365 p.

DAVID, Sophie; PLANTE, Pierre (1990), Le la ncessit d'une approche

morpho-syntaxique en analyse de textes, Revue de liaison de la recherche en

informatique cognitive des organisations. Vol 2, n 3, Qubec, ICO, pp. 140 -

165.

DAVID, Sophie; DUMAS, Lucie; MARANDIN, Jean-Marie: PLANTE, Andr;

PLANTE Pierre (1990) , Termino. Version 1.0 -

Rapport de Recherche par le

Groupe R.D.L.C. - Recherche et Dveloppement en Lmguistique

Computationnelle, Centre d'Analyse de Textes par Ordinateur, Universit du

Qubec Montral. 57 p.

DAVID, Sophie (1993), Remarques propos du mode de construction des

units de forme NN. Traitement Automatique des Langues, 34, 2. Paris,

Revue l'ATALA, pp. 59- 74.

DESCLS, Jean-Pierre (1997), Systmes d'exploration contextuelle, Co-

texte et calcul du sens, (dir. Claude Guimier), Caen, Presses Universitaire de

Caen, pp. 215-231.

DROZD, L. (1981), Science terminologique: objet et mthode, Textes choisis

de terminologie, I. Fondements thoriques de la terminologie, dir. V.l. Siforov,

Qubec, GIRSTERM, pp. 1 15 - 132.

DUBOIS, Danile (dir.), Smantique Cognitive. Catgorie, prototypes, typicalit,

Coll. Sciences du Langage, Paris, CNRS dition, pp. 342.

DUBOIS, Danile (1997), Catgories, prototypes et figements. Constructions

d'invanants et systmes symboliques, La Locution entre langue et usages,

Fontenay Saint-Cloud, ENS ditions, pp. 103 - 130.

268

DUCROT. Oswald (1980). Les mots du discours. Les ditions de Minuit. Paris,

241 p.

ECO, Umberto (1993), Leitura do Texto Literrio. Lector in Fabula, Lisboa,

Presenga, 263 p.

EL-BZE Marc, SPRIET, Thierry (1995), lntgration et contraintes

syntaxiques dans un systme d'tiquetage probabiliste, Traitement

Automatique des Langues, 36, 1 - 2. Paris, Revue l'ATALA, pp. 47- 66.

FELBER. Helmut (1987), Manuel de Terminologie, Paris, Unesco / Infoterm,

447 p.

FELBER, Helmut. BUDIN, Gerhard (1989), Terminologie in Theorie und Praxis,

Tbingen, Gunter Narr Verlag, 315 p.

FELBER, Helmut (1994/1995), Terminology Research: Its Relation to the

Theory of Science, in Terminologie et Linguistique de Spcialit. tudes de

vocabulaires et textes spcialiss, ALFA, Volume 7/8, 1994 /1995, Actes de

langue frangaise et de linguistique, Universitas Dalhousiana, Nova Scotia,

Canad, pp. 163- 172.

FNAGY, Ivan (1997), Figement et changement smantiques, La Locution

entre langue et usages, Fontenay Saint-Cloud, ENS ditions, pp. 131- 164.

FOUCAULT, Michel (1969), L'archologie du savoir, Coll. Bibliothque des

Sciences Humaines, Paris, Gallimard, 275 p.

FOUCAULT, Michel (1971), L'ordre du discours, Paris, Gallimard, 82 p.

FRADIN, Bernard (1996), L'ldentification des units lexicales, Smiotiques,

n 11, Savoirs lexicaux et savoirs encyclopdiques, t.1 Lgitimer la description

269

lexicale, n ding par david Piotrowski et Peter Stockinger. Paris. Didier

rudition, pp. 55 -93.

FREY, Claude: LATIN, Danile (1997), Le corpus lexicographique. Mthodes

de constitution et de gestion. Actes des troisimes joumes scientifiques du

rseau thmatique de recherche Etude du frangais en francophonie, Actualit

scientifique. Louvain-la-Neuce, Duculot, AUPELF UREF, Recueils, 424 p.

FUCHS, Catherine; DANLOS, Laurence; Lacheret-DUJOUR, Anne et alii.

(1993), Linguistiques et traitements automatiques des langues, Paris, Hachette,

303 p.

FUCHS, Catherine (1996), Les ambiguits du frangais. Paris, Ophrys 184 p.

GALINSKI, Christian (1990), Terminology and Phraseology, in Journal of the

International Institute for Terminology Research- IIITF - Vol. 1, no 1-2, Wien,

Intemational Network for Terminology (TermNet), pp.70-86.

GAUDIN, Frangois (1996), L'ombre du concept, in La Dnomination, Mta,

Numro spcial, vol. 41, n4, Montral, Presses Universitaire de Montral, pp.

604-621.

GLSER, Rosemarie (1994/95), Relations between Phraseology and

Terminology with Special Reference to English, Terminologie et Linguistique

de Spcialit. tude de vocabulaires et textes spcialiss, Halifax, ALFA, pp

41-60.

GOFFIN, Robert (1989), La terminologie des sciences et des techniques

nuclaires. Un cas de diachronie rcente, Terminologie Diachronique, Actes

du Colloque organis Bruxelles les 25 et 26 Mars 1988, Centre de

Terminologie de Bruxelles, Institut Marie Haps, Conseil Intemational de la

Langue Frangaise, pp. 94- 107.

270

GOUADEC, Daniel (1994), Nature ettraitement des entits phrasologiques,

Terminologie et phrasologie. Acteurs et amnageurs, Paris. Maison du

Dictionnaire, pp.167- 193.

GRECIANO, Gertrud (1993), Vers une modlisation phrasologique: Acquis et

projets d'EUROPHRAS. Terminologies Nouvelles, N 10, Bruxelles, RINT, pp.

16 -22.

GRECIANO. Gertrud (1997), La phrasognse du discours, La Locution

entre langue et usages, Fontenay Saint-Cloud, ENS ditions, pp. 179 - 200.

GREIMAS. Algirdas Julien (1966), Smantique structurale, Paris, PUF, 216 p.

GREIMAS, Algirdas Julien (1976), Smiotiques et Sciences Sociales, Paris,

ditions du Seuil, 262 p.

GREIMAS. Algirdas Julien; COURTS. Joseph (1979), Smiotique.

Dicitionnaire raisonn de la thorie du langage, Tome 1, Paris, Hachette, 443 p.

GREIMAS, Algirdas Julien; COURTS, Joseph (1979), Smiotique.

Dcitionnaire raisonn de la thorie du langage, Tome 2, Paris, Hachette, 270 p.

GREFENSTETTE, Gregory (1996), Evaluation techniques for Automatic

Semantic Extraction: Comparing Syntactic And Window Based Approches,

Corpus Processing for Lexical Acquisition, ed. by Branimir Boguraev and James

Pustejovsky, Cambridge, Massachusetts, London, England, The MIT Press, pp.

205-216.

GROSS, Gaston; CHARAND, Jacques; VIVS. Robert; MATHIEU-COLAS;

Michel; BILLY, Pierre (1986), Typologie des noms composs, Rapport

technique A.T.P. du C.N.R.S., - Nouvelles Recherches sur le Langage. Paris,

Universit de Paris 13.

271

GROSS, Gaston (1988), Degr de figement des noms composs, Langages,

n 90. Les expressions figes, sous la direction de Laurence Danlos, Paris,

Larousse. pp. 57- 72.

GROSS, Gaston (1988), Strcuture des noms composs, Actes du Colloque

Informatique et Langue Naturelle, Nantes. Universit de Nantes, pp. 357- 381.

GROSS, Gaston (1990), Dfinition des noms composs dans un lexique-

grammaire, Dctionnaires electronique du frangais, Langue Frangaise, n 87,

sous la direction de BlandineCourtois, Max Silberstein. Paris, Larousse, pp. 83-90.

GROSS. Gaston (1991), Des noms composs dans un dictionnaire

lectronique, Les industries de la langue, Perspectives des annes 1990,

Tome II, Montral, Office de la Langue Frangaise, Socit des traducteurs du

Qubec, pp. 681 -702.

GROSS, Gaston (1996), Les expressions figes en frangais. Noms composs

etautres locutions. Coll. L' Essentiel Frangais, Paris, Ophrys, 61 p.

GROSS, Gaston (1997), Du bon usage de la notion de locution, La Locution

entre langue et usages, Fontenay Saint-Cloud, ENS ditions, pp. 201 - 223.

GUERRA. Javier Prez (1998), Anlisis computarizado de textos. Una

ntroduccin a TACT, Vigo, Universidade de Vigo, Servicio de Publicacins,

274 p.

HABERT. Benot, JACQUEMIN, Christian (1993), Noms composs, termes,

dnominations complexes: problmatiques linguistiques et traitements

automatiques, Traitement Automatique des langues, 34, 2, Revue de l'ATALA,

Paris, pp. 5 - 42.

272

HABERT. Benot, SALEM, Andr (1995). L'utilisation de catgonsations

multiples pour l'analyse quantitative de donnes textuelles, Traitement

Automatique des Langues. 36, 1 -2, Paris. Revue l'ATALA, pp. 249- 276.

HABERT, Benot; NAZARENKO. Adeline: SALEM. Andr (1997;, Les

linguistqiues de corpus, Paris, Armand Colin, 240 p.

HABERT, Benit; FABRE, Ccile; ISSAC. Fabrice (1998), De l'crit au

numrique, Constituer, normaliser et exploiter ies corpus lectroniques. Paris,

Masson. 320 p.

HALLIDAY. M.A.K.; HASAN. Ruqaiya (1976), Cohesion in English, London and

New York, Longman. 374 p.

HALLIDAY, M.A.K. (1991), Corpus Studies ans probabilistic grammar,

English Corpus Linguistic, Studies in Honour of Jan Svartvik, ed. by Karin

Aijmer & Bengt Altenberg, London and New York, Longman, pp. 30- 43.

HAUSMANN, Franz Josef (1989), Le dictionnaire des collocations,

Wrterbcher, Ein internationales Handbuch fur Lexicographie, Herausgegeben

von Franz Josef Hausmann, Oskar Reichmann, Herbert Ernst Wiegand,

Ladislav Zgusta. Berlin, New York. Walter de Gruyter, pp. 1010 -1019.

HAUSMANN, Franz Josef (1997), Tout est idiomatique dans la langue, La

Locution entre langue et usages, Fontenay Saint-Cbud, ENS ditions, pp.277-290.

HEID, Ulrich (1992), Dcrire les collocations - deux approches

lexicographiques et leur application dans un outil informatis, Actes du

colloque Anniversaire de l'ETI, Genve, Universit de Genve, 24 p.

HEID. Ulnch; FREIBOTT, Gerhard (1991), Collocations dans une base de

donnes terminologique et lexicale, META, Vol. 36, N 1. mars, PUM,pp.77-91.

273

HEID, Ulrich (1992). Notes on the use of lexical functions for the description of

collocations m an NLP lexicon., DRAFT. 12 p.

HEID. Ulrich (2001), Collocations m Sublanguage Texts: Extraction from

Corpora, Handbook of Terminology Management. Application-Oriented

terminology Management. Volume 2, compiled bay Sue Ellen Whright. Gerhard

Budin, John Benjamins publishmg Company. Amesterdam, Philsdelphia, pp.

788 - 808.

HERWIJNEN, Eric van (1994), Practical SGML, Boston / Dordrecht / London,

Kluwer Academic Publishers, 288 p.

HYMES, D. (1980, tradugo). Modles pour l'inteaction du langage et de la vie

sociale, tudes de Linguistique Applique 37, Paris, Didier Erudition, pp. 127-153.

JEANDILLOU, Jean-Frangois (1997). L'Analyse textuelle. Armand Collin, Coll.

Cursus, Paris, 192 p.

JUNG, Ren (1990), Remarques sur la constituion du lexique des noms

composs Dictionnaires electronique du frangais, Langue Frangaise, n 87,

sous la direction de Blandine Courtois, Max Silberstein, Paris, Larousse, pp. 71 -83.

KANDELAKI, T.L. (1981), Les sens des termes et les sytmes de sens en

terminologies scientifiques et techniques, Textes choists de terminologie, I.

Fondements thoriques de ia terminologie, dir. V.l. Siforov, Qubec,

GIRSTERM, pp. 135-184.

KENNEDY, Graeme (1998), An introduction to Corpus Linguistics, Longman,

London and New York, 315 p.

274

KJAER. Anne Lise (1990), Context-Conditioned Word Combinations in Legal

Language, Journal of the International Institute for Terminology Research -

IIITF - Vol. 1, no 1-2, Wien, International Network for Terminology (TermNet),

pp. 21-32.

KJAER. Anne Lise (1990), Phraseology Research - State-Of-The-Art,

Journal of the International Institute for Terminology Research- IIITF - Vol. 1.

no 1-2. Wien, International Network for Terminology (TermNet), pp.3-20.

KLEIBER, Georges (1990), La smantique du Prototype. Catgories et sens

lexical, Paris, PUF, 199 p.

KLEIBER, Georges (1991), Prototype et prototypes: encore une affaire de

famille, Smantique et cognition. Catgories, prototypes, typicalit, sous la

direction de Danile Dubois, Paris, CNRS dition. 130 p.

KOCOUREK, Rostislav (1991), Textes et termes, META, Vol, 36, N 1, mars

1991, PUM, Montral, pp. 71

- 76.

KOCOUREK, Rostislav (1994/95), Les textes spcialiss et la terminologie en

tant qu'objet de l'analyse linguistqiue, Terminologie et Linguistique de

Spcialit. tude de vocabulaires et textes spcialiss. Halifax, ALFA, pp. 9-16.

KOCOUREK, Rostislav; ROUSSEAU, Jean-Louis et collectif (1993),

Terminologie, discours et textes spcialiss, Actes du XV6 Congrs

international des linguistes, Vol. 1, Qubec, Les Presses de l'Universit Laval,

pp. 187-212

KUHN, Thomas S. (1970), La structure des rvolutions scientifiques,

Flammarion. Paris, 284 p.

275

KWON-PAK, Song-Nim (1997), Les Prpositions, rvlateurs de polysmie

nominale, Units lexicales et identit smantique, sous la direction de Pierre

Cadiot, Smiotiques, N 13. Paris. Didier-Erudition, CNRS-INALF, pp. 31 -40.

LAMIZET, Bernard (1992), Les lieux de la communication, Mardaga, Lige, 347 p.

LAPORTE, ric (1988), Reconnaissance des expressions figes lors de

l'analyse automatique, Langages. n 90, Les expressions figes, sous la

direction de Laurence Danlos, Paris, Larousse, pp. 5- 6.

LAPORTE, ric (1997), Les mots. Un demi-sicle de traitements, Traitement

Automatique des Langues, 38, 2, Paris, Revue l'ATALA. pp. 47- 68.

LAPORTE, ric (2001), Resolugo de ambiguidades, Tratamento das

Linguas por Computador Uma introdugo Lingustica Computacional e suas

aplicages, Org. Elisabete Marques Ranchhod, Lisboa, Caminho, pp. 49- 89.

LASZLO, Pierre (1995), A Palavra das Coisas. A Linguagem da Qumica, Coll.

Cincia Aberta, Lisboa, Gradiva, 283.

LE PESANT, Denis (1996), Principes d'organisation des donnes lexicales

dans un dictionnaire lectronique, in Smiotques, n 11, Savoirs lexicaux et

savoirs encyclopdiques, t.1 Lgitimer la description lexicale, n dirig par

David Piotrowski et Peter Stockinger, Paris, Didier rudition, pp. 35- 54

LE PESANT, Denis (1998), lntroduction aux classes dobjets, in Langages, n

131, Les classes d'objets, Paris, Larousse, pp. 6- 33.

LEBART, L; SALEM, A. (1994), Statistique Textuelle. Paris, Dunod. 34 p.

LEACOCK, Claudia: TOWELL, Geoffrey; VOORHEES. Ellen V. (1996),

Towards building Contextual Representations of Word Senses Using

276

Statistical Models, Corpus Processing for Lexical Acquisition, ed. by Branimir

Boguraev and James Pustejovsky. Cambndge, Massachusetts. London,

England, The MIT Press, pp. 97- 112.

LEECH, Geoffrey (1991), The state of the arte, English Corpus Linguistics:

Studies 'm HonourofJan Svartvik, London & New York. Longman, pp. 8 - 29.

LEECH, Geoffrey (1997), lntroducing corpus annaotation, Corpus

Annotation, Linguistics Information from Computer Text Corpora, ed. Roger

Garside. Geoffrey Leech, Tony MacEnery, London&NewYork, Longman,pp.1 -18.

LEECH, Geoffrey (1997), Grammatical tagging, Corpus Annotation,

Linguistics Information from Computer Text Corpora, ed. Roger Garside,

Geoffrey Leech, Tony MacEnery, London & New York, Longman, pp.19- 33.

LEECH, Geoffrey; GARSIDE, R.; BRYANT, M. (1994), CLAWS4: The tagging

of the British National Corpus, Proceedings of the 15th International

Conference on Computational Linguistics (COLING 94). Kyoto, Japan,pp.662-628.

LERAT, Pierre (1983), Smantique descriptive, Paris, Hachette, 126 p.

LERAT, Pierre (1995), Les langues spcialises, Paris, PUF, 201 p.

LERAT, Pierre (1996), La notion de connaissance est-elle un concept

oprationnel en linguistique?, Kleiber, G., Riegel, M. (ds) Les formes du

sens, tudes de linguistique frangaise mdievale et gnrale offertes Robert

Martin l'occasion de ses 60 ans, Louvain-la-Neuve, Edrtions Ducubt pp. 241 -248.

LINO, M. Teresa (1994), Base de donnes textuelles ne terminographiques,

Meta 39 / 4, Montral, PUM, pp. 786- 789

277

LINO, M, Teresa (1994/95). Corpus informatiss et travail en terminographie:

exprience portugasie. Terminoiogie et Linguistique de Spcialit. tude de

vocabuiaires et textes spcialiss, Halifax. ALFA, pp. 421- 425.

LOTTE, D.S. (1981). Prmcipes d'tablissement de la terminologie scientifique

et technique, Textes choisis de terminologie. I. Fondements thoriques de la

terminologie. dir. V.l. Siforov, Qubec, GIRSTERM, pp. 1 - 54.

LYONS, John (1978), Smantique Linguistique, Paris, Larousse, 495 p.

MAINGUENEAU, Dominique (1984), Gense du discours, Mardaga, Coll.

Philosophie et Langage, Lige, 209 p.

MAINGUENEAU, Dominique (1991), L'analyse du discours. Introduction aux

lectures de l'archive, Paris, Hachette, 268 p.

MAINGUENEAU, Dominique (1992), Le 'tour' ethnolinguistique de l'analyse du

discours, Langages 105, Larousse, Paris, pp. 114- 125.

MAINGUENEAU, Dominique (1996), Les termes cls de l'analyse du discours,

Editions su Seuil, Coll. Mmo, Paris, 94 p.

MAINGUENEAU, Dominique (1998), Analyser les textes de communication,

Paris, Dunod, 211 p.

MAINGUENEAU, Dominique, COSSUTTA, Frderic (1995), L'analyse des

discours constituants, Langages n117, Larousse. Paris, pp. 112-125.

MALACA, Jean Malaca (19981), Sintaxe transformacional do adjectivo, Lisboa,

INIC, 561 p.

278

MANUELITO, Helena (1995), A terminologia da franchia. franchise ou

franchising- a problemtica da ambiguidade num vocabulrio no harminizado,

Dissertago de Mestrado, Lisboa, Universidade Nova de Lisboa, 316 p.

MARQUEZ, Eduardo (1998), Classification des adjectifs: tude exploratoire

sur l'organisation smantique-pragmatique des adjectifs. Langages n 132,

Larousse, Paris, pp. 87-107.

MARTIN, veline (1993), Reconnaissance de contextes thmatiques dans un

corpus textuel. lments de lexico-smantique. Paris, Hachette,283 p.

MARTIN, Robert (1983), Pourune logique du sens, Paris. PUF, 268 p.

MARTIN, Robert (1990), La Dfinition Naturelle, in Actes du Colloque La

Dfinition, Paris, Larousse, pp. 86- 95.

MARTIN, Robert (1997), Sur les facteurs du figement lexical, La Locution

entre langue et usages, Fontenay Saint-Cloud, ENS ditions, pp. 291 - 306.

MARTIN, Willy, HEID, Ulrich (2001), Frame-based definitions and the

selection of multiword term candidates in DOT, Actes des quatrimes

rencontres "Terminologie et Intelligence Adificielle, Nancy, Unit de Recherche

et Innovation. INIST - CNRS, pp. 55- 65.

MATEUS, M. Helena; BRITO, Ana Maria, DUARTE, Ins; FARIA, Isabel Hub

(1989), Gramtica da Lngua Portuguesa, Lisboa, Caminho,417 p.

MATHIEU-COLAS, Michel (1994), Les mots traits d'union. Problmes de

Lexicographie informatique, Paris, Hachette, 351 p.

MATHIEU-COLAS. Michel (1996), Typologie des noms composs frangais,

Cahiers de Lexicologie, 69, 1996-2. Paris, Didier Erudition, pp. 71- 125.

279

McENERY. Tony. WILSON. Andrew (1996). Corpus Linguistics. Ed. Tony

McEnery And Andrew Wilson, Manchester, Edinburgh University Press, 207 p.

McENERY, Tony LANG, Jean-Marc. OAKES. Micheal, VRONIS, Jean

(1997), The exploitation of multilingual annotated corpora for term extraction,

Corpus Annotation, Linguistics Information from Computer Text Corpora, ed.

Roger Garside. Geoffrey Leech. Tony MacEnery, London & New York,

Longman, pp. 220- 230.

MEJRI, Salah (1997), Binarisme, dualit et squences figes, Kleiber. G.,

Riegel, M. (ds) Les formes du sens, tudes de linguistique frangaise

mdievale et gnrale offertes Robert Martin l'occasion de ses 60 ans,

Louvain-la-Neuve, Editions Duculot, pp. 249- 256.

MEJRI, Salah (1998), Le figement et la linarit du signe linguistique,

L'information grammaticale, Numro spcial Tunisie, sous la direction de Taeb

Baccouche et Salah Mejri, Paris, Socit pour rinformation grammaticale, pp. 17-21.

MEJRI, Salah (1998), La conceptualisation dans les squences figes,

L'information grammaticale, Numro spcial Tuntse, sous la direction de Taeb

Baccouche et Salah Mejri, Paris. Scot pour l'information grammaticate, pp.41 -48.

MEL'CUK, Igor A. (1993), Cours de Morphologie Gnrale (Thorique et

Descriptive), Vol.1.: Introdution et Premire partie: Le mot, Montral, PUM,

CNRS ditions, 412 p.

MEL'CUK, Igor A. (1994). Cours de Morphologie Gnrale (Thorique et

Descriptive), Vol.2.: Deuxime partie: Significations morhologiques, Montral,

PUM, CNRS ditions, 456.

280

MEL'CUK, Igor A.: CLAS. Andr: POLGURE, Alain (1995), Introduction la

Lexicologie explicative et combinatoire, Coll. Champs Linguistiques, Manuels,

Louvain-la-Neuve, Duculot, 256.

MEL'CUK, Igor A (1996), Lexical Functions: A Tool for the Description of

Lexical Relations in a Lexicon, Lexical Functions in Lexicography and Natural

Language Processing, Ed. by Leo Wanner, Amsterdam / Philadelphia, John

Benjamins. pp. 37- 102.

MEL'CUK, Igor A (1998), Collocations and Lexical Functions, Phraseology,

Theory, Analysis, and Applications, Ed. A. P. Cowie, Oxford, Oxford Univesity

Press, pp. 23- 54.

MENNDEZ, Fernanda Miranda (1997), A Construgo do Diccurso

Setecentista. Dos Processos Discursivos Histria da Lngua, Dissertago de

Doutoramento, Universidade Nova de Lisboa, 482 p.

MERIALDO, Bernard (1995), Modles probalilistes et tiquetage

automatique, Traitement Automatique des Langues, 36. 1- 2, Paris, Revue

l'ATALA, pp.7-22.

MIKKELSEN, Hans Kristian (1990), Two New Bibliographies about Special

Language Research, in Journal of the International Institute for Terminology

Research - IIITF - Vol. 1, no 1-2, Wien, International Network for Terminology

(TermNet), pp. 90-93.

MOIRAND. Sophie (1995), L'valuation dans les discours scientifiques et

professionnels)), Les enjeux di discours spcialiss, coordination ditorale,

Jean-Claude Beacco. Sophie Moirand, Paris, Presses de la Sorbonne Nouvelle,

pp. 81- 94.

281

MOLES, Abraham A. (1995), Les sciences de l'imprcis. Pans, ditions du

Seuil, 360 p.

MORTUREUX. Marie-Frangoise (1995), Les vocabulaires scientifiques et

techniques, Les enjeux du discours spcialiss, coordination ditorale, Jean-

Claude Beacco, Sophie Moirand. Paris. Presses de la Sorbonne Nouvelle. pp. 13-26.

MULLER, Charles (1992), Initiation aux Mthodes de la Statistique

Linguistique, Rimpression de Tdition Hachette de 1973, Paris, Honor

Champion, 185 p.

MULLER, Charles (1992), Principes et Mthodes de Statistique Lexicale,

Rimpression de l'dition Hachette de 1977, Paris, Honor Champion, 206 p.

NORME internationale (2000), Travaux terminologiques- Vocabulaire. Pariie 1:

Thorie et application, Numro de rfrence ISO/FDIS 1087 - 1: 2000 (E/F),

Genve, ISO, 30 p.

NORME internationale (2000). Travaux terminologiques- Vocabulaire, Partie 2:

Applications logicielles, Numro de rfrence ISO/FDIS 1087 - 2: 2000 (E/F),

Genve, ISO, 26 p.

NEDOBITY, Wolfgang (1990) , Simple Phrase Structure Grammars and their

application in Terminology, in Journal of the International Institute for

Terminology Research- IIITF - Vol. 1, no 1-2, Wien, International Network for

Terminology (TermNet), pp. 59-63.

NKWENTI-AZEH, Blaise (1994), Positional and combinational characteristics

of terms: consequences for corpus-based terminography, TERMINOLOGY, vol

1 (1), Amsterdam / Philadelphia, John Benjamins Publishing Company, pp. 61- 95.

282

OESER, Erhard; BUDIN, Gerhard (1999). Grundlagen der

Terminologiewissenschaft, in Hoffmann. L.; Kalver-Kmper. H.; Wiegand, H.

E. [eds.]. Fachsprachen. / Languages for Special Purposes. Ein internationales

Handbuch zur Fachsprachenforschung une Terminologiewissenschaft. Berlin /

New York. deGruyter. pp. 2172 -2183.

PEARSON. Jennifer (1998), Terms in Context, Coll. Studies in Corpus

Linguistics, Amsterdam / Philadelphia, John Benjamins Publishing Campany. 242 p.

PRY-WOODLEY. Marie-Paule (1995), Quels corpus pour quels traitements

automatiques, Traitement Automatique des Langues, 36, 1 -2, Paris, Revue

l'ATALA.pp. 213-232

PETITJEAN, Andr (1989), Les typologies textuelles, Pratiques 62. pp. 86 -125.

PHAL, Andr. (1971), Vocabulaire gnral d'orientation scientifique (V.G.O.S.).

Part du lexique commun dans l'expression scientifique, cole normale

Suprieure de Saint-Cloud, Centre de Recherche er d'tude pour la Diffusion

du Frangais, Paris, CRDIF, 90 p.

PICHT, Herbert (1990), A Study of LSP Phraseological Elements in Spanish

Technical Texts, in Joumal of the International Institute for Terminology

Research - IIITF - Vol. 1, no 1-2. Wien, International Network for Terminology

(TermNet), pp.48-58.

PICHT, Herbert (1990), LSP Phraseology from the Terminological Point of

view, in Journal of the International Institute for Terminology Research- IIITF

- Vol. 1, no 1-2. Wien, lnternationalNetwori<forTerminology (TermNet), pp. 32-48.

PIERREL, Jean-Marie; ROMARY Laurent (1996), Lexique, langue et tche

dans le dialogue homme-machine finalis, in Smiotiques, n 1 1 Savoirs

283

lexicaux et savoirs encyclopdiques, t.1 Lgitimer la description lexicale, n

dirig par david Piotrowski et Peter Stockinger, Paris, Diderrudition,pp.95-117.

PLANTE, Pierre, DAVID. Sophie (1991), Le progiciel Termino: de la ncessit

d'une analyse morphosyntaxique pour le dpouillement terminologique des

textes, Les industries de la langue. Perspectives des annes 1990, Office de

la langue frangaise. Socit des traducteurs du Qubec, Montral, 21-24

novembre 1990, tome I, pp 71 - 88.

PLUNGER, Christine (1990), Synoptic Analysis of the Workshop on

Phraseology, LSP and Terminology, November 24 and 25, 1989, Vienna, in

Journal of the International Institute for Terminology Research- IIITF - Vol. 1

,

no 1-2, Wien, International Network for Terminology (TermNet), pp.87-89.

POTTIER, B. (1967), Prsentation de la linguistique. Fondements d'une thorie,

Paris, ditions Klincksieck, 78 p.

POTTIER, B. (1987), Thorie et analyse en linguistique, Coll. Langue

Linguistique Communication, Pahs, Hachette, 224.

POTTIER, Bernard (1992), Smantique Gnrale, Coll. Linguistique Nouvelle,

Paris, PUF, 237.

QUEMADA, Bernard (1992), Avant-propos, Dictionnairique et Lexicographie.

FRANTEXT: Autour d'une base de donnes textuelles. Tmoignages

d'utilisateurs et voies nouvelles. Vol 2, coll. dirige par Bernard Quemada,

Paris, Didier Erudition, pp. 9- 15.

RABATEL, Alain (1991), La construction textuelle du point de vue, Lausanne,

Delachaux et Niestl, 202 p.

284

RANCHOD, Elisabete Marques (2001), 0 uso de dicionrios e de autmatos

finitos na representago lexical das lnguas naturais, Tratamento das Lnguas

por Computador. Uma introdugo Lingustica Computacional e suas

aplicages. Org. Elisabete Marques Ranchhod, Lisboa, Caminho, pp.13- 47.

RASTIER, Frangois (1987), Smantique interprtative. Paris, PUF, 284 p.

RASTIER, Frangois (1989), Sens et textualit, Paris. Hachette, 286 p.

RASTIER, Frangots(1991), Smantique et recherches cognitives, Paris, PUF,262p.

RASTIER, Frangois (1997), Dfigements smantiques en contexte, La

Locution entre langue et usages, Fontenay Saint-Cbud, ENS ditions, pp. 307- 323.

RASTIER, Frangois (1998), Le problme pistmologique du contexte et le

statut de l'mterprtation dans les sciences du langage, Langages 129.

Larousse, pp. 97- 111.

RASTIER, Frangois; CAVAZZA, Marc; ABEILL, Anne (1994), Smantique

pour l'analyse. De la linguistique l'informatique, Paris, Masson, 240 p.

REBOUL, Anna; MOESCHLER, Jacques (1998), Pragmatique du discours. De

l'interprtation de l'nonc l'interprtation du discours, Paris, Armand Col'in, 220 p.

RENOUF, Antoinette; SINCLAIR, John (1991), Collocational frameworks in

English, English Corpus Linguistic, Studies in Honour of Jan Svartvik, ed. by

Karin Aijmer & Bengt Altenberg, LondonandNewYori<,Longman, pp. 128- 143.

REY, Alain (1976), Thories du signe et du sens, Lectures II, ditions

Klincksieck, Pans, 408 p.

REY, Alain (1979), La terminologie: noms et notions, Paris,PUF 127 p.

285

REY, Alain (1997), Phrasologie et pragmatique, La Locution entre langue et

usages. Fontenay Saint-Cloud. ENS ditions, pp. 333 -346.

REY, Alain (1997), Prface, Dictionnaires des Expressionset Locutions, Le

Robert, Coll. "les usuels", Le Robert, Paris, 888 p.

RICOEUR, Paul (1986), Du texte l'action. Essais d'hermneutique, II, Seuil,

Coll. Esprit/Seuil, Paris, 409 p.

RICOEUR. Paul (1990), Soi-mme comme un autre, ditions du Seuil, Coll.

Points, Srie Essais, Paris, 425 p.

RITCHIE, Graeme D.; RUSSELL, Graham, J.; BLACK, Alan W. et al. (1992),

Computational Morphology. Pratical Mechanisms for the English Lexicon,

London, The MIT Press, 291 p.

ROBERTS, Roda P (1993), La phrasologie: tat des recherches,

Terminologies Nouvelles. N 10, Bruxelles, RINT, pp. 36- 42.

ROBERTS, Roda P. (1994/95), ldentifying the Phraseology of Language for

Special Purposes, Terminologie et Linguistique de Spcialit, tudes des

vocabulaires et textes spcialiss, ALFA, volume 7/8, Halifax, pp, 61-74

ROUSSEAU, Louis-Jean (1993), Terminologie et phrasologie, deux

composantes indissociables des langues de spcialits., Terminotogies

Nouvelles, N 10, Bruxelles, RINT, pp. 9- 1 1.

ROUSSEAU, Louis-Jean (1999), De nouvelles avenues pour la terminologie,

N 19, Bruxelles, Revue codit par l'Agence de la Francophonie et

Communaut frangaise de Belgique, pp. 3- 5.

286

SABAH, Grard (1997), Le sens dans le Traitement Automatique des

Langues, Traitement Automatiquedes Langues, 38, 2. Paris. Revue l'ATALA,

pp. 91 -134.

SAGER, Juan (1990), A Pratical Course m Terminology Processing,

Amsterdam/Philadelphia, John Benjamins Publishing Company, 254 p.

SAGER, Juan (2000), Pour une approche fonctionnellede la terminologie, Le

sens en terminologie, sous la dir. d'Henri Bjoint et Philippe Thoiron, Lyon,

PUL, pp. 40-53.

SANROMN, lvaro Iriarte (2001), A umdade lexicogrfica. Palavras.

Colocages, Frasemas, Pragmatemas, Braga, Centro de Estudos

Humansticos, Colecgo Polierdo 5, Universidade do Minho, 394 p.

SANTOS, Diana (2001), Processamento da linguagem natural: uma

apresentago atravs das aplicages, Tratamento das Linguas por

Computador Uma introdugo Lingustica Computacional e suas aplicages,

Org. Elisabete Marques Ranchhod, Lisboa, Caminho, pp.229 - 260.

SCHAEFFER, Jean-Mane (1986), Du texte au genre, Thorie des genres,

Paris, Seuil, pp. 179-205.

SCHEMANN, Hans (1989), Das phraseologische Wrterbuch Ein

intemationaies Handbuch fur Lexicographie. Herausgegeben von Franz Josef

Hausmann, Oskar Reichmann, Herbert Ernst Wiegand. Ladislav Zgusta, Berlin,

New York, Walter de Gruyter, pp. 1019 -1032.

SCHMITZ, Klaus-Dirk (1999), Computergesttzte Terminographie: Systeme

und Anwendungen. in Hoffmann, L; Kalver-Kmper. H.; Wiegand, H. E. [eds.].

Fachsprachen. / Languages for Special Purposes. Ein intemationales

287

Handbuch zur Fachsprachenforschung une Terminologiewissenschaft. Berlin /

New York, deGruyter, pp. 2164 -2170.

SCHNEFELD, Doris (1999), Corpus Linguistics and Cognitivism,

International Journai of Corpus Linguistics. Vol 4, Amsterdam / Philadelphia,

John Benjamins Publishing, pp. 137- 171.

SEEWALD, Uta (1993), Traitement morphosmantique des noms composs

de structure N - N partir de l'analyse morphosmantique des mots simples,

Traitement Automatique des Langues, 34, 2, Paris, Revue l'ATALA, pp. 75- 88.

SIFOROV, V.l. (1981), Problmes de terminologie scientifique et technique,

Textes choisis de terminologie, I. Fondements thoriques de la terminologie,

dir. V.l. Siforov, Qubec, GIRSTERM, pp. 301- 316.

SILBERSTEIN, Max (1990), Le dictionnaire lectronique des mots

composs, Dictionnaires lectronique du frangais, Langue Frangaise, n 87,

sous la direction de Blandine Courtois, Max Silberstein, Pans, Larousse, pp. 71-83.

SILBERSTEIN, Max (1993), Dictionnaires lectroniques et analyse automatique

des textes.Le systme INTEX, Paris, Masson, 233 p.

SINCLAIR, John (1991), Corpus, concordance, collocation, Oxford University

Press, Oxford, 179 p.

SINCLAIR. John (1996), EAGLES: Preliminary Recommendations on Corpus

Typology (EAG -- TCWG -CTYP/P), Version of May. pp. 25, disponvel em

http://www.ilc.pi.cnr.it.

SINCLAIR, John: BALL, J, (1996), EAGLES: Preliminary Recommendations on

Text Typology (EAG - TCWG - TTYP/P), Version of Jun, pp. 71, disponvel em

http://www.ilc.pi.cnr.it.

288

SOUSA SANTOS, Boaventura de (1987), Um Discurso sobre as Cincias,

Lisboa, Afrontamento, 58 p.

SOUSA SANTOS. Boaventura de (1993), Introdugo a uma Cincia Ps-

Moderna, Lisboa, Afrontamento, 199 p.

SPERBERG, C.M. e BURNARD, Lou (1994), Guidelines for Electromc Text

Encoding and Interchange, TEI P3. Text Encoding Initiative. ACH, ACL, ALLC,

Chicago, Oxord. 1290 p.

STA, Jean-David (1995), Comportement statistiquedes termes et acquisition

terminologique partir de corpus, Traitement Automatiquedes Langues, 36, 1

-2, Paris, Revue l'ATALA, pp. 119-132.

STEIN, Achim, SCHMID, Helmut (1995), tiquetage morphologique de textes

frangais avec un arbre de dcisions, Traitement Automatique des Langues.

36, 1 -2, Paris, Revue l'ATALA, pp. 23- 36.

THOIRON, Philippe, ARNAUD, P., BJOINT,Henri & BOISSON, C.P. (1996),

Notion d' archi-concept et dnomination, La Dnomination, Mta, Numro

spcial, vol. 41. n 4, Montral, PUM, pp. 512-524.

VARELA, Fernando, KUBARTH, Hugo (1994), Diccionario Fraseolgico del

Espahol Moderno, Madrid, Gredos, 296 p.

VRONIS, Jean; KHOURI, Liliane (1995), tiquetage grammatical multilingue:

le projet MULTEXT, Traitement Automatique des Langues, 36, 1 -2, Paris,

Revue l'ATALA, pp. 233-248.

VIVS, Robert (1990), Les composs nominaux par juxtaposition,

Dictionnaires electronique du frangais, Langue Frangaise, n 87, sous la

direction de Blandine Courtois, Max Silberstein, Paris, Larousse, pp. 98- 103..

289

WEHRLI, nc (1997). LAnalyse Syntaxique des Langues Naturelles.

Problmes et Mthodes, Paris, Masson, 249 p.

WSTER, Eugen (1981), L'tude scientifique gnrale de la terminologie,

zone frontalire entre la linguistique, la logique, l'ontologie, l'informatique et les

sciences des choses, Textes choisis de terminologie, I. Fondements

thoriques de la terminologie, dir. V.l. Siforov, Qubec, GIRSTERM, pp. 55- 1 14.

WUSTER, Eugen (1985). Einfuhrung in die allgemeine Terminologielehre und

terminologische Lexicographie, Copenhagen, The Copenhagen School of

Economics, 213 p.

WYNNE, Martin (1994), A Post-Editor's Guide to CLAWS 7 Tagging, disponvel

em http://www.comp.lancs.ac.uk/computing/users/eiamjw/claws7

290

Bibliografia da Detec^o Remota

ATKINSON. Peter M.. TATE, Nicholas J., dir., (1999), Advances in Remote

Senstng and GIS Analysis. Chichester, John Wiley & Sons, 273 p.

BONN, Ferdinand. dir., (1996), Prcis de Tldtection. Applications

Thmatiques, vol.2, Qubec, Presses de l'Universit du Qubec / AUPELF-

UREF,633p.

BONN, Ferdinand, ROCHON, Guy (1992), Prcis de Tldtection. Principeset

Mthodes, vol. 1. Qubec, Pressesclel'UniversitduQubec/ AUPELF-UREF, 485 p.

CAMPBELL, James B. (1996), Introduction to Remote Sensing, 2a ed., London,

Taylor & Francis, 622 p.

CHUVIECO, Emilio (1996), Fundamentos de Teledeteccin Espacial, 3a ed.,

Madrid, RIALP, 568 p.

GIRARD, Michel-Claude, GIRARD, Colette M. (1999), Traitement des Donnes

de Tldtection, Paris, Dunod, 529 p.

DONNAY, Jean-Paul, BARNSLEY, Mike J., LONGLEY, Paul A., dir. (2001),

Remote Sensing and Urban Analysis, London, Taylor & Francis, 268 p.

JHNE, Bernd (1997), Digital Image Processing. Concepts, Algorithms, and

Scientific Applications, 4 ed., Berlin, Springer, 555 p.

JENSEN, J. R. (1996), Introductory Digital Image Processing: A Remote

Sensing Perspective, 2" ed., Englewood Cliffs, Prentice-Hall, 330 p.

LILLESAND, Thomas M., KIEFER, Ralph W. (2000), Remote Sensing and

Image Interpretation. 4a ed., New York, John Wiley & Sons, 724 p.

291

LLIBOUTRY. Louis (1992), Sciences Gomtriques et Tldtection, Paris,

Masson, 289 p.

LUNETTA, Ross S., ELVIDGE, Christopher D., dir., (1999), Remote Sensing

Change Detection. Environmental Monitoring, Methods and Applications,

London, Taylor & Francis, 318 p.

MARION, Andr (1987), Introduction aux Techniques de Traitement dlmages,

Paris, Eyrolles, 278 p.

MATHER, Paul M. (1996), Computer Processing of Remotely-Sensed Images.

An Introduction, Chichester, John Wiley & Sons, 352 p.

PAUL, Serge, DEPECKER, Lo'c, GOILLOT, Charles, LENCO, Michel (1991),

Introduction l'tude de la Tldtection Arospatiale et de son Vocabulaire,

Paris, La Documentation Frangaise, 316 p.

PAUL, S. et al. (1997), Terminologie de Tldtection et Photogrammtrie,

Paris, Conseil International de la Langue Frangaise, 455 p.

PINILLA, Carlos R. (1995), Elementos de Teledeteccin, Madrid, Ra-ma, 313p.

RICHARDS, John A. (1995), Remote Sensing Digital image Analysis. An

Introduction, 2 ed., Berlin, Springer-Verlag, 340 p.

ROBIN, Marc (1995), La Tldtection. Des Satellites aux Systmes

d'lnformation Gographiques, Paris, Natthan, 318 p.

SABINS, Floyd F. (1997), Remote Sensing. Principles and nterpretation, 3a ed.,

New York, W. H. Freeman and Company, 494 p.

292

Corpus

ANDRADE, E. Lmhares de (1992), lnventrio de terreno, contacto com a rea

teste de Benavente (Coruche). Teledetecgo Aplicada s Estatsticas

Agrcolas. Inquritos por reas de Sondagem, Lisboa, Commission of the

European Communities . Joint Research Centre, Ispra-ltaly, 16 p.

BARATA, Teresa (1995), Tratamento Digital de Imagens de Detecgo

Remota in Geostatstica, Detecgo Remota e Sistemas de Informago

Geogrfica Aplicados Gesto do Ambiente e Recursos Naturais, Seminrio

COMMETT, Lisboa, Instituto Superior Tcnico, 27 p.

CAETANO, Mrio, SANTOS, Joo, P. NAVARRO, Ana (1997), Uma

Metodologia Integrada para a Produgo de Cartas de Uso do Solo utilizando

Imagens de Satlite e Informago Geo-Referenciada no Espectral,

Cartografia e Cadastro, Lisboa, Publicago do Instituto Portugus de

Cartografia e Cadastro, pp. 71- 78.

CASACA, Joo (1993), Movimento orbital de satlites artificiais da terra,

Lisboa, LNEC, 21 p.

CASACA, Joo (1994), A observago da terra com imagens numricas

multiespectrais, Ingenium, Revista da Ordem os Engenheiros, Lisboa pp. 13-25.

CATALO, J., REBORDO, J. M. (1989), Utilizago dos modelos digitais do

terreno no contexto das aplicages da detecgo remota, Congresso 89, Pela

Valorizago Profissional do Engenheiro, Cartografa Automtica e Sistemas de

Informago Geogrfica, Coimbra, pp. 1-14.

CORREIA, Maria dos Santos, BESSA, Maria Joo, FERNANDES, Delfim

(s.d.), Contributo da Imagem de Satlite na Cartografia Temtica, CING,

293

Lisboa, Ministno do Planeamento do Territrio, Secretaria de Estado da

Administrago Local e de Ordenamento do Terntrio, 5 p.

DIRECQO de Servigos de Estatsticas Agrcolas (1992), Projecto Piloto

da Teledetecgo s Estatsticas Agrcolas. Inventrios de Terreno. Preparago

do Inventrio de um Segmento, Teledetecgo Aplicada s Estatsticas

Agrcolas. Inquritos por reas de Sondagem, Lisboa, Commission of the

European Communities ,Joint Research Centre, Ispra-ltaly, 20 pp.

DAVEAU. Suzanne (1982), A Utilizago possvel dos registos de satlites em

infravermelho trmico na climatologia regional, // Colquio Ibrico de

Geografia, Lisboa, pp. 253- 263.

FERNANDES, Joo Cordeiro (1994), A Detecgo Remota na avaliago do

uso e ocupago do solo em meio rural, Ingenium, Revista da Ordem os

Engenheiros, Lisboa, pp. 114- 118.

FERNANDES, Joo Manuel Cordeiro (1989), Elaborago duma carta temtica

a partir de imagens de satlite, Congresso 89, Pela Valorizago Profissional

do Engenheiro, Cartografia Automtica e Sistemas de Informago Geogrfica,

Coimbra, 8 p.

FONSECA, Ana Maria (1989), Aquisigo de Informago Geogrfica por

sensores remotos orbitais, seu processamento e expiorago, Trabalho de

sntese apresentado a concurso de acesso categoria de assistente de

investigago do LNEC, Departamento de Barragens, Ncleo de Medidas

Geodsicas, Ministrio das Obras Pblicas, Transportes e Comunicages,

Lisboa, LNEC, 94 p.

FONSECA, Ana Maria (1994), Utilizago de imagens numricas multiespectrais

no controlo da reserva nacional, Lisboa, LNEC, 17 p.

294

FONSECA, Ana Maria (1997), Melhoramento de uma classificago de

ocupago do solo urbano utilizando informago textural, Lisboa, LNEC, 9 p.

FONSECA, Ana Maria (1998), Anlise quantitativa de imagens: utilizago de

imagens numricas multiespectrais no controlo do desenvolvimento urbano,

Lisboa, Lnec, 278 p.

FONESCA, Ana Maria, RIBEIRO, Helena Cnstina, LEAL, Joo (1992),

Contribuigo das imagens orbtidas por sensores remotos orbitais para

actualizago de cartografia escala 1: 50 000, Lisboa, LNEC, 23 p.

HENRIQUES, Rui Gongalves (1982), Tcnicas de Detecgo Remota, Ministrio

da Habitago, Obras Pblicas e Transportes, Lisboa, LNEC, 35 p.

HENRIQUES, Rui Gongalves (1985;.. Aplicago de Tcnicas de Detecgo

Remota a problemas de recursos hdricos, Lisboa, LNEC, 65 p.

HENRIQUES, Rui Gongalves, BESSA. Maria Joo Souto (1992), A

Cartografia Corine Land Cover e o Mtodo de Abordagem da Estratificago e

Amostragem Areolar no mbito dos Inventrios Regionais, Teledetecgo

Aplicada s Estatsticas Agrcolas. Inquritos por reas de Sondagem, Lisboa,

Commission of the European Communities ,Joint Research Centre. Ispra-ltaly, 16 p.

LE GORGEU, J. P. (1992), Sistemas de Observago da Trrea, Satlites

caractersticas das imagens, processos de aquisigo, Teledetecgo Aplicada

s Estatsticas Agricolas. Inquritos por reas de Sondagem, Lisboa,

Commission of tte Euiopean Communities ,Joint Research Centre, Ispra-ltaly, 7 p.

MADUREIRA, Maria Oflia; ALBUQUERQUE, Maira Ragina (1991),

Cartografia biofsica de Portugal com base na interpretago de imagens de

satlite "Landast", Comunicages do Instituto de Investigago Cientfica

295

Tropical. Lisboa. Ministrio do Planemamento e de Administrago do Territno.

Secretaria de Estado da Cincia e Tecnologia. pp. 5-18.

MEYER-ROUX. Jean (1992), lntrodugo geral, Apresentago do Projecto

MARS, Teledeecgo Aplicada s Estatsticas Agricolas. Inquritos por reas

de Sondagem, Lisboa, Commission of the European Communities ,Joint

Research Centre, Ispra-ltaly, 4 p.

MINISTRIO DO EQUIPAMENTO SOCIAL, (1984), Caracertizago

fisiogrfcia, estudo hidrogeolgico das regies do Aientejo e Ordenamento do

Territrio utilizando tcnicas de detecgo remota, Aplicago de Tcnicas de

Detecgo Remota nas regies do Algarve e do Alentejo, Lisboa, LNEC, 23 p.

MOREIRA, M. Eugnia S. A. (1982), Ensaio de Cartografia Automtica da Foz

do Guadiana a partir de registos Landast 1, // Colquio Ibrico de Geografia,

Lisboa, pp. 291- 302.

MOREIRA, M. Eugnia S. A. (1989), Cartografia Temtica do Arrozal nos

cursos inferiores de alguns rios portugueses, Lisboa, LNEC, 43 p.

MOREIRA, M. Eugnia S. A.; COELHO, Valentina: SILVESTRE, Sabino; DIAS,

Cristina; OLIVEIRA Eduardo; GONQALVES, Henriques e alii (1993), Litoral do

Algarve: Interpretago de imagens digitalizadas obtidas por satlites LANDSAT,

Lisboa, LNEC, pp. 53-68.

MOREIRA, M. Eugnia S. A., OLIVEIRA, Eduardo M. (1988), Esturio do

Sado: identificago de unidades fisiogrficas a partir de imagens LANDSAT,

Lisboa. LNEC, 47 p.

MORGADO, Ana Maria (1997), Fotogrametria Digital- Automatizago da

Orientago de Imagens Digitais, Cartografia e Cadastro, Lisboa, Publicago

do Instituto Portugus de Cartografia e Cadastro, pp. 3- 1 1.

296

MUTHMANN. R. (1992), lntegrago da Teledetecgo nos Modelos do

Eurostat, in Teledetecgo Aplicada s Estatstcas Agrcolas. Inquritos por

reas de Sondagem. Lisboa. Commission of the European Communities ,Joint

Research Centre, Ispra-ltaly, 6 p.

NETO, Francelina A. (1997). Projecto de um Sistema Automtico de

Integrago de Imagens e Dados Cartogrficos na Detecgo de Alterages da

Superfcie Terrestre, Cartografia e Cadastro, Lisboa, Publicago do Instituto

Portugus de Cartografia e Cadastro, pp. 63- 70.

OLIVEIRA, Eduardo (s.d.), Tcnicas numricas de processamento de

imagens, Lisboa, LNEC. 17 p.

OLIVEIRA, Tiago, PAL, Jos C, PEREIRA, Jos (1994), Cartografia de

formages arbustivas empregando sistemas de informago geogrfica e detecgo

remota, BIG. Boletim de Informago Geogrfica, Usboa. USIG, pp. 10- 12.

PERDIGO, Antnio (1992), lnventrios de terreno, metodologia, documentos

de terreno, instruges, nomenclatura in Teledetecgo Aplicada s Estatsticas

Agrcolas. inquritos por reas de Sondagem, Lisboa, Commission of the

European Communities ,Joint Research Centre, Ispra-ltaly, 13 p.

PERDIGO. Vanda (1992), Estratificago, Etapa Preparatria da Constituigo

da Amostra, Teledetecgo Aplicada s Estatsticas Agrcolas. Inquritos por

reas de Sondagem, Lisboa, Commission of the European Communities ,Joint

Research Centre, Ispra-ltaly, 8 p.

PINA, Pedro (1995), Contribuigo da Morfologia Matemtica no Tratamento

de Imagens de Detecgo Remota, Geostatstica, Detecgo Remota e

Sistemas de Informago Geogrfica Aplicados Gesto do Ambiente e

Recursos Naturais, Seminrio COMMETT, Lisboa, Instituto Superior Tcnico,

52 p.

297

PORTUGAL. Jorge Marini (1984/1986), Notas para um Curso sobre Cartografia

e Teledetecgo no Ordenamento do Territrio, Lisboa, FCSH / UNL, 82 p.

PORTUGAL Jorge Marini (1992), Introdugo s Tecnologias de levantamento

de Informago Geogrfica Fsica, Lisboa. Edigodo autor,171 p.

RAMALHO. Jos: JAN, Lina; PERDIGO, Maria Vanda; OLIVEIRA, Eduardo;

HENRIQUES, Rui Gongalves (1988), Caracterizago Fisiogrfica da Regio do

Alentejo. Classificago do Uso do Solo na Zona de Estremoz, Borba e Vila

Vigosa, Lisboa, LNEC, 27 p.

RAMALHO, Jos; JAN, Lina; PERDIGO, Maria Vanda; OLIVEIRA, Eduardo;

HENRIQUES, Rui Gongalves (1988), Caracterizago Fisiogrfica da Regio do

Alentejo. Classificago do Uso do Solo na Sub-regio de Mrtola, Lisboa,

LNEC, 13 p.

REBORDO, J.M. (1986), Dificuldades na Interpretago de Dados de

Detecgo Remota em Sistemas de Informago Geogrfica, Simpsio

Ordenamento do Territrio Assistido por Computador, Relatrio Final, Lisboa,

Ministrio do Plano e da Administrago do Territrio, pp. 82- 94.

REBORDO, J.M.(1988), Foto-interpretago assistida por computador de

dados digitalizados: aplicago a contagem de espcies quase-regularmente

distribuda, in Photo-lnterprtation, Paris, ditions Technip, pp. 33- 40.

REBORDO. J.M., HENRIQUES, R. G. (s.d), Recursos Naturais -

Detecgo

Remota, CNIG, Ministrio do Planemamento e de Administrago do Territrio,

Lisboa, Ministrio do Planeamento e da Administrago do Territrio, 15 p.

ROMANA, J.M., REBORDO, J.M., MELO, F. (1989), lmagens SPOT e

ndices temticos aplicados Cartografia da regio do rio Tejo (Portugal),

Photo-lnterprtation, Paris, ditions Technip, pp. 31- 32.

298

ROSA. Manuel (1992), Programa Portugus de Utilizago da Teledetecgo,

Teledetecgo Aplicada s Estatsticas Agricolas. Inquritos por reas de

Sondagem. Commission of the European Communities ,Joint Research

Centre, Ispra-ltaly, 19 p.

SILVA, Erivaldo Antnio de (1997), Extracgo de Feiges Cartogrficas de

Imagens Multiespectrais Fundidas Usando Morfoiogia Matemtica, Cartografia

e Cadastro, Lisboa, Publicago do Instituto Portugus de Cartografia e

Cadastro, pp. 63- 70.

SILVA. Joo Manuel Romana da (1987), lnfluncia da Atmosfera na estrutura

local da imagem satlite. (Calibrago e correcgo atmosfrica de imagens),

Lisboa, Relatrio de Estgio cientfico do curso de Fsica da Faculdade de

Cincias de Lisboa, 132 p.

STAKENBORG, J. (1992), Processamento de Dados para estatsticas

agrcolas, Teledetecgo Aplicada s Estatsticas Agrcolas. Inquritos por

reas de Sondagem. Lisboa, Commission of the European Communities ,Joint

Research Centre, Ispra-ltaly. 6 p.

TENEDRIO, Jos Antnio (1989), Concepgo de uso e de evolugo de uso

do solo por interpretago de fotografia area vertical. Almada: exemplo

metodolgico, Centro de Estudos de Geografia e Planeamento Regional,

Lisboa, FCSH/UNL, INIC, 79 p.

TENEDRIO, Jos Antnio (1995), Teledetecgo em Geografia: extracgo

automtica do contornodamanchaconstruda a partir do processamento digital de

imagens SPOT HRV, Actas do II Congresso da Geografia Portuguesa, Vol. I,

Lisboa, APG, pp. 41 -48.

TENEDRIO, Jos Antnio (1995), Introdugo Teledetecgo. Manual terico,

Lisboa, Geoviso / CEFA, 34 p.

299

TENEDRIO, Jos Antnio (1995), Teledetecgo em reas penurbanas:

combinago de ndices temticos para localizar a mudanga de uso do solo com

recurso s imagens digitais, Actas do VI Colquio Ibrico de Geografia, Vol.

III, Porto. Universidade do Porto, pp. 1241- 1249

TENEDRIO. Jos Antnio (1998). Sobre o ensino da Teledetecgo em

Geografia (e Planeamento Regional) Inforgeo, n 12 / 13, Lisboa, Ediges

Colibri, APG, pp. 627-635.

TENEDRIO, Jos Antnio (2000), Tecnologias de Informago Geogrfica e

Identificago de Corredores Verdes, in MACHADO, Reis (coord.), Corredores

Verdes: Contributo para um Ordenamento Sustentvel Regional e Local,

Lisboa, FFCT/UNL, (noprelo).

300

Anexos

Anexo 1 - Dicionno de formas flexionadas

Anexo 2 - Dicionrio de locuges

Anexo 3 - Dicionrio de unidades terminolgicas da detecgo remota

Anexo 4 - Texto etiquetado com o EtiqueLex, sem a aplicago de regras de

desambiguago

Anexo 5 - Sequncias extraidas com ExtracTerm, a partir de texto etiquetado

no desambiguado

Anexo 6 - Texto etiquetado com o EtiqueTerm, com a aplicago de regras de

desambiguago

Anexo 7 - Sequncias extradas com ExtracTerm. a partir de texto etiquetado

desambiguado

Anexo 8 - Texto etiquetado com ExtracTerm, a partir de novo corpus, com

aplicago de regras de desambiguago

Anexo 9 - Sequncias extradas com ExtracTerm, a partir de texto etiquetado

desambiguado

Anexo 1

Dicionrio de formas flexionadas

a Art :def : ' : s

a Pron : pess : 3p : : s

a Pron:derr. : 3p : f :s

a Prepl : a

Frep2 : : f : s

abaixo Adv

abandonada Ad j : f : s

abar.donada ?p : f : s

abar.donadas ?p:f:pi

abandcnadas Adj : f :pi

abandcnado Adj:m:s

abandonado Fp : m : s

abandonados Ad^:m:pl

aba.ndor.adcs Pp : m : p ~.

abandonar V : inf

abandono N:m:s

abarca V: cj

abarcando Ger

abarcar V:inf

abas N:f:pi

abastecer V:inf

abastecida ?c : f : s

abastecida Adj : f : s

abastecidas Adj:f:plabastecido Pp:m:s

abastecido Adj:rr. :s

abastecidos ?p:m:pi

abastecidcs Adj:m:pl

abcissas N:f:pl

aberrantes Adj :m: s : f : pl

aberta Ad j : f : s

aberta ?p:f:s

abertas Adj:f:pl

abertas Pp:f:plaberto Adj:m:s

aberto Pp:m:s

abertos Adj :m:pl

aberios Pp:m:pl

abertura N: f : s

aberturas N : f : pl

abcrca V:cj

abordada Ad j : f : s

abordada Pp:f:s

abordadas Adj:f:pl

abordadas Pp:f:pl

abordado Adj:m:p".

abordado Pp:m:s

abordados Ad j : m : pl

abordados Pp:m:pl

abordagem N:f:s

abordagens N:f:pl

abordam V:cj

abordar V:inf

abordaremos V:cj

abrange V:cj

abrangem V:cj

abrangendo Ger

abranger.te Adj:2gen:s

abrangentes Adj:2gen:pl

abrancer V : i n T

abrar.ger\T /- "i

abrangerc V : c i

acrar.gida Adi::s

afcrangida ?p:f :s

abrar.gicas Adj :f :pi

aorangidas pp : f : p .1

acrangidc Adj :_n: s

abrar.gicc ?p : m : S

abrar.gicos Adj :m:pl

abrangidos Fp:rr.:pi

abraso

abrem V:cj

abreviacaner.te

abreviatura N : f : s

abriga v:cj

abrigada Ad j : f : s

abrigada Pp:f :pl

abrigadas Adj :f :pl

abrigadas Pp:f:s

abrigado Adj :m: s

abngadc ?p : m : s

abriqadcs Adj :m:pi

abngadcs Pp:rr.:pl

abrigar V:inf

abrigc K : rr. : s

abriqo V : c j

abrii N:rr.:s

abrir V:inf

abriram V:cj

abrupta Adj:f :s

abrupto Adj : m : s

abruptamente

absolutamenze Adv

absolutas Adj:f :pi

absoluto Adi :m: s

absolutos Adj :rn:pl

absorcc N: f :s

absorcces N: f :pl

absorva V :ci

abscrvam V:c-j

abscrve V:c:

absorverr. V:ci

absorvendo Ger

absorvente Adj :m: s : f

absorventes Adj:m:s:f:pl

absorver V : inf

absorverem V:cj

absorvida Adj:f:pl

absorvida Pp: f : s

absorvidade N:f:s

absorvidas Ad j : f : cl

absorvidas

absorvido

absorvido

abscrvidos

abscrvidos

abstraindo

abur.dncia

?p:f:pi

Adj :m: s

Pp : m : s

Adj :m:s :ps

?p:m: s : os

Ger

N: f :s

304

abundante Ad: : 2gen : s

abondanterr.en te Acv

acuncantes kj :2cen:pl

acabada Ad : : f : s

a cat.cu ?p : f : s

acabacas Aoj:f:pl

acabadas Fp: f :pl

acabado Adj : m : s

acabadc ?p :m: s

acabacos Acj :m:pl

acabadcs Pp:m:pl

acabrr.cs V : c j

acabar 7:ir_f

acabara V : c i

acabaram V : c j

acabcu V:cj

accia N : f : s

acadmica Aci : f : s

acadmicas Adj : f :pl

acadr.ico Adj :m: s

acadmicos Adj :~:pl

acarretar V : i n f

acarretaria V:cj

acarretcu V:cj

acasc Acv

acasc N:m:s

acast ar.hada Adj : f : s

acautelaca Ad" : f :s

acauteiada ?p : f : s

acauteladas Adj : f :pi

acauteladas Fp:f :pl

acautelado Adj : m : s

acauteiado ?p:m: s

acautelados Adj :m:pl

acautelados Fo: m: pl

acauteiando Ger

acco N: f :s

accicna V:cj

accionada Ad j : f : s

accior.eda Fp: f :s

accionadas Ad: :f :pl

accicnadas ?p:f :pl

accicnaco Ad j : m : s

accior.adc Fp : rr. : s

accionadcs Ad: :m:pl

accicnacos ?p:m:pl

accior.ar V:inf

acges N:f :pl

acedendo Ger

aceder V : i n f

acedermcs V : c :

aceita V : c :

aceitacao N : f : s

aceitanco Ger

aceitar V:inf

aceitaria V:ci

aceitveis Adj :2gen:p

aceitvel Adj :2gen:s

aceite Adj :2gen:s

aoeite Pp:2gen:s

a c e 1 1 e s Adj :2gen: pl

aceites ?p : 2cen : pl

aceitcu V : ci

aceleracc N : f : s

acelerada Adj : f :pl

acelerada Fr : f : s

aceleradas Ad] : f :pl

aceleradas Fp:f :pl

aceleradc Adj : ~.: s

aceleradc ?p : m : s

aceieradcs Adj :m:s

acelerados Fp:r. :pl

acelerar v':inf

acentc N : rr. : s

acentuada Adj : f : s

acentuada Pp : f : s

acentuadamente

acentuadas Adi : f :pl

acentuacas Pp:f :pl

acentuado Ad j : m : s

acentuado ?p:m: s

acentuados Adj :m:pl

acentuadcs ?p:m:pi

acentuar V : i n f

aconselnvieis Adj : 2cen :

aconselnV'el Adj :2gen:

acepgces N: f :pl

acertada Ad j : f : s

acertada ?p : f : S

acertadas Ad] : f :pi

acertadas ?p:f :pi

acertadc Adj :m: s

acertado Fp:m: s

acertados Adj :m:p_

acertados ?p:m:pl

acertar V:inf

acessibilidade N:f:pl

acessiveis Adj:2gen:pl

acessivel Adj : 2gen: f : s

acessc N:m:s

acetato N:m:s

achatamento N:m:s

acicentada Ad j : f : s

acidentada Fp:f:s

acidentadas Adj:f:pl

acidentadas ?p:f:pl

acidentado Ad]:m:s

acidentado ?p:m:s

acidentados Adj:m:pl

acidentados ?p:m:pi

acidentais Adj:2ger.:pl

acidental Adj:2gen:s

acidentar V: mf

acidentes N:_r.:pl

acima Adv

acinzentados Adj:m:pl

aclarar V:inf

acompanha V:cj

acorr.panhada Ad j : f : s

a :crr.panhad5 Pp : : : s

a : cmpanh ad a s Ac ] : f : p1

acompanhadas Fp : f : pi

a z omp a nh adc Ad i : m : s

a companhadc ?p : m : s

acompanhados Adj:m:pl

acompanhados Pp:m:pl

a ccmpanh ame n t o N : m : s

a ccmpanh a r V : i r. f

aconselha ''J'-C-Z

aconselhada Adj : f : s

aconselhada Fp:f:s

a cor. s e 1 hada s Ad j : f : p i

aconselhadas Pp:f:pl

aconseihado Adj :m: s

aconseihadc Pp:m:s

aconselhados Acj:f:pl

aconselhados Fp:f:pi

aconselhamos V:cj

aconselhar V:inf

aconselhvel Adj:2gen:s

aconteca V : cj

acontece V:cj

acontecendc Ger

acontecer V:inf

acontecer V:cj

aconteceu V:ir.tra: cj

acontecia V:intra:cj

accntecimentcs N:m:ol

acoplada Ad j : f : s

acoplada Pp:f:s

acoplacas Adj:f:pl

acopladas Pp:f:pl

acopiadc Adj:m:s

acopladc ?p:m:s

acopladcs Adj:m:pl

acopiadcs ?p:m:pl

acoplar V:inf

acordada Adj : f : s

acordada Pp:f:s

acorcadas Adj : f :pi

acordadas Pp:f:pl

acordado Ad j : m : s

acordado Pp:m:s

acordadcs ?p:m:pl

acordados Adj:m:placordar V:ir.f

acordo N:m:s

acordos N:m:pl

agores Np

acostagem N : f : s

acp Sigla

acreditamos V:cj

acrecitar V: ir.f

acredite V:cj

acrescentada Adj : f : s

acrescentaca Pp:f:s

acrescentadas Adj:f:pl

Pp::pj

Ac : : m : s

?p : m :

Adj : m. : pl

Po:m:oi

Ad]:f:s

Fp : f : s

Adj:f :pl

?p:f :plAdj : m : s

Fp:m: s

Adj :m:pl

Fp:m:pl

N : m : o 1

V : 1 n f

N : m : s

N:m:ol

acresoentadas

acrescentado

acrescentado

acrescer.tadcs

acrescentados

ac rescentam V

acrescica

aorescida

acrescidas

acrescidas

acrescido

acrescido

acrescicos

acrescidos

acrscimc

acrscimcs

acrescentar

acrnimc

acrnimos

acta N:f:s

actas N: f :pl

activa V:cj

activa Adj:f:s

activago N:f:s

activamente Adv

activar V:inf

activas Adj:f:pl

actividade N:f:s

actividades N:f:pl

activo V:cj

activo Acj:m:s

activos Adj :m: pl

actc N:m:s

actos N:ir.:pl

actua V:cj

actuaco

acfjages

actuais

actuai

actuaiidade

actualidades

actualizaco

actualizaces

actualizada Adj : f : s

actuaiizada ?p:f: s

actualizadas Adj:f:p:

actualizadas Fp:f:pl

actualizado Adj:ra:s

actualizado Pp:m:s

actualizados

actualizados

actualizar V:inf

actualizarem

r_ctuali.ivcis

actual_2ve .

actualmente Adv

actuam V:c]

actuandc Ger

actuar V:inf

N:f s

N:f pl

Acj 2gen:pl

Adj 2gen : s

N : f s

N : f : p

N : f : s

s N : f : C

-1

Adj :m:pl

Pp:m: pl

Acj : ?gen:pl

Acj : 2gen : s

acautelar V:ir_r

acuidace N : f : s

acumulaco N::s

a cumu 1 a coe s N : f : p 1

acumulada Adi : f : s

acumulada Fp : f : s

a c urr.u 1 ada s Ad j : f : p 1

acumuladas Fp:f:pl

a rurriu! adc Adj :m: s

acumuladc Fo:m:s

acumulados Acj:rr.:pl

acumulados Fp:m:pi

acumulando Ger

acumular V:inf

acusando Ger

adapta V:cj

adaptapo N:f:s

adaptaces N:f:pi

adaptada Adj : f : s

adaptada Pp:f:s

adaptado Ad]:m:s

adaptado Adj:m:s

adaptaco Pp:m:s

aaaptado Pp:m:s

acaptados Adj:m:pl

adaptados Pp:m:pl

adaptar V:inf

adaptou V:ci

adeigagamentc N:::s

ade . gacamer.tcs N : f :pl

adenca N:f:s

adendas N:f:pi

adequa V:cj

adequabilidace N:f:s

adequaco N : f : s

adequada Ad j : f : s

adequada ?p : f : s

adequadamente Adv

adequadas Adj : f :pl

adequadas ?p: f :pl

adequado Ad j : f : s

adequado Pp : f : s

adequados Acj:f:pl

acecuados Fp:f:ol

adequar V:in

adeso N:f: s

adiada Adj : f : s

adiada Pp:f:s

adiadas Adj : f :pl

adiadas Pp:f:pl

adiado Adj :m: s

adiado Pp:m:s

adiados Adj:m:pladiados Pp:m:pl

adiantar V:inf

adiante Adv

adipo N:f:s

adiciona V:ci

adicicnada rtG] : t : s

adicionada ?p : f : s

aoicionadas Ad4:f :pi

acicionadas ?p: :pi

adtcionado Adj :m: s

adicicnado F o : m : s

adicicnados Adj :m:pl

adicior.acos ?p:m:pi

adicior.ais Adj : 2gen:pl

acicior.al Adj : 2gen: s

adictor.am v : c ]

adicior.ar V : i n f

adicoes N:f :pl

adimensiona;ls Acj:2gen:p

adimensiona: Ac-' : 2oen : s

aditivicade N : f : s

acitivo N :m: s

aditivos M:m:pl

adjacente Acj : 2gen: s

adjacentes Adj : 2gen:pl

adjudiccu V: c:

administrac:20 N:f:s

administrativa Ac j : f : s

a dmin i s t r a t i vame r. t e A d v

administrat.ivas Adj : f :pi

admir.istrativos Adj:m:pi

admissiveis Adj:2ger.:pl

admissivei Adi:2gen:s

admite V:cj

admiitico V:cj

admitmdc Ger

aamitir V:ir.f

adopgo N:f:s

adoptada Adj : f : s

adoptada ?p:f:s

adoptadas Adj:f:pl

adoptadas Pp:f:pl

adoptado Adj:m:s

adoptadc Pp:m:s

adoptados Adj:m:pi

adoptados ?p:m:pl

adoptamos V:cj

adcptando Ger

adcptar V:inf

adcptou V:cj

adquire V:cj

adquirem V:cj

adquirida Adj : f : s

adquirida Pp:f:s

adquiridas Ac::f:pl

adquiridas Pp:f:pl

adquiridc Adj:m:s

adquirido ?p:m:s

adquiridos Adj :m:pl

adquiridos ?p:.m:pl

adquirindo Ger

adquirir V: inf

adquiriram V:cj

adquiriu V:cj

aduzimos

acversa

adversas

acverso

adversos

V:ci

Adi :: :s

Adj ::pl

Adi :m: s

Ac : : m : p 1

Ar!- f 1

area Adj : f : s

areas

areo Aci :m: s

areos Adj :m:p~

aerodinmica d;

aerodinmicas Ac;

aerodmr.icc Ac;

aerodir.miccs Ad;

aerdromo N:m. :s

aerdrcmos N:m:pl

f :s

f :pl

rr. : s

m:pl

Adj : 2

Adj : f

Acj : f

Adj :m

Adi :m

. '..

P*

aercespacial

aercfotogrf ica

aerofctogrfcas

aerofctogrf icc

aerofotogrf icos

aeromotor N:m:s

aercmotores N:m:pl

aercnave N: m:s

aercr.ives N:m:pl

aeroplano N:m.:s

aeroplanos N:m:pl

aeroporto N:m:s

aeroportos N:m:pl

aerosois N:m:pl

aeroscis N:n:pl

aerosol N:m:s

aerossis N:m:pl

aerotranspcrtaca Adj:m:s

aerc: ranspcrtaca ?p:f:s

aerotranspcrtadas Adj:f:pl

aerotransportadas Pp:f:pl

aerotransportadc Ac::m:s

aerotransportado ?p:m:s

aerotransportados Adj:m:pl

aerotransportacos ?p:m:pl

aerctranspcrtveis Adj : 2gen:pl

aerotrar.spcrtvel Adj :2gen:s

aerotriangulacc N:f:s

afasta V:cj

afastada Ad j : f : s

Pp: f :s

Adj :f :pl

Pp:f :plAd j : m : s

Pp :m : s

Adj :m:pl

Pp : m : p 1

afastada

afastadas

afastadas

afastado

afastadc

afastadcs

afastadcs

afastamento N:m:s

afastamer.tcs ol

afastar

afecta

afecta

afecta

afectaco

V:inf

Adj : f :s

Pp : f : s

V : c :

N:f :s

311

aiectacces

afectada

a ect ada

afectacas

af ectadas

afectadc

afectado

ectac;

afecta<

N:f :?1

Adj : f : s

Fp:f :s

Adj:f :pi

?p:f:pl

Adj :m: s

Fp:m: s

Acj :m:pl

Fp:m:pl

312

Anexo 2

Dicionrio de locuges

aqum. de@Loc

beiraLoc

beira deLcc

certaSLcc

a custc@Loc

a cespeito de@Lcc

a fim ce@Loc

frente caisLoc

frente dasLoc

frente de@Lcc

frente do@Lcc

frente dosGloc

a jusanteQLocmedica de@Loc

rr.edica queSLcc

a par com.l_.Loc

a par de@Loc

parceLoc

a pcntc deLoc

a principio@Loca propsito@Loca propsito deLoc

a respeito ca@Loc

a respeito das@Lcc

a respeito desLoc

a respeito co@Loc

a respeito dcs@Loc

a rigcr@Locrisca@Lcc

rcda da@Loc

roda dasLoc

rcda de@Loc

rcda do@Loc

rcca dos@Loc

a seguir@Lcc

a seguir a@Loc

a titulo deLoc

vista de@Loc

volta ceSLcc

abaixo da@Loc

abaixo das@Loc

abaixo de@Loc

abaixo do@Loc

abaixo dos@Loc

acerca da@Loc

acerca das@Loc

acerca de@Loc

acerca doLoc

acerca dos@Loc

acima da@Loc

acima das@Loc

acima deLoc

acima dc@Lcc

acima dcs@Loc

adiar.te da@Loc

adiante das@Loc

adiar.te de@Loc

adiante do@Loc

adiante dos@Loc

314

afim de@Loc

ainca agoraLoc

ainca assim@Lcc

amca que@Loc

alm da@Lcc

alm das@Loc

alm de@Loc

alm do@Loc

alm dos@Loc

antes da@Lcc

antes das@Loc

antes de@Lcc

antes do@Loc

antes dos@Loc

antes cue@Loc

ao acasoLoc

ao certo@Loc

ao envs@Loc

ao ir.vs de@Loc

ao iado da@Loc

ao lado das@Lcc

ao lado ce@Loc

ao lado do@Loc

ao lado cos@Loc

ao lcngo ca@Loc

ao lcngo das@Loc

ao lcngo de@Loc

ao lcngo do@Loc

ao longo dos@Loc

ao passo que@Lcc

ao passo que@Loc

ao prmcipio@Loc

ac redor da@Loc

ao redor das@Loc

ao redor de@Loc

ao redor do@Loc

30 redor dos@Loc

30 todo@Loc

apesa;r da@Loc

apesar das@Loc

apess;r de@Loc

apesar do@Loc

apesa;r dos@Loc

aps da@Lcc

aps das@Loc

aps de@Loc

aps do@Loc

apcs dos@Loc

aquando de@Lcc

as avessasLoc

s vezes@Loc

assim como@Loc

assim que@Locat @Loc

at ao@Loc

at aos@Loc

at s@Loc

at que@Loc

atrs da@Loc

avs da@Lcc

atrs das@Lcc

atrs de@Lcc

atrs ac@Lcc

atrs dcsLoc

a*"""

atravs das@Loc

atravs de@Loc

atravs do@Loc

atravs cos@Lcc

bem assim@Loc

oaca vez@Loc

cada vez que@Loc

cerca de@Loc

com certeza@Loc

com efeitc@Lcc

com propsito@Loccom recurso a@Loc

com. referncia a@Lcc

com. respeito a@Lcc

ccm respeito a@Lcc

com respeitc @Loc

com respeitc ao@Loc

com respeitc acs@Loc

com respeito s@Lcc

da mesma forma@Loc

dadc que@Locde acordo@Loc

de acordc com@Loc

de antemo@Loc

de assentc@Lcc

de certezaLoc

de cima da@Loc

de cima das@Loc

de cima de@Loc

de cima do@Loc

de cima dos@Loc

de conformidade com@Loc

de facto@Loc

de feito@Loc

de forma a@Lcc

de forma que@Locde frente@Loc

de graca@Locde modo a@Loc

de modo algum@Loc

de modo que@Locde nenhum modcLoc

de propcsito@Locde que@Loc

de resto@Loc

de rigor@Loc

de seguida@Locde sbito@Loc

de tcdc@Loc

debaixo da@Loc

debaixc das@Loc

debaixc de@Loc

debaixo do@Loc

debaixo dcs@Loc

em lugar ca@Lcc

em luaar das@Loc

em lugar de@Loc

em lugar do@Lco

em iuqar dos@Loc

em prol da@Loc

em proi das@Lcc

em prci de@Loc

em prcl do@Lcc

em prci cosLoc

em. razo daLoc

em. razc das@Loc

em razc de@Lcc

em razc do@Lcc

em razo dos@Loc

em redor da@Loc

em redor das@Loc

em redor de@Loc

em redcr doLoc

em redor dos@Loc

em rigorsLoc

em seguica@Lccem seguica a@Lcc

em termos ce@Loc

em torno da@Loc

em torno das@Lcc

em torno de@Lcc

em torno do@Lcc

em tcrno dos@Loc

em troco daLoc

em trocc das@Loc

em troco de@Loc

em trcco do@Loc

em trcco dos@Lcc

em voLcc

em vez daLoc

em vez das@Loc

em vez de@Loc

em vez do@Loc

em vez dos@Lcc

em virtude de@Lcc

enquanto que@Loc

fora da@Loc

fora das@Loc

fora de@Loc

fora do@Loc

fora dosLcc

grapas a@Loc

grapas @Loc

gracas ac@Loc

gragas aos@Lcc

gragas as@Loc

j acora@Loc

j que@Loc

junto a@Loc

junto @Loc

junto ao@Loc

junto aos@Loc

junto s@Loc

318

jur.tc da@Loc

]untc das@Lo _

]unto de@Loc

: unto do@Lcc

unto dos@Lo c

lcgo que@Lo c

mal queSLc c

mesmc assim@Loc

nao obstan te@Loc

nem q-je@Lc c

no entant o@Loc

no tocant e a@Loc

once cuer queLcc

ou [email protected]

para alm da@Loc

para alm das@Loc

para 3m ce@Lcc

oara alm do@Loc

03 ra alm dos@Loc

para baixo da@Loc

para baixc das@Lcc

para baixc de@Lc ::

para baixo do@Loc

para baixo dosLcc

para cima da@Loc

para cima das@Loc

pa r a oim.a de@Lcc

o a r a cima co@Loc

para cima dos@Loc

para com@Loc

para diante@Loc

para j@Loc

pela certaLoc

perto da@Loc

pertc das@Loc

pertc te@Loc

pertc do@Loc

pertc dos@Loc

por acaso@Loc

por alto@Loc

por baixo ca@Lcc

por baixo das@Loc

pcr baixo ceLcc

c c r baixo do@Loc

por baixc dos@Loc

por causa da@Loc

por causa das@Loc

por causa de@Loc

por causa do@Loc

por causa dos@Loc

por ci.ma da@Loc

por cima dasLoc

por cima de@Loc

por cima do@Loc

por cima dos@Loc

por conseguinte@Lcc

por consequncia@Loc

pcr defronte da@Lc

por defronte das@l

lw"._.' _ cei ror: te de@Lcc

pcr de! ron te co@Lcc

pcr def ron te acs@Loc

pcr iei t : : do@Loc

pcr der.trc das@Loc

por dent rc i de@Lcc

por cent rc do@Lcc

oor denr.rc COScLOC

oor cietrs ; oa@Loc

C O I detras das@Loc

pcr det rs de@Loc

r ; r detrs dc@Lcc

por decrs dos@Lcc

por diante da@Lcc

por diante das@Lcc

por diante ; de@Lcc

Pu~ *" diante; CO@Lcc

por diante; dos@Loc

por enquarito@Loc

por entretj'Loc

por forma a@Loc

por isso@Loc

por meio da@Lcc

por meio das@Loc

por meio deLoc

por meio do@Loc

por meio dcs@Loc

por oposicc a@Loc

por oposicc @Loc

por oposico ao@Lcc

por oposico aos@Loc

por oposico s@Lc

por cutro ladoSLcc

por parte da@Loc

por parte das@Loc

por parte de@Loc

pcr parte do@Loc

pcr parte dosLoc

pcr seu turnc@Lcc

FC sua vez@Loc

pc r t rs 0a@Lco

pcr t ras das@Loc

por trs de@Lcc

por trs doLoc

por trs dcs@Loc

por lt imo@Loc

por .::'! lado@Lcc

por vezes@Loc

por v_ a de@Loc

posr o que@Loc

primeirc que@Loc

cua ndc de@Loc

quan tc a@Loc

quan to @Loc

quan ; c ao@Lcc

quan aosLoc

quan to s@Loc

quantc mais@Lcc

que nem@Loc

def ronte da@Loc

def rcnte cas@Loc

de f r cnte ce@Loc

cefrcnte do@Loc

cefrcnte dos@Lcc

dent re de&Lcc

cen t rc daC-Loc

dent ro das@Lcc

cenc ro de@Lcc

dent ro dc@Lcc

dent rc dcs@Loc

dent ro em@Loc

depc. ^ da@Lcc

depc is das@Loc

depcis de@Loc

depo is do@Loc

depc is dos@Loc

desde j@Locdesce logo@Lccdesc e que@Locdetrs de@Loc

dian t e da@Lcc

dian*

p das@Loc

dian t e de@Lcc

diante dcLoc

dian te dos@Loc

em baixo da@Lcc

em baixc das@Loc

em baixc de@Lcc

em baixo do@Lcc

err! baixo dos@Loc

em breve@Loc

em cima da@Loc

em cima das@Lcc

em ciir.a de@Loc

em cima do@Loc

em cima dos@Loc

em comumdiLoc

em conformidade com@Loc

em detrimento da@Loc

err detrimentc dasLoc

em detrimento de@Loc

er: detrimento do@Loc

em detrimento dos@Loc

err. favor da@Lcc

em favor dasLoc

err. favcr de@Loc

PTTi favor dc@Lcc

em favor dos@Loc

em frente a@Loc

em frente @Loc

em f rente aoLcc

em f rente : aos@Loc

em frente sLoc

em frente GLcC

em f rente da s@Loc

em f rente de@Loc

em f rente i do@Loc

em frente i dos@Loc

317

se tm. queisLoc

sem derr.oraiLoc

sem dvida@Loc

sem embargc de@Lo;

sern que@Loc

sempre que@Loc

sempre queLoc

s emp r e qu e 5 Loc

suoostc que@Lcc

tal que@Loc

tanr.o mais que@Loc

tani.c que@Lccuma vez que@Loc

visto que@Loc

321

Ar?exo 3

Dicionrio de unidades termmolgicas da detecco remota

absorco a^mosfr ica@N: i :s

agregaco de objectcsCN: l : s

agreqaco espacial@N: f : s

agua liquida@N : f : s

gua prcf unda@N : f : s

amplitude trmi ca@N: f : s

nculo azimutal@N :m: s

ngulo ce iiuminaco@N:m : s

ngulo de varrimento@N :m: s

ngulo zenital de i luminaco@N: m: s

ngulo zenital@N :m: s

assinatura espect rai @N : f : s

assinaturas espec:rais@N : f : p_

deteccc remota@N:::s

f ilmes ortocron.:iccs@N :m: pi

f ilmes pancromticos@N :m : pl

filtragem de imagens@N :m: s

fiuxc de calor@N:m:s

fctointerpretagc assistida por computador@N: f : s

fcto-interpretaco assistida por computadcr@N : f : s

imagem assitida por computadcr@N: f : s

imager.s assistidas por compitaccr@N : f : pi

imacem de t ;-::' u: =@N : f : s

imagemi de satlite@N: f : s

imagens de satiite@N : f : pl

imagem filme@N:f:s

imagem f iltrada@N: f : s

imagem LANCSAT TM@N : : s

imagem >_SS@N:f:s

imagem multibanda@N: f : s

imagem no ccrrigida@N : f : s

imagem numricc hiperespectral@N : f : s

imagem obliqua@N : f : s

imagem oroital multiespectrai@N : f : s

imagem termal area@N:f:s

imagem termal@N:f:s

imagem textura@N : f : s

imagem-textura@N : f : s

inclinaco orbital@N : f : s

inclinapo solar@N:f:s

indice de ciomassa@N :m: s

indice de brilho@N:m:s

indice de ref racpo@N :m: s

indice de textura@N:m: s

lei de difuso@N: f : s

iei de Kepler@N:f:s

lei de Pianck@N:f:s

iei dos ccrpos negros@N:f:s

lente convergente@N: f : s

ler.te divergente@N: f : s

luminncia hiperf requncia@N: f : s

mtodos de correcco@N : f : s

modeic de ref lectncia@N :m: s

modo imagemN :m : s

or.das electrcmagnticas@N : f :pl

ondas longitudinais@N : f :pi

ondas sonoras@N: f : pl

polarizacao HV@N:f:s

polarizaco vertical@N: f : s

323

pctncia espec: ralgN : : : s

racar altirr.tr: oo@N :m: s

radar iateral@N :m: s

raciacc electrcmaqnt ica@N : f : s

radiacc solar mciderteiN: f : s

ra:c X@N:m:s

ref lectncia aosciuta@N: f : s

reflexo di:usa@N:f:s

reflexo especuiar@N : f : s

resolucc espaciai @N: f : s

resclugc espectral@N: f : s

resolucc transversal@N: f : s

rugcsidace de superf icie@N : f : s

satiite de observacc da terra@N:m:s

satlite de ieledetecco@N :m: s

satlite ceoestacionric@N :m: s

satlite LANDSAT@N:m:s

satiite militar@N:m:s

s a t 1 1 1 e RADARSAT @ N : m : s

satlite SFOT@N:m:s

satlite TIR0S@N:m:s

segmentaco de imagem@N:f:s

segmentaco de imagem@N:f:s

si.nal analgico@N:m:s

sinal digital@N:m: s

sintese de abertura@N: f : s

sistema de Xursell@N :m: s

sistema de varrimento espectrai@N :m: s

sistema de varrimento cpticc@N:m:s

sistema fotogrf ico@N:m: s

S?CT IMAGE@N:f:s

stress vegetal@N :m: s

supcrte fotcgrf ico@N:m: s

taxa de polarizaccC3N: f : s

tcnicas ce com.presso@N : f : s

temperatura de brilho@N : f : s

temperatura radiativa@N : f : s

tratamento de imager.s@N:m: s

variago de radiodifuso@N :m : s

variago de temperatura@N :m: s

variago espectral@N : f : s

variapo temporai@N: f : s

varrimentc espectral@N :m: s

varrimentc multidimensional@N :m: s

va r r i men t c t erripo r a 1 @ N : m : s

viso estereoscpica@N : f : s

zona espectral@N : f : s

zonas espectrais@N : f : pi

324

Anexo 4

Texto etiquetado com o EtiqueLex.

sem a aplicaco de regras de desambiguaco

Teledetecco |M's| em |l'repl:cmi reas |VfiPl| periurbanas|Adj:f:pl| : combinao

J N

"

nl :de ndlees |N:m:pH temticos |Adi:m:pl| para Prcpl :Para| locahzar

v i I \,rdePP 'l ll'ronpes-Mvfs] |Pron:demAp:P_l PrepU] mudanga |Vl.s[de

,, ( Vm' 'lSl do |WU:s, solo ,N:M com UVpVann, -rso

|N:m :s| s |Prep2:a-s:pl| imagens |N:f.Pl| digitais|Adj:2gcn:pl] Spot |S,_ia|

HR\

M l'vrdcfi Ppl| manifestaces [VfipH territoriais |Adj:2gcn:pl] do |Prep2:do;,r,:s[ac c mento |Vn,:s| das |Prep2:das:r:Pl| periferias |Vfipl] urbanas | Au, : :pl | tem

VI sido l'pl abundantemente |Adv| tratadas |Pp<: plj |Adj..:p.|nas

^f^oticas I Adifpll |\:l:pl| econmica | Adj:l:s| e |l onj:e| fmanceira |.\dj Ps|

. social

S e unro poltica [N:f:s] . demogrfica | Ad.i:>:s] e | Conjx hab, acion i

'ucn . fimdi-ia |Adj::s] e |Con,:e| funcional [A<jj2gensj . As |An:<k : t:p J

cn icas |N fpH e |Coni:c| os (Art:def:m:pl| |Pron:poss| [Promdemmetodos Vm.pl |

Ta Prepl :pmal loca.izar'

| V:,nf| ,descrever [V:inf| e [Conj.e] anahsar [V:,nf|

esse

l'ron-dem m:m:s| crescimento [N:m:s] baseiam-se . sobretudo [Adv| na

S estatisnca | Adj:f:s] [N:f:sJ descritiva [Ad.pfis] e [Conj* na [Prep2:na:fisJ

nis'elVf: ] de |Prerl:de| dados |PP:m:pl| |N:nnpl|( anlise \:f:s| ind.v.dual

S"en:sl de |PrePl:de] variveis [Ad.i:2gen:pl[ |\:fpl| ,analise V :s| de

[Prepfide] variveis |Adj:2gen:pl] | Vfipl] duas [Numxard] a [A:dcl:l:sj

Lrpes :3p:f: s| |Pron:dem:3p:f sj [Prepl :a|

duas |M.m:card anal.se VI. | em

Prepl cm| componentes |\:f:pl[ principais |Ad.j:2gen:pl|. anal.se ]VPS] factonal

Ad l.en' | de |Prepl:de| correspondncias |\:f:rl|,class.ficacao |VI:s| ascendente

Adj-emsl hierrquica |Adj:fi s] ,etc . ) . A |An:def fs| [Pron:pcss:,p:.sl

Pronxlcmopd-.IH'repPalinformaolNd-sl V;ciltratada Pp:1:s| Ad.,:l.s|

diacronicamente |Adv| para |P,epl:para]deduz.r [Vmnfl a|Arl^,:

-,

|Pron:pess:3P:f:s[ |Pron:dem:3P:f:s| |Prepl:a| part.r| V:,nt| de l'rep de escalas

Vf-P 1 muito [Ad. | [Pronnndefnnsl variadas |Adj:l:pl] ,as |Art:del:1:pl]

IransfoUJ iNd'pll que [Advj [Promre,] vo [V:e.il ocorrendo I;e,

em [PreplxmJ

unidades |N:1:pl| territoriais |Ad.,:2gen:pl|defimdas |Adj:l:pl| I p.l.pU

administrativamente | Adv] ( freguesia | N:f:s| .eoncelho [N:m:s[ . commune .

dpartement . ln | N : | ,etc ) .

AIAmdeffis] |Pron:Pess:.T:fs) [Pron:dem:3p:l:s][Prep :a| abordagem [V .s)

estatstica I Adj-fisl | Vfis| do |Prep2:do:m:s|fenmeno [N:m:sJ e [V :ej| del.cada

Em [Prepl :em| primeiro |Ad,:,n:s| | Ad . | |Num:ordl lugar |Vm:sl porque

Vfisl da PrepVk,:fis| unidade [N:fis| administrat.va |Adj:l:s)como [Adv [Conjj

unidade |Vfis| mnima |Adj:,:s|de |Prepl de| referencia9o [N:fis| espac.a

I Ad, 2 JmsJ e conde | V:ei| a [ArtdefifisJ |PrompcAp::s [Pron.dem:3p:,.s|

,P, PPa| dilersidade |N:,",| de [Prepl :dc) s,tua9es [ Nl:pl no Prep2:no:m.s ] seu

P onno sqnm:>| interior [Adj:2gen:s, [N:m:s.|. Em [Prepfiemj segundo |.\d |

vIT||Numordl lugar |N:,n:s| . porque | Adv| |Conj| difclmente Adv| se Con,|

Pronpossl obtm |V:ei| um |,\ri:?ief| conjunto |N:m:s| completo | Ad,:m:s| de

Pd]variveis|Ad:2gen:pl]|N:r:pl|(demogrficas[A'

de Prep :de) uso [N:m:s| |V:cj] e [Conj:e| ocupao[VfisJ fis.ca |Adj:l:s [Nd.s do

j lic 2:do:,n:s territno [K:n,:s| ) que )Adv ) [Pron:rcl| responda | :,,] em P r p emj

m dtneo [Adj:,n:s| | Prer2:a:fis) defmico |N:f:s| de [PrepPdej coroas [Nd.pl) ,

^ores \m:, 1| ou [Coni:ou] zonas [N:f:pl] periurbanas [Adj:,:Pl|e |Con,:e) a

326

|Prep2:a:f:s| sua |Pron:poss:3p:f:sj caracterizaco |N:t*:>| detalhada |.\dj:f:s| |Pp:f:.s| .

Os [Ari:dcf:m:pl| | Promposs] [PromdemJ dados [Pp:m:pl] |N:m;pl] . quando [Ad\|

|Conj| existem | V:ci| ,so [\":cjj de [Prepl :dc| difcil | Adj:2gcn:sJ similaridade [N:f:s|

e |(.'onj:c| raramente | Adv) permitem |\":cj| a | \rt:dcl:f:s| |Pron:pess:3p:f:s|

[Pron:dem:3p:f:s| |Prepl:a| detecco [N:f:sJ de |Prepl:deJ descontinuidades 'N:t':plJ e

|Conj:c| de [Prep; :Jc| fronteiras [N:f:pl| de [Prepl:de| forma |N:f:s| sistemtica

|Adj:f:s| . como |Adv| K.'onjj exige [V:ej| a |.\ri:def:f:s| |Pron:pess:3p:f:s|

|Pron:dem:3p:f:s:| |Prepl:a| reflexo |N:f:s| sobre |Prepl :sobrc| o |An:def:s|

[Pron:pcss:3p:s| | Pron:dcm:3p:s] fenmeno |N:m:s| de |Prepl:dc| periurbanizaco

|\:f:s|.A | An:dcf:f:s| |Pron:pcss:3p:f:s| |Pron:dem:3p:l:s| |Prcpl:a| classiticaco |\::s]e

|('onj:e| a | \n:def:f:s| |Pron:pcss:3p:f:s| |Pron:dcm:3p:f:s| |Prcpl:a| representaco

|N:f:s| cartogrfica |Adj:f:s] do |Prcp2:Jo:m:s| uso |N:m:s| |V:cj| do |Prep2:do:m:s|

solo [N:m:s| e |Conj:e| da |Prcp2:cla:f:sj sua [Pron:poss:3p:f:s| evoluco |N:f:sJ

permitem |V:cj| abordar |V:infJ o |Ari:def:s| |Pron:pcss:3p:s| |Pron:dem:3p:sJ

crescimento [\:m:s| urbano |Adj:m:s| segundo | \dv| |\:m:s| |\um:ord] uma

|Art:indcf:f:s| ptiea |.\dj:f:s] |\:f:s| fsico-funcional . 0 |An:def:sJ |Pron:pcss:3p:s|

|Pron:dem:3p:sJ clculo [N:m:s| [\:m:s] . a |Ari:def:f:sJ [Pron:pess:3p:l':s]

[Pron:dcm:3p:f:s| |Prepl :a| partir [V:inf] de [Prepl :dc| cartas |\:f:pl| . das

[Prep2:das:f:pl| muta^es |N:f:plJ de [Prepl :de| uso [N:m:s| |V:cj| e |Conj:eJ da

|Prep2:da:f:s| rea |N:f:s| ocupada [Pp:f:sJ [Adj:l.s] por [Prepl:porJ cada [Pron:indefJ

uso |N:m:s| [V:cj"| . possibilita [V:cjJ a [Art:def:f:sJ [Pron:pess:3p:f:sJ [Pron:dem:3p:f:s|

|Prepl :a| introduco |N:f:s| de [Prepl :de| dados [Pp:m:pl| |\:m:pl| de |Prepl :de|natureza |\:f:s| fsica [Adj:f:s| |\:f:sj na |Prcp2:na:f:s| anlise [\:f:s| quantitativa

|Adj:f:s| do |Prep2:do:m:s] probiema |\:f:s| de |Prcpl:de| crescimento [N:m:s| das

|Prep2:das:f:pl| periferias |\:l':pl| urbanas | \dj:f:pl| .

Partindo |(icr| destas |Prep2:destas:f:pl| duas |\um:card| hipteses |N:f:plJ conclumos

|\':cjJem[Prcpi:cm| 1989 a |Art:def:f:sJ [Pron:pcss:3p:f:s| [Pron:dem:3p:f:sl [Prepl:a]

primeira | Adi:f:s| [AdvJ etapa [\:f:sj de [Prcpl :dej um [Art:indef| trabalho |\:m:s] que

| Ad\ | [PromrclJ teve |V:cj| por [Prepl :por| objectivo [Adj:m:s| a | Arl:def:f:s|

|Pron:pess:3p:f:s| [Pron:dcm:3p:f:s| |Prcpl:a| defini^o |N:f:s| duma |Prep2:duma:f:s|

metodologia |N:f:s| para |Prepl:para| a |An:def:f:s| |Pron:pess:3p:f:s|

|Pron:dem:3p:f:s| [Prcpl :a| realiza^o \S:\:>,\ de [Prcpl :dc] cartas |N:f:pl| de

[Preplxie] uso [N:m:s| [V:cjJ do [Prep2:do:m:s] solo |N:m:sJ e [Conj:eJ de [Prepl :dej

evolu^o [N:f:s| de | Prepl :de| uso |N:m:s| [V:cj| do [Prcp2:do:m:s| solo |N:m:s| . por

|Prepl:por| interpreta^o [N:l':s] estereoscpica |Adj:f:s| de [Prcpl:de] fotografia

|N:f:sJ area [Adj:f:sJ vertical [Adj:2gen:s| . 0 |Art:def:s] [Pron:pess:3p:sJ

|Pron:dem;3p:s| resultado [N:m:sj final |Adj| |V:cj| constitudo |Adj:m:s| [Pp:m:sJ

por |Prcpl :por| duas [Nun?cardJ canas |N:f:pl| temticas |Adj:f:pl| do |Prcp2:do:m:s|

Concelho |N:m:s| de |Prcpl :de| Almada . onde |Ad\ | est | V:cj| representado |Pp:m:s|

[Adj:m:s| o [Ari:def:s| |Prun:pcss:3p:s| |Pron:dem:3p:s| uso |N:m:s| | V'xjJ do

|Prep2:do:m:s| solo |N:m:s| em |Prepl :em| 1986 ( Carta [N:f:s| de |Prepl:deJ Uso

|N:m;s| [ V:cj| do | Prep2:do:m:s| Solo [N:m:s| )e |Conj:e| a | Ari:def:f:sj

[Pron;pess:3p:f:s| [Pron:dem:3p:f:sJ [Prepl:a| sua |Pron:poss:3p:f:sJ evolu^o |N:f:s]

entre [Prepl :cuuc| 1967 e [( onj:e| 1986 ( Carta |N;f:s| de[Prcpl:de| Evoluco |N:f:s]

de [Prcpl :de| Uso |\:m:s| |V:cj] do [Prep2:do:m:sJ Solo [\:m:s| ) . segundo [Advj

|\:m:s| |\um:ord| uma | Art:indef:f:s| legenda |\:f:s| em [Prepl :em| 12 classes

327

[Vf-pl'l . A |Art:def:f:s| |Pron:pess:3p:f:s| ;Pron:dcm:3n:f:s| |PrePl:a] quantificaco

|\-f-s] das |Prep2:das:fpl| cartas [Vfpl! permiliu [V:ci| apurar |\:inlj a [Art:c,e::l:s]

[Pron:pess:3p:f:sj |Pron:dem:3p:f:s| |Prepl:a|rea [N:f:.| ocupada [Pp:f:s| |Adj:t:s| por

|Prcpl:por] cada |Pron:indcf|uso |\:m:s| |V:cj| em |PrcPl:em| 1986 e |( onj:e| a

| Arrdcl'-f-s] |Pron:ncss:3p:f:s| |Pron:dem:3p:fsl [Prepl :a|rea jVfs] das

[PrepVlavfplj zonas [Vfpl| que [Adv| [Pron:rci|sofreram IV:cj) modificaco |N:l:sJ

entre |PrePl:enirc| 1967 e [Conj:eJ 1986 . Postenormente [AdvJ procedeu-se

|Prcp2::f:sl anlise [N:f:s| quantitativa [Adj:f:s| das |Prep2:das:_:pl|transformacoes

(VfplJ ocorridas [Pp:f:pll I Adj:f:pl] em [Prepl :cm] 20 anos [N:m:pl] .

A [Arrdeffs] [Pron:pess:3p:f:s] [Pron:dem:3p:f:sJ [Prepl:aJmormaco [N:l:sJ obtida

[Pp-fsJ [AdffsJ sobre [Prepl:sobreJo [Art:def:sJ [Pron:pess:3p:sJ [Pron:dem:3p:s|

uso

|N'ms| |V:c)| do |Prcp2:do:m:s|solo |N:m:s| , por [Prepl :por| segmentaeo |N::s| e

|Conj;el interpretaco |N:f:s|de [Prepfde] fotografia |Vfs] area [AdpfsJ , | V.cjJ

extraordinariamente | Adv | precisa [Y:c|J e [Conj:e] exaustiva [Adi:l:s] e [Conj:eJ a

| \irdef:f:s] [Pron:pess:3p:f:s] [Pron:dem:3p:f:s| [Prepl:aJunidade |N:l:s] de

[Prepl :dc| anlise [N:f:s| . a | Art:dcf:f:s| |Pron:pess:3p:f:s| [Pron:dem:3p:f:sJ [Prepl :a|

zona |\:f:s| urbana |Adj:f:s| homognea |Adj:f:s]. responde [V:cj] satisfatonamente

[AdvJ [Prep2::f:sJ abordagem [N:f:s] do [Prep2:do:m:sJ crescimento [N:m:sJ urbano

| Adj:m:sJ das |PreP2:Jas:f:pij periferias |\:l:pl| . Contudo [Conj] . a [Art:del:f:s]

[Pron:pess:3p:f:s| |Pron:dcm:3p:f:s| [Prepl:a|fase |\:f:s| de [Prepl:de]

fotointerpreta^o |\:f:s| combinada [Adj:f:s| [Pp:f:s'| ( interpreta^o [N;f:s]

comparativa [Adi:f:s| de [Prepl:deJ fotografia [N:f:sJ area [Adj:f:s| vertical

[Adj:2gen:sJ de [Prepl:deJ datas [N:f:pl]diferentes [Adj:2gen:pl| ) |V:cj| muito [AdvJ

[Pron:indef:m:sJ morosa [Adj:f:s] e |Conj:e]no |Adv| evita |V:cj] a [Art:def.t:s|

[Pronpess:3p:f:s] [Pron:dcm:3p:f:s] [Prepl:a]introduco |N:f:sJ de [PrephdeJ

subjectividade |N:f:sJ na [Prep2:na:f:sJ classifica^o [N:f:sJ das |Prep2:das:f:pl]

muta^es [N:f:pl] de |Prepl:de| uso [N:m:sJ [Vxj] do [Prep2:do:m:sJ solo [N:m:sJ . A

[ArPdeffsJ [Pron:pess:3p:f:sJ [Pron:dem:3p:f:s| [Prepl:a]utilizaco [N:t:s] dos

[PreP2:dos:m:pl] dados [Pp:m:pl] [N:m:pl]de [Prephde] satlite [N:m:s] e [Conj:eJ do

|Prep2:do:m:s] tratamento |N:m:s] numrico [Adjmv.sJ de [Prepl:de| magem [N:l:s|

anula |\':cjl parcialmente [AdvJ os |Art:def:m:pl| |Pron:poss'| [Pron:dem|

inconvenientes | Adi:2uen:pl| enunciados |Adj:m:pl] |Pp:m:pI|e |Conj:e] permite [V:cj]

respeitar [V:infJ a [Airdeffs] |Pron:pess;3p:f:s[ |Pron:dem:3p:fs|[Prepl:a] no^o

|\-f sj de [Prepl :de] anlise [V.f s[ por [Prepl :por|zona [VfsJ .

1 Problema 0 problema [N:f:s| que [AdvJ |Pron:rel| se [ConjJ [Pron:poss| pe |\ :cj]e

| V-cjJ o |Airdefs| |Pron:pess:3p:sJ [Pron:dem:3p:s[da [Prep2:da::s] construco

[N-f:s] de [Prepl :dej um [Art:indetl mtodo [N:m:sJ que [ AdvJ [Proiv.relJ permita

[V:cjJ"

simular [V:inf|"

o | An:def sj [Pron:pess:3p:s] |Pron:dem:3p:sJ processo

|N-ms| |V:cj| de [PrcpfdeJ fotointerpretaco |N:fs| analgica|Adj:f:s] utihzando

|Ger| a | Airdeffs] |Pron:pess:3p:fsJ [Pron:dem:3p:fs] [Prepl:aJ teledetec^o [N:f:sJ

por [PrepfporJ satlite [N:m:sJ . Por [PrepfporJ outro [Pron:dem:m:s] [Proimndefm:sj

lado [N:m:s| , trata-se de [Prepl :de| saber [V:inf| se [ConjJ [Pron:possJos

|Art:defm:pl] [Pron:poss| [PromdemJdados [Ppampl] |N:m:plJ registados |Pp:m:pl|

[Adjnrpll por [Prepl :por] satlite |N:m:s] possibilitam [V:cj] a [Art:def:f:sl

[Pron-pess:3p:fsJ |Pron:dem:3p:fs| [Prepfa] classifica^ao [N:f:s| do [Prep2:do:m:sJ

uso [NmrsJ [V cjj do |Prep2:do:m:s] solo |N:m:s|em |Prepl:em| meio [Adjairs] [AdvJ

densamente [AdvJ edificado | Ad:m:s| [PpairsJ e [Conj:e| o [Art:defs| [Pron:pess:3p:s|

328

|Pron:dcm:3p:s| estudo [N:m:s] diacrnico |Ad,, ;] das [Prc, ::das:f: Pl] modilcaces

| V.fpl] ocorridas !Pp:fpl] [Adj:f:pl].

A l\rl:Jcf:l>l |P:on:pcs Pron:dcm:3p:f:s| |Prepl:a| aplicacol'

0.-...O s;nrpl| mtodos |N:m:pl| de |Prepl:dcj fotointerpretaco|N:l:s ao

Prep^ao nrsl tratamento [N:m:s| dos |Prep2:dos:m:pl| dados |PP:m:pl| |N:m:Pllde

[Prepfdc] satlite |Vnrs', | V:ci| possvel |Ad,:2ccn:s| e |Conj:eJ frequentemente

\dv| eficaz [ \di 2_ci-s] atravs_da |foc|utilizaco |N:f:s| de [PrepfdeJ suporte

Vm-sl |V-ci| em |Prepl:cml papel |\:m:s| . de |Prcpl:de] filme [N:m:s| ou |C onj:ou|

directamente |.\u\ | do [PreP2:do:m:s| monilor |N:m:s| da [PreP2:da:f:s]estacao |\:!:s|

de |Prepl:dc| tratamento |\:m:s]numrico |AJj:m:s| de [PrepfdeJ imagem |N:l:s| .

quer |Vc,| em |Prepl:cmJ modo |N:m:s| pancromtico [Adjmrs] quer |\:ej| em

IPrepl -em| composico |N:fs|colorida |Adj:f s| [Pp:fs| . E importante |Adj:2gen:s|

referir |Vinf| que |AdvJ [PromrelJ a |Art:deff:s| |Pron:Pcss:3p:f sj [Pron:dem:.m:fs|

[Prcpl :a| resoluco |N:f:_] de [Prepl :de] 10 metros [Vnv.pl] das [Prep2:das:fplJ

imagens |Nf pl] SPOT [SielaJ ,em [Prepl :em| modo |Vm:s| pancromtico [Adj:nrs| .

permite |VxjJ obter | V:inf|uma | Airindeff s| imagem |N:fs| prxima [Adj:t:s| duma

|Prep2:duma:f s] fotografia |N:f:s] area [Adj:fs| [Prep2::f s] escala |N:l:s|

aproximada [Pp:f:s| [Pp:f:s] de [Prepl :de|1 : 50 . 000 e [Confe] at [Adv] [Prepl :ate|

de |Prepl-de| 1 : 30 . 000 . A [Art:def\| |Pro.rpess:3p:t:s| |Pron:dem:^p:l:s|

|Prepl-a| fotointerpretaco !N:fs| | V:c|| desdejogo |foc] possvel |Adj:2gen:s| (

segmentaco |N:fs| do |PreP2:do:m:s| territrio [N:m:sJ em [PrePl:em| entidades

[N:fPl| diferentes |Ad|:2gcn:pl]. identificaco |N:f:s| das [Prep2:das:l:pl] grandes

|Adi_cn:pl| unidades |Vi:pl| de |Prcpl:dc| paisagem |N:nrs| . . . . ) mas |Adv|

IConjfa [Arl:def fs| |Pron:Pcss:3P:f:s| [Pron:dem:3P:fs| |Prepi:a| subjectividadeNfs | V:cj ] inevitvel [Adj:2gcn:s] .

O |Airdcf:s| |Pron:pess:3p:s] [Pron:dem:3p:s| que |.\d\] [Promrel]vamos |\ :c,| expor

IV-infJ | V:cj| um [Airindefj procedimento |N:nrsJ . ainda [Advj expenmental

[\dj:2een:sl [ que [Adv] [Promrell permite | V:cj| reconhecer [V:inf| automaticamente

| .\dv] as [Artxleffp!] zonas [N:f:pl] que |Ad\ | |Pron:rel] mudaram [V:cj] de

|Prepl :de| afecta^o |N:fs)utilizando |(ier| a |\rt:def f sj [Pron:pess:3p:t:s]

|Prondem:3p:f:s| |Prepl:a| combina^o |N:f:s| automtica [Adj:f:s] de [PrepfdeJ

ndices |N:m:pIJ temticos [AdjmrplJ calculados |Adj:m:pl] [Ppmrplla |Art:del:t:s]

[Pron:Pess:3p:fsJ |Pron:dem:3p:f sj [Prcpl :a| partir [Y:inf]de [PrepfdeJ dados

|Pp-nrpl| [NmrplJ de |Prepl:dejsatlite |N:m:s| de |Prepl:de] alta |Adj:l:s|

resoluco_espacial |N:f:s| . Consideramos | V :cj| , pois |Adv] [Conj| . a | Art.de! :f:s|

|Proivpesv ,p:fs| |Pron:denr3p:fs| |PrePl :a|combina^o |N:l:s| de [PrePl:dc| indices

[\-nrpll temticos |Adi:m:pl[ como [Adv| |( onj | um | \n:indef| ensaio [N:m:s]

preliminar [ Ad',:2ecn:s| de [Prepl :de|"

simula9o | N:fs)"

do [PreP2:do:m:s| processo

|N-m-s| [V-cJI de [Prepfde] fotointerpretaco [N:fs|. Exclm-se desta |Prcp2:dcsta::s)

fase [N-fsl a |Ari:dcffs| |Pron:pcss:3p:f:s| |Pron:dem:3p:fs] |Prepl:aJdeterminacao

[NfsJ do |Prep2:do:m:sJ sentido [N:m:s| |Pp:m:s| [AdjmrsJ das [Prep2:das:fpl]

modifica^es [Vf:Pl| ( por [Prepl :por| exemplo |N:m:s] : rea |N:f:s| agrcola

|Adi:2ccn:s| C? habita^o |N:f:s| . rea |N:f:s| floresial |Adj2gen:s] uarea |N:l:s|

industrial |Adj:2gcn:s] ,...) ,.

2 Material O trabalho [N:nrs| foi | V:ej ] desenvolvido [Adp.nrsJ [PpmrsJ em

|Prepl-em| esta?es |N:i:pl| de |Prepl:dc|tratamento [NairsJ de [PrepfdeJ imagem

\f s) de |Prepl :de] tipo [N:m:s| SUN ( SUN 3 / 80 , SUN 3 / 1 10 e |Con,:e| SUN

329

SPARC ) em |PrcPl:em] ambiente [Vm:>|UNIX . Para [PrcPl:para| os | Art:det:m:Pl|

| P.oivposs] [Pron:dem| trabalhos [\:m:Pl]de |PrePl :dej tratamento |\:m:s]

numenco

Adj-nvM de IPrepi :de| imagem |N:f <] . de |PrePt:dc| correc9o |N:t:sJ geometnca

| AdVfsl de (Prepl :dc| imagem |N:f:sJ e |Conj:e] de |Prep1:de| gestao [Vfs

tratamento |N:m:s| e |Coni:e| cartografia |N:f:s|dos [PreP2:dos:m:Pl| dados [PP:m:pl|

[Vm:pl] geogrficos [Adj:m:pl]foram [Y:cj] utilizados [Pp:m:pl] [Adjmrpl]

os

| \rrdefmpl] [ProirpossJ [ProirdemJ programas [VnrpljPLANETES . RECAL e

Conrcl SAVANE . respectivamente [Adv] . Estes [Pron:dem:lp:m:pl| programas

[N-m-pll foram 1 V:cil desenvolvidos [Adjmrpl] |PP:m:PP, integralmente |Adv| no

| iWnom:^] Laboratoire d'

Informatique APpliquee ( LIA ) do [Prep2:do:m:s]

Institut Francais de | Prepl :de| Recherche Scientifque pourle Dveloppement en

Coopration- ORSTOM . centro |N:m:s| de [Prepl :de| Bondy

. laboratono |Vm:s|

onde |Adv| realizei |Y:cj] a [A.rdeff s| |Pron:Pess:3p:fs] [Proirdem:3p:fsl[Prepl :a

parte [N:fsJ [V:cj] de [Prepfde] tratamento [N:m:s] numnco |Adj:m:s] de [1 rcpl :dej

imaeem |N:fs| .

,

As I Airdcf f-pl| imagens |N:f:pl|seleccionadas |PP:fpl| | Adj:t:pl| cobrem [\ :ci| uma

[Art:indeff s| rea |N:f:s] de [Prepl :de[ 10 Km |N:m:s| x 10 Km | Vm:s| ,rea [Vt.s]

que [AdvJ [Promrclj se [Conj] [Pron:poss| situa [V:cjJ na [Prep2:na::sJ penfena [N:i:s]

da Prep->:da:f:s] cidade [N:fsJ nova [Adj:f:s|de [Prepf.deJ Marne la Vallee ,

a

| Arrdcf f CJ [Pron:pess:3p:fsj [Pron:dem:3P:fs] [Prepl :a]NE da [Prep2:da:f:s] cidade

[N-fsl de [Prepfdc] Paris . e [Conj:e] apresentam [V:cj] os [Art:defm:plJ [Proirposs]

[Proir.dem] parmetros [N:m:pl] que [AdvJ [Pron:relJ constam [V:cj] no [Prep2:no:m:s]

Quadro [Nm-| 1 . Os [Art:def:m:pl] [Pron:possJ [Proir.dem]dados [Pp:m:plJ [NmrplJ

foram [Y:ci| registados |Pp:m:pl| | Adj:nrpl| com [Prepl:eom| inclinaco |N:i:s| quase

[AdvJ vertical | Adj:2gen;sJ # # # para [Prcpl :para] quaisquer |Pron:indet:pl | dos

|Prep2-dosmrplJ canais |N:m:pl] considerados | Adimrpl] [PpmrplJ .

Para|Prepl:para|alm[Ad\]das|Prcp2:das:fPl|imagens|N:fpl]enunciadas ^

[ Adjfpll [Pp:fpll foi [V:cil utilizada [Pp:f:s] |Adj:fs| a [Airdef fs] [Pron:pess:.>P:fsJ

Pron-denr3p-fs| |PrePl:aJ Carta |N:fs]dos [PreP2:dos:m:PIJ Modos |N:m:pl] de

IPrepl -del Ocupaco |N:fs| do [Prcp2:do:m:s| Solo | Vur.sJ . |Prep2::l:s[ escala

N-fslde|Prepl:del 1 : 25000 .folha |N:f:s| n 18 . de |PrePl :dc| 1982 ,

elaborada

[Adffsl [Pp:f s'| pelo |Prep2:pelo:m:s] lnstitut d'

Amnagement et d'

Urbanisme de

IPrepl de] la Reion Ile-de-France . no [Prep2:no:m:s] mbito |N:m:sJ do

|Prep2domrs] Atlas [N:m:s| de [Prepl :de]1

'

Occupation du Sol |N:m:s] / Modes d

Occupation du Sol [N:m:sJ ( MOS |Sigla| ) da [PreP2:da:f sj regio [N:f:sJ [N:t:s| de

[PrepfdeJ lle-de-France . Esta [Proirdem:lp:f:s] carta |N:t:s] serviu [\:cj]de

| Prepl :de] base [N:f:s] para [Prepl :para] a [Artxleffs] [Pron:pess:3p:t:s]

Prondem 3Pf:s] [Prepl :a| determina9o [N:f s| da [Prep2:da:f sj mudan9a |N:f:sJde

|Prepl -de| afecta9o |N:f:s] das [Prep2:das:fpl| zonas |N:fpl]MOS [SiglaJ . Por

[PrepfporJ zona |N:fs| MOS [Si-la] deve [VxjJ entender-setoda |Adj:fsJ [Adv] a

[Arfdeff s| [Pron:pess:3p:fs| [Pron:dem:3p:fs| [Prepl:a]unidade [N:f:s| minima

| Adifs[ de [PrePl :de| referencia9o |N:f:s| espacial [ Adj:2gen:s| para [Prepl :para[

efeitos |Nmpl| de |Prepl:de| classifica9o |N:f:s| da |Prcp2:da:f: s| ocupa9o |N:l:s|

do |Prep2:do:m:s] solo |N:m:sJ fPreP2::f:s| qual |Pron:rcl| tambm [AdvJ estao

[VxjJ associados [Adjmrpl] [Pp:m:pl]dados [Pp:m:pl] [N:m:plJ de [Prepl

:de natureza

[N-f sj demogrfica [Adi:fsJ e [Conj:e|socio-econmica que [AdvJ [Pron:rel| no

[Prep>ncvm:s| conjunto |N:m:s] . constituem |V:cj| uma |Art:.ndet:l:s| base |N:fs[de

330

Anexo 5

Sequncias extradas com ExtracTerm,

a partir de texto etiquetado no desambiguado

Teledetecco |\:f:s|em |Prcpl:em| reas |\:f:P| ;N:f:s Prepfem-

Vfpl

Teledetec9o |Vfs| em [Prepi :cm| reas [N:f:pl| periurbanas | Adj:f:pl| i N:fs +

Prepfem :- N:fpl-

Adi:f:pl}

reas |N:f:pl] periurbanas | -\dj:f:pl] [N:fpl-

Ad?fpl;

combina9o [Vfs| de [Prepfde] ndices |\:m:pl] !N:fs+ Prepl:de- Nairpi;

combinaco [N:f:s] de [Prepl.dej ndices [N:m:nl| temticos |Adj:m:pl| {Vfs-

Prepfde Vnr.pl Adjmrpl!

ndices |N:m:pl| temticos |Adj:m:piJ {N:m:pl-

Adjmrplj

mudan9a |N:f: s| de [Prepl :de| uso |N:m:s| [V:cj| {N:f:s+ Prepl :de + N.m.sJ

uso |N:nrs] [V:cj| do |Prep2:do:nrs] solo [N:m:s] {Nmrs-

Prep2:do:m:s + Nmrsj

imaeens [N:f:pl] digitais [Adj:2gen:plJ {Vfpl+ Adj:2gen:pl)

imagens [VfplJ digitais |Adj:2geirplJ Spot [SiglaJ {N:f:pl-

Adj:2gen:pl-

Sigla}

imagens [N:f:pl] digitais | Adj:2gen:pl| Spot [SiglaJ HRV [Sigla| |N:f:pl-

Adj:2gen:pl

Sigla Sigla}

Spot [SigiaJ HRV |Sicla| I Siela-

Siglaj

em reas periurbanas : combinaco de ndices temticos para localizar a

mudan9a de uso do solo com recurso s imagens digitais Spot HRY .

manifestaces |N:f:pl| territoriais |Adj:2gen:pl| [N:f:pl+ Adj:2gen:plj

crescimento [N:m:s] das [Prcp2:das:f plj periferias |N:fplj {N:m:s-

Prep2:das:fpl-

N:fpl)

periferias [VfplJ urbanas |Adj:fplJ {N:f:pl-

Adffplj

estatstica [Adj:fs] [N:f:s] descritiva [Adj:f sj {N:f s+ Adj:fsJ

anlise [N:f sj de |Prepl :dc] dados [Pp:nrplJ |N:nrplJ ;N:fs-i Prepl :de

-

N:m:pl)

anlise [N:fsJ individual [Adj:2gen:sJ {N:f s-r Adj:2gen:s!

anlise |N:fs| individual [Adj:2gen:sJ de [Prepl:de| variveis [Adj:2gen:plJ |N:f: plj

|N:f:s + Adj:2gen:s-

Prepfde-

N:fpl)

anlise|N:f:s]de|Prepl:deJvariveis[Adj:2gen:plJ |N:fpl| N:f:s Prepfdc

N:f:pl}anlise j VfsJ em [PrcnfemJ componentes |N:fpl| {Vf:s- Prepfem

+ N:t:pl|

anlise |N:f:sJ em [Prepfem] componentes |N:f:pl] principais |Adj:2gen:pl| ;N:fs-

Prepfem + Vfpl + Adj:2gen:pl]

componentes[\:f:pl]principais[Adj:2gen:pl| !\:f:pl Adj:2gen:plj

anlise [\:f:s| factorial [Adj:2gen:sJ {N:f:s-

Adj:2gen:s}

anlise [N:f:s| factorial |Adj:2gen:sJ de [Prepl :dej correspondncias |N:f:plj (N:f:s +

Adj:2gen:s-

Prepl :de-

N:f:pl !

classifica9o [N:fs'| ascendente |Adj:2geirsJ (N:f:s + Adj:2gen:s)

unidades[N:fpl|territoriais[Adj:2geirpl] (N:f:pl - Adj:2gen:pl]

As manifestaces territoriais do crescimento das periferias urbanas tm sido

abundantemente tratadas nas pticas econmica e financeira . social e poltica .

demogrfica e habitacional . fundiria e funcional . As tcnicas e os mtodos

para localizar . descrever e analisar esse crescimento baseiam-se . sobretudo , na

estatstica descritiva e na anlise de dados ( anlise individual de variveis .

332

anlise de variveis duas a duas ,anlise em componentes principais . anlise

factorial de correspondncias . classifica9o ascendente hierrquica . etc . ) . A

informaco tratada diacronicamente para deduzir ,a partir de escalas muito

variadas . as transformaces que vo ocorrendo em unidades territoriais

definidas administrativamente ( freguesia . concelho . commune . dpartement .

ln . etc ) .

abordagem [Vfsj estatstica [Adj:f:s] |N:fs] !\:f:s + Adffs}

abordagem [N:fs| estatistica |Adj:f sj |N:f: sj ;Vfs-

N:f:sj

estatistica |Adj:fs| |N:fs| do |Prep2:do:m:sJ fenmeno |N:m:s| ! Vfs~ Prep2:do:nrs

N:m:s|

considera9o |N:f:sJ da [Prep2:da:fs| unidade [ Vfs| |N:f:s t Prep2:da:fs + N:f:sj

unidade [N:i:s] administrativa |Adj:f:sJ ;N:fs + Adf.fs}unidade [N:f:sJ mnima |Adj:f:s] JN:f s -r Adj:f:s)unidade [N:fs] mnima [Adj:f:s] de [Prepl :de] referencia9o [N:f:s] |N:f:s + Adj:fs +

Prepl:de-N:f:s!

referencia9o [N:fs| espacial |.\dj:2gen:s| [N:f:s-

Adj:2gen:sJdiversidade [ Vf s| de | Prepl :de| situa9es |Vfpl | |N:f:s

-

Prepl :de + N:fpl}

conjunto |N:nrs| completo |Adj:m:s] (N:nrs+ Adj:m:sj

conjunto [N:m:s| completo [Adj:m:s| de [Prepl :de] variveis |Adj:2gen:pl] [Vfpl]

!N:m:s-

Adj:nrs-

Prepl :de + Vfpi]

ocupa9o | N : f: s] fsica | Adj : f:s] | N : f: s ] [ N : f : s -

Adj : f: s J

ocupaco | Vf s] fsica [Adj:fsJ [N:fs| {Vfs N:fs}

fisica [Adj:f:s] [VfsJ do [Prep2:do:m:sJ territrio [N:nrsJ (N:fs + Prep2:do:m:s-

N:nrs}

definico |N:fsj de [PrepfdeJ coroas [N:f:pl| |N:f:s ' Prepfde + N:i':p}

zonas [N:f:pl] periurbanas [Adj:f:pl] {N:f:pl + Adj:f:pl)

caracteriza9o [N:f:s] detalhada [Adj:f sj [Pp:f:s] {N:f:s + Adj:fs]

detec9o |N:f s] de [Prepl :dej descontinuidades [N':f pl] {N:f:s-

Prepl :de- N:f:pl j

fronteiras [N:f pl) de [Prcpl :de] forma [N:fs| {N:fpl + Prepl :de+ N:fs]

fronteiras [N:f:pl] de [Prepl :dej forma [N:f:s] sistemtica [Adj:f s] [N:f:pl + Prepl :de +

N:fs-r Adj:fsjforma [N:f:sJ sistemtica [Adj:fsJ |N:f:s

-

Adj:fsjfenmeno [N:m:s| de [Prepl :dej periurbaniza9o |N:f s| [N:nrs

-

Prepl :de"

N:f:s|

A abordagem estatstica do fenmeno delicada . Em primeiro lugar porque a

considera9o da unidade administrativa como unidade mnima de referencia9o

espacial esconde a diversidade de situa9es no seu interior . Em segundo lugar .

porque difcilmente se obtm um conjunto completo de variveis ( demogrficas

. socio-econmicas . de uso e ocupaco fsica do territrio ) que responda em

simultneo a defmico de coroas . sectores ou zonas periurbanas e sua

caracteriza9o detalhada . Os dados . quando existem ,so de difcil similaridade

e raramente permitem a detecco de descontinuidades e de fronteiras de forma

sistemtica . como exige a reflexo sobre o fenmeno de periurbaniza9o .

333

representaco |Vf:s| cartogrtlca |Adj:fs| ;\:f:s! Adj:l:s;

uso |\:m:s| |V:ci| do |Prep2:do:nrsJ solo [\:nrs] !\:m:s- Prep2:do:nrs-

N:m:s!

crescimento |N:nrs| urbano [AdjmrsJ |N:m:s-

Adj:m:s]

muta9es|N:fpl|de|Prepl:deluso[N:nrs| |V:cj| |N:f:pl+ Prepl:dc+ \:m:s|

rea |N:fs| ocupada |Pp:f:s| |Adj:fs] iVfs Adj:f:sj

introduco |N:(:s| de [Prepl.de] dados |Pp:m:pl| |N:m:pl] jN:f:s t Prepfde-

N:m:pl}

dados |Pp:m:pl| |N:m:p] de [Prepl :de| natureza |N:f:s| ! Vnrpl + Prcpl :de-

Vfs}

dados |Pp:nrpl| |\:m:plj de [Prepl:de| natureza |\:f:s| fsica |Adj:f:s| |\:f:s| }N:m:pl

Prepfde- Vfs Adj:f:}

natureza | VfsJ fsica [AdffsJ [\:f:s| ;\:fs-

Ad'pfs!

natureza |\:l':s| fsica ;Adj:fs| |\:i':s| [N:f:s-

N:f:sj

anlise [N:f:sj quanlitativa |Adj:f:s| ;N:fs AdjTV

problema |N:f:s| de | Prepl.de] crescimento |N:nrs| Vfs Prcpfde N:m:s|

crescimento |N:nrs| das [Prep2:das:t':PiJ periferias |N:f:pl] ! N:nrs + Prep2:das:fpl-

Vfpl!

periferias |N:fpl| urbanas |Adj:fpl] {Vfpl+ Adj:f:pl|

A classifica9o e a representa9o cartogrfica do uso do solo e da sua evolu9o

permitem abordar o crescimento urbano segundo uma ptica fsico-funcional . 0

clculo,a partir de cartas . das muta9es de uso e da rea ocupada por cada uso ,

possibilita a introduco de dados de natureza fsica na anlise quantitativa do

problema de crescimento das periferias urbanas .

realiza9o|N:fs]de[Prepl:de]cartas|N:f:pi| jN:f:s~

Prepl :de N:f:pl|

cartas|N:f:pl|de |Prcp]:de| uso |N:m:s| |V:cj| jVfpl Prepl :de + N:m:s}

uso |N:m:s| |\':cj| do |Prcp2:do:nrs| solo |N:m;s| {N:m:s-t Prep2:do:m:s-

N:m:s|

evolu9o |N:fs| de [Prepxle] uso [N:nrs] [V:ej] {N:fs+ Prepfde

-

N:nrs}

uso |N:m:s[ |V:cj| do |Prep2:do:nrs] solo |N:m:s| {Nmrs+ Prep2:do:nrs + N:m:s!

interpreta9o |\:f:s| estereoscpica [Adj:f:s| |N:f:s Adj:f:sj

interpreta9o |N:f:s| estereoscpica |Adj:i:s| de [PrepfdeJ fotografia |N:f s| (N:f:s+

Adj:fs+ Prepfde N:f:sJ

fotografia |N:fs| area |Adj:fs| !N:f s + Adj:f:s)

fotografia |N:fs| area |Adj:f:s] vertical |Adj:2gen:s| [N:fs+ Adj:f:s

-

Adj:2gen:s}

cartas [N:f:pl] temticas [Adj:fpl] {N:fpl-

Adffpl!

uso |Ni:m:s] |V:cj| do |Prep2:do:m:s] solo |N:m:s] [N:m:s + Prep2:do:m:s + Nrnrs}

Carta |N:f:s| de |Prcpl:dc| Uso |N:m:s| |V:cj| !N:f:s+ Prepl :dc

-

N:m:sj

Uso | Vm:s| |V:ej| do |Prep2:do:nrs] Solo | Vm:s| }N:nrs-

Prep2:do:m:s + Nmrsj

Carta | N:f:s'| de [Prepl :de] Evolu9o [N:f:s| :N:fs + Prepl :de + N:f:sj

Evolu9o |N:fs| de | Prepl.de] Uso [N:nrs| |V:cj| !N:l':s + Prepf.de + N:m:s|

Uso |N:m:s| |V:cj| do [Prep2:do:m:s| Solo |N:nrs| [N:m:s + Prep2:do:nrs-

Nmrs}

quantifica9o | N : V | das |Prep2:das:f:pl| cartas |N:f:pl| |N:t:s*

Prep2:das:fpl +

N:fpl;

rea |\.l':s| ocupad |f'p:f:s] [Adj:f:si {N:fi; < \dj.f.s|

rea |N:f:s] das | Prep2:das:f:pl] zonas [N:f:pl | \ N:f:s-

Prep2:das:fpl + N:fpl j

anlise |N:fsj quantitativa |Adj:f: s| {N:fs f Adj:fsJ

334

transformaces | Vfpl] ocorridas |Pp:f:plJ |.\dj:f:pl] {Vf.pl Adi:fPl]

Partindo destas duas hiPteses conclumos em 1989 a primeira etapa de um

trabalho que teve por objectivo a defini9o duma metodologia para a realizaco

de cartas de uso do solo e de evoluco de uso do solo . por interpreta9o

estereoscpica de fotografia area vertical . 0 resultado final constitudo por

duas cartas temticas do Concelho de Almada . onde est representado o uso do

solo em 1 986 ( Carta de Uso do Solo ) e a sua evolu9o entre 1 967 e 1 986 (

Carta de Evolu9o de Uso do Solo ) . segundo uma legenda em 12 classes . A

quantificaco das cartas permitiu apurar a rea ocupada por cada uso em 1 986 e

a rea das zonas que sofreram modifica9o entre 1967 e 1986 . Posteriormente

procedeu-se anlise quantitativa das transforma9es ocorridas em 20 anos .

informaco |Vi:s| obtida |Pp:f:s| |Adj:fs| [Vfs Adj:fs]

uso |N:m:s| [V:cj| do |Prep2:do:nrs| solo [N:nrs| |N:m:s + PreP2:do:m:s + Nrnrs;

interpretaco |N:f:s| de [PrepfdeJ fotografia |N:f:s| !\:l':s Prepfde + N:fs)

interpreta9o |N:l':s| de |Prepl:deJ fotografia |N:f s| area |Adj:f:s| [N:f:s + Prepl :de-

N:f:s- Adj:fsJ

fotografia |N:fs| area [Adj:fsJ [N:f:s + Adffsj

unidade [N:fsJ de [PrepfdeJ anlise [N:f:s] {N:f:s + Prepl.de-

N:fs}zona | VfsJ urbana |Adj:f:s'| |N:f:s + Adffs]

zona |N:f:s| urbana |Adj:f:s| homognea |Adj:fs| jVfs-

Adffs + Adj:f:sJ

abordagem [ Vfs) do [Prep2:do:nrsJ crescimento [N:m:s| [Vfs Prep2:do:m:s4-

N:m:s}

crescimento |N:nrs| urbano [AdjairsJ [N:m:s-

Adjairsjfase Vfs| de |Prepl :dc| fotointerpretaco |N:f:s| {N:f:s -t Prcpl :de

-; N:f:s)

fase [N:f:s| de |Prepl:de| fotointerpreta9o [N:f:s| combinada |Adj:f:s| [Pp:fsJ ;N:l':s -

Prepl.de tVI.s Adj:fs!

fotointerpreta9o |\:fs| combinada |Adj:fs| |Pp:f:s| [N:f:s Adi:f:sj

interpreta9o [Vfsj comparativa [Adj:f:s] {N;f:s * Adj:f:s]

interpreta9o [N:i':s| comparativa [Adj:fsJ de |Prepl:de| fotografia |N:fs] {N:fs-u

Adj:fs+ PrepfdeT N:fs}

fotografia [N':fs| area [Adj:f:s] [N:f:s Adj:f sj

fotografia | Vf:s| area |Adj:f s| vertical |.\dj:2ccn:s) j\':f:s i Adj:fs Adj:2gen:s!

datas [\':f:plj diferentes [Adj:2gen:plJ |N:f:pl Adj:2gen:plj

introdu9o |N:fsJ de [Prepl :dej subjectividade [N:fs| {N:f s-

Prepl :de-

N:f:sj

classifica9o |N:f:s| das |Prep2:das:fplJ muta9es [N:f:pl| |N:f:s + Prep2:das:f:pl +

N:f:pl)

muta9es | Vfpl] de [Prepl :dej uso [NmrsJ [Vxj] |N:f:pl + Prepl :de+ N:m:s}

uso |N:m:s| | V:cj| do [Prep2:do:m:s| solo [N:m:s| jN:m:s*

Prep2:do:m:s + N:m:s)

utiliza9o |N:f:sj dos |Prcp2:dos:m:pl] dados |Pp:m:pl| |\:m:pl| |N:f:s +

Prep2:dos:nrpl r N:m:pl}dados |Pp.!n.|)l| |\:in.pll de [Prepfdc] satlitc |N:m:s| {\:m:Pl PrcPl:dc \:m:sj

tratamento [\':m:s| numrico [Adj:m:sJ i Vm:s-

Adjmrsjtratamento |N:m:s| numrico [Adj:m:s| de |PrcPl:dc| imagem | Vfs| {N:m:s

-

Adjmrs

335

Prepl:de + Vfs

no9o [N:f:sJ de [Prepl :de] anlise |N:f:s|! Vt:s

-

Prepl :dc-

N:t:s!

A informa9o obtida sobre o uso do solo , por segmentaco e interpreta9o de

fotosrafia area . extraordinariamente precisa e exaustiva e a umdade de

anlise . a zona urbana homognea . responde satisfatoriamente abordagem do

crescimento urbano das periferias . Contudo . a fase de fotointerpretaco

combinada ( interpreta9o comparativa de fotografiaarea vertical de datas

diferentes ) muito morosa e no evita a introdu9o de subjectividade na

classifica9o das muta9es de uso do solo . A utiliza9o dos dados de satlite e

do tratamento numrico de imagem anula parcialmente os inconvenientes

enunciados e permite respeitar a no9o de anlise por zona .

processo |N:m:s| |\':cj| de (Prenf.dc] fotointerpreta9o |N:fs| JN:m:s-

Prepl :de-

N:f:sj .. ..

processo [N:nrs| [YxjJ de [PrepfdeJ fotointerpreta9o [N:t:sJ analgica [Adj:l:s]

jN:m:s + Prepl :de- N:f:s

-

Adj:f:sj

fotointerpreta9o [VfsJ analgica [Adj:f:s] J\:f:s + Adj:t:s!

dados |Ppmrpl| [N:m:pl| registados [Pp:m:pl| |Adj:m:pl| [Nmrpl-

Adjampl}

classifica9o [N:f:s] do [Prep2:do:m:s] uso [NmrsJ [V:cj] {N:f:s-

Prep2:do:m:s-

Nrnrsjuso [Vm:s| [V:cj| do [Prcp2:do:m:sJ solo |N:m:s] ;N:m:s

-

Prcp2:do:m:s + N:m:s!

estudo | Vm:s| diacrnico |Adj:m:s| {N:m:s + Adj:m:s{

modifica9es [Vfpl] ocorridas |Pp:f:pl] [Adj:f:pl] !N:f:pl-

Adj:f:plj

1 . Problema 0 problema que se pe o da construco de um mtodo que

permita"

simular"

o processo de fotointerpreta9o analgica utilizando a

teledetec9o por satlite . Por outro lado . trata-se de saber se os dados registados

por satlite possibilitam a classifica9o do uso do solo em meio densamente

edificado e o estudo diacrnico das modi1ca9es ocorridas .

aPlica9o | VfsJ dos |Prep2:dos:m:pl] mtodos [NairpiJ (N:f:s-

Prep2:dos:nrpl t

N:m:pl| .

mtodos [NmrplJ de [Prepl :dej fotointerpreta9o |N:f:sJ {N:m:pl - Prepl :de-

V:s,

tratamento [N:m:s| dos [Prep2:dos:m:pl| dados [PpmrplJ |\:nrpl| {\:nrs+

Prep2:dos:nrpl-

\:m:pl}

dados [Ppmrpl] |\:m:plj de [PrepfdeJ satlite [\:m:s] [Nmrpl + Prepfde- N:m:s,

utiliza9o [N:fsJ de |PrePl:deJ suporte [NmrsJ [VxjJ:N:fs + Prepf.de + N:m:sj

suporte | Vm:s| [Vxj] em [PrepfemJ papel jN:m:s| [N:m:s+ Preplxm -Nmrs}

monitor [N:m:s] da [Prep2:da:f sj esta9o |N:fsJ {Nmr.s-

Prep2:da:1:s + N::s}

esta9o [N:fs] de [Prepl :dej tratamento [N:m:s] N:f:s-

Prepf.de-

N:m:s)

esta9o [Vfs'j de [Prepl :de] tratamento [NmrsJ numrico [Adj:m:sJ [N:f s- Prepl :de

- N:m:s-

AdfmV

336

tratamento |N:nrs| numrico [Adj:m:s| jNmrs-

Adjmrs}

tratamento [N:m:s] numrico |Adj:m:sJ de [Prepl :dej imagem |N:fsJ {N:m:s-

Adj:m

-

Prepl:de+ VfV

modo [N:m:s| pancromtico |Adj:nrs| ! Vm:s h Adj:m:s;

composi9o |N:f:s| colorida [Adj:f s| [Pp:f:sJ !N:fs AdfV,

metros |N:m:pl] das [Prep2.das:f:pl| imagens | N:f:pl; |N:m:pl Prep2:das:f:pl +

N:fpl]

imagens |N:fpl| SPOT |Sigia| ;Vfpl Sigla;

modo [N:m:s| pancromtico |Adj:nrs| {Vnr.s-

Adj:m:sj

imagem [Vfsj prxima |Adj:f:s] [N:f: s-

Auj:l':s;

fbtografia |N:fs| area |Adj:f:s| ;Vfs + AdjT.s}

segmenta9o |N:f>| do |Prcp2:do:m:s| territrio |N:nrs) |N:f:s-

Prep2:do:m:s

Nmr.s}

territrio [Nmrs] em [Prepfem] entidades |N:f:pl] {Vm:s- Prepfem+ Vfpl)

territrio [N:m:s] em [Prepl :emj entidades [N:f:plJ diferentes [Adj:2gen:plJ [N:nrs-

Prepl :em + Vfpl + Adj:2gen:plj

entidades |N:f pl] diferentes [Adj:2gen:pl] {N.fpl-

Adj:2gen:pl)

unidades |N:fpl] de [Prepl :de| paisagem [N:m:s| |N:f:pl-

Prepl :de-

N:m:s)

A aplica9o dos mtodos de fotointerpreta9o ao tratamento dos dados de

satlite possvel e frequentemente eficaz atravs_da utiliza9ode suporte em

papel ,de flme ou directamente do monitor da esta9o de tratamento numrico

de imagem . quer em modo pancromtico quer em composi9o colorida . E

importante referir que a resoluco de 10 metros das imagens SPOT ,em modo

pancromtico . permite obter uma imagem prxima duma fotografia area

escala aproximada de 1 : 50 . 000 e at de 1 : 30 . 000 . A fotointerpretaco

desdejogo possvel ( segmentaco do territrio em entidades diferentes s

identifica9o das grandes unidades de paisagem . . . . ) mas a subjectividade

inevitvel .

337

Anexo 6

Texto etiquetado com o ExtracTerm,

com a aplica9o de regras de desambiguago

Teledetecco |Vf:sl em [Prepl :em| reas |\:f:Pi| periurbanas |Adj:l:pl|: combina9ao

|Vfs| de |Prep Vic1 indices |N:nr.Pl| temticos | Adjampl) para |Prepl :Para| locahzar

|V:inf| a | Atrdcf.fs] mudan9a |N:f:s|de [Prepfdc| uso |N:nr.s] do [Prep2:do:m:s] solo

|Vm:s| com |PrcPl :com| recurso |N:m:s| as |Prep2:as:s:pi| imagens |N:i:Pl| digitais

|\di:2ecn:Pl| Spot |Sigla|HRV|Sigla|.Manifestaces (N:fpl| territoriais |Adj:2gen:pl|

do |Prep2:do:m:s| crescimento [NmrsJ

das [PrepVlas.:fpl| periferias [Vfpl]urbanas [Adj:f:plJ tm [Vxj] sido [PpJ

abundantemente [Adv] tratadas |Pp:f:pl| [Adj:f:pl]nas |Prep2:nas:t:plJ pticas ]N:i: pl|

econmica |Adj:f:s| e |Conj:e| financeira |Adj:fs| ,social |Adj:2gcn:s| e |C onjx|

poltica |N:fsl ,demoerfica |Adj:fs|e ,('onj:e| habitacional |Adj:2gen:s| . tundiana

\\AyH e |Conj:c| funcional [Adi:2gen:s|. As |.\n:dcf:f:pl| tcmcas |N:l:pl| e

|ConjeJ os |Arl:dcfm:plJ [Pron:poss| |Pron:dem| mtodos [NmrplJ para [PrepfparaJ

localizar |V:inf| . descrever | V:inf| e |( onj:c| analisar | V:inf| esse |Pron:dem:3p:nrs|

crescimento |N:m:s| baseiam-se . sobretudo |Adv| ,na |Prep2:na:t:s] estatistica |N:f: sj

descritiva [Adj:f:s| e |Con]:eJ na [Prep2:na:f:s| anlise [VfsJ de [Prepl:de| dados

[PP:m:plJ |Vm:pl| ( anlise [N:f:s| individual |Adj:2gen:sJ de |Prepl:de|variveis

|VfplJ . anlise |\:f:s| de |Prepl:dc| variveis |\:fpl|duas [Vumxard] a |An:dct::s|

|Proirpcss:3p:fs| |Pron:dem:3p:f:s| [PrepfaJduas |\um:card| . anlise |\:fs| em

[PrepfemJ componentes [VfplJ principais [Adj:2gen:pl]. anlise |V.f sj factorial

| Ad'):2en:sJ de |Prepl :dej correspondncias [VfplJ,classificaco [N:f.s] ascendente

| Adj:2oen:s| hierrquica [Ad'pfsJ . etc . ) . A [Aii:def:fs| informa9o |Vf:s| |V:cj]

tratada^[Pp:fs| diacronicamente [AdvJ para [Prepl :para] deduzir [V:inf| ,a [Art:de:i:s|

partir [V:inl] de |PrePl :dejescalas [N:f:pl] muito [AdvJ [Pron:indei:m:s| vanadas

| Adj-fpjj ,as [An:dcf:fpl]transforma9es |N:fpl| que |Adv| [Proir.rel]vo |V:cj]

ocorrendo |C.er| em |Prepl :em| unidades |N:f:pl| territoriais |Adj:2gen:pl|detinidas

|Pp:fpl| administrativamente [Adv| ( freguesia [N:fs| . concelho [N:m:s| . commune .

dpartement ,ln | N : | . etc ) .

abordagem [Vf s| estatstica [Adj:f:s| do [Prep2:do:m:sJ fenmeno [N:nrs| e [\ xjj

delicada |Adj:f:s| . Em |Prepl:cm| primeiro |Adj:m:s| |Adv| |Nunrord| lugar |N:m:s|

porque |Adv| |t onjj a [Art:deffsJconsideraco [N:f:s| da [Prep2:da:f:s| unidade

|VfsJ administrativa [Adi:f:s) como |Ad\ | [Conj] unidade |N:fsJ mnima |Adj:fsJde

[Prepfdel referencia9o [N:f:s| espacial |Adj:2gen:s| esconde |\':cj]a |Art:def:l:s]

diversidade |N:fs| de |Prepl:deJ situa9es |N:f:pl|no |Prep2:no:m:s| seu

|Pron-poss:^p:nrs| interior | Adj:2gen:s] [N:m:s] . Em |Prepl:em| segundo [Ad\!

[N:m:s] [Nunrord| lugar [NmrsJ. porque |Adv| [ConjJ dificilmente [AdvJ

se [C onjj

|Pron:poss| obtm |V:cjJ um [An:indefJ conjunto |\:nrsj completo |Adj:m:s)de

|Prepl -de| variveis |\:fpl| ( demogrficas |Adj:f:pl| . socio-econmicas ,de

|Prepl:de| uso |N:m:s| e [Conix] ocupa9o |N:f:s| fsica |Adj:fs] do [Prep2:do:m:s]

territrio |N:m:s| ) que [Adv] [Pronael] responda [V:cj| em [Prepl :emj simultneo

| AdjnrsJ |Prep2:a:f:sJ defini9o |N:fsJ de [Prepl :de| coroas [N:f:pl|. sectores

|N:m:pl) ou |Conj:ou] zonas [N:fpl| periurbanas | Adj:fpl| e [Conjxj [Prep2:a::s|

sua |Pronposs:3p:fs[ caracteriza9o |N:f:s] detalhada |Adj:f.s| [Pp:(:sJ. Os

[Arrdefimpl] |Pron:Poss] [Proirdcm]dados |Pp:m:pl] |N:m:plJ . quando [AdvJ [Com]

existem | Vcj| . so | V:cj| de |Prepl :de| difcil | Adj:2gcms| similaridade |\:l:sje

U onj:c] raramente |AdvJ permitem | V:cj| a |A.i:del:f:s| detec9o [N:f:s| de |Prcpl:deJ

descontinuidades |N:f:pl] e |Conj:c| de [Prepfdej fronteiras [N:fpUde [PrcpfdcJ

forma [N:f s'J sistemtica [Adi:f:s] . como [AdvJ [Conj] exige [VxjJ a |Art:det:fsJ

339

reflexo |Vf<| sobre |Prcp". :sobrc| o |An:defs| |Pron:Pcss:3P:s| [Promdem:3P:s|

fenmeno | VmV de [Prcpfde] periurbaniza9o | Vf:s| .

classifica9o |N:f:sj e |Conj:c| a [Arrdefi.s] representa9o |N:f:s| cartogrfica

|Adj:fs| do |Prcp2:do:m:s| uso |N:m:s| do |Prep2:do:m:s| solo |N:nrs| e |Conj:c| da

|Prcp2:da::':s| sua |P_\m:pos>:3p:f:s] evolu9o |N:f:s| permitem |V:cj] abordar |V:infJ o

|.\rt:dct:s| |Pron:pcss:3p:s| |Pron:dem:3p:s|crescimento [N:m:sJ urbano |Adj:m:s]

segundo [AdvJ |Vm:s| |Num:ord| uma | Ail:indef:f:s| ptica |N:f:s| fsico-funcional . 0

|Aii:def:s| |Pron:pcss:3p:s| |Pron:dem:3p:s| clculo | VimsJ |N:nrs| . a | *\rt:dc1 :l :s]

partir | V:inf| de |Prepl :de| canas |N:f:pi| . das |Prcp2:das:fpl] muta9es |N:f:pl] de

[Prepl :dej uso [N:m:sj e [Conj:eJ da [Prep2:da:f:s| rea [N:f:sj ocupada [Pp:f:s] por

[PrepfporJ cada [ProirindefJ uso |N:m:s| [V:cj| , possibilita [Vxjj a |Art:deffsJ

introdu9o |N:fsj de |Prepl:de| dados [Pp:m:pl| |N:m:plJ de [PrepfdeJ natureza

|N:fs| fsica [Adj;f:s| na |Prep2:na:fsJ anlise |\:fs| quantitativa |Adj:fs|do

[Prep2:do:m:sJ problema [\:fs] de [Prepfde] crescimento [N:m:s'| das |Prep2:das:i:pl|

periferias |N:.pl| urbanas |Adj:f:pl| .

destas |Prep2:dcstas:f:pl| duas |Numxard| hipteses |\:f:pl| conclumos |V:cj|em

[Prepl:cm| 1989 a |Art:dcf:f:s| |Pron:pess:3p:f:s| |Pron:dcm:3p:fs| |Prcpl:a| primeira

|.\di:f:s] [Ad\J etapa | VfsJ de [PrepfdeJ um |Art:indel] trabalho | V.imsJ que [Adv]

(PromrelJ teve [Vxj| por [PrcpfporJ objectivo [Adjmrsj a [Ari:def:fs| defmi9o

[\:fs| duma |PrcP2:duma:fs| metodologia |\:f:sj para |Prepfpara|a [Aii:deffs|

realiza9o [N:f:s] de |Prcpl:deJ cartas |N:f:pl'| de |Prepl:dc| uso [Vm:s| do

[Prep2:do:m:s| solo [N:m:s| e |Conj:e| de [Prepl:dej evolu9o [N:fs| de [Prepfde] uso

| VnrsJ do [Prep2:do:m:sJ solo [Vimsj . por |Prepl :por| interpreta9o |N:fsJ

estereoscpica [ Adj:f:s| de [Prepl :de| fotografia [ VfsJ area | Adj:fs| vertical

|Adi:2gems] . O |.\rt:defs| [Pron:pess:3p:s| |Pron:denr3p:s] resultado [Nmr.s] final

[AdjJ [V'xjJ constitudo [Pp:m:sJ por [Prepl :por| duas [Nunrcard] cartas |N:fplJ

temticas [AdffplJ do [Prep2:do:nrs| Concelho |N:nrs| de [Prepl :dejAlmada

,onde

[Adv] est [V:cj] representado [PpairsJ o [An:def:s] [Pron:pess:3p:s] [Pron:dem:3p:sl

uso [N:m:s] [V:cj| do |Prcp2:do:nrs] solo [N:nrs| em [PrepfemJ 1986 ( Carta |Vfs)

de |Prepfde| Uso [\:m:s| do [Prep2:do:m:s] Solo [N:m:sJ )e |Conj:e| a |Ari:defi':s]

|Proirpcss:3p:f.s| |Pron:dem:3p:f sj [Prepfa] sua [Pron:poss:3p:f:s| evolu9o |Vfs|

entre |Prepl :cntre| 1967 e |Conj:e| 1986 ( Carta |\:fs| de [Prepl :de| Evolu9o |\:f s|

de [PrepfdeJ Uso |N:m:s| do [Prep2:do:m:s| Solo [N:nrs] ) , segundo [Advj [N:m:sJ

|Num:ord| uma |An:indef:fs| legenda |N:f:s| em |Prcpl:emJ 12 classes |N:f:plJ . A

| Arrdcf !":s| quantifiea9o |N:f:s| das |Prep2:das:fpl| cartas [N:f:pl| permitiu | V:cj|

apurar |N:inf| a | Ai1:def:f:sJ rea [N:f:s| ocupada |Pp:l:sJ por [Prcpl:porJ cada

[Pronnde] uso | VnrsJ |V:cjJ em [Prepfem] 1986 e [ConjxJ a |Ari:def:l:s] rea

|N:fs| das [Prep2:das:f:plJ zonas [N:fpl] que [Adv] |Pron:rel|sofreram |V:cj|

modifica9o [N:f:s| entre | Prepl :entre'J 1967 e [Conj:e| 1986 . Posteriormente |AdvJ

procedeu-se |Prep2:a:fs| anlise [N:fs| quantitativa [Adj:fsJ das |Prep2:das:fpl]

transforma9es |N:l:pl| ocorridas [Pp:f:pl] [Adj:f plj em [PreplxmJ 20 anos ["Vrmpl] .

informa9o [N:f:sJ obtida |Pp:f:s| sobre [Prcpl :sobreJ o [Ari:defs| |Pron:pess:3p:sJ

|Pron:dem:3p:s| uso |N:m:s| [V:cj| do |Prep2:do:nrs| solo [N:m:s| , por [Prepl:por|

scgmenta9o [N:f:s| e [Conj:e] interpreta9o |N:f:s'| de [Prepl :de] fotografia [N:fsJ

area [Adj:f:s] , [ V:cjJ extraordinariamente |Ad\J precisa [Y'xjJ e [ConjxJ exaustiva

|Adj:fsJ e [Conj:e| a |Art:deffsJ unidade |N:i':s| de [Prepfde]anlise |N:fs| ,

a

|Art:deffs[ zona |N:f:s| urbana [Adj:f:s| homognea |Adj:f s|. responde |\':cj|

340

satisfatoriamente "uh | |Prep2:a:fs] abordagem |N:l:s] do |Prep2:do:nr.s|

crescimento [N:nrs] urbano [Adf.ims] das [Prep2:das:f:pl] perifenas |N:i:pl]. Contudo

[Coni] . a 1 \n:def:f:s[ fase |N:f:sJ de [Prepl :dc| fotointerpreta9o [N:l:s] combinada

f\dj:fs| [PP-f>| ( interpretaco | Vf:s| comparativa [Adi:f:s| de |Prepl:de| fotografia

|N:f:s| area |Adj:f:s| vertical |AJj:2gen:s| de |Prcpl:de)datas |N:f:pl| diferentes

|-\di ^er-pli )"'V:ci] muito | Adv| [Pro:rindcf:m:s| morosa |Adj:f:s|e [Conjxj no

|Ad\ | evita |Vxj| a |Art:def:f:s] introduco [\:f:s|de [Prepf.deJ subjectividade [VP.sJ

na |Prep2:na:fs| classificaco [Vf:s|das [Prer2:das:f:pl| muta9es |N:f:pl| de

[Prcpl :de] uso |\:m:s| do [Prep2:do:m:s] solo [ Vm:s) . A |A.l:def:fs| utihza9o

[Vfs] dos [Prep2:uos:nrpi] dados |Pp:m:pl] [N:m:pl]de [PrepfdeJ satlite [N:m:s| e

[Conjxj do |Prep2:uo:nrsJ tratamento [N:m:sJ numrico [Adj:m:s] de [Prepl :de|

imagem |N:f s| anula [Y:cj| parcialmente |Ad\ ] os [Art:def:m:pl| |Pron:poss|

[PronxlemJ inconvenientes | AdixgemplJ enunciados [Ppmr.plJ e [ConixJ permite

[V:cjJ respeitar [\':'mt] a [Arrdeffs]noco |N:f:s| de [Prepfde] anlise [Vfs] por

[PrepfporJ zona[N:f:sJ .

. Problema |N:fs]

problema |N:fsJ que [Adv] [Proirrel] se [ConjJ [Promposs] pe [YxjJ [VxjJ o

[Art:def:s]"[Pron:pess:3p:s] [Pron:dem:3p:s] da [Prep2:da:fs] constru9o [Vfs]de

[Prepl :dej um [Ari:indef| mtodo |N:m:s] que [Adv] [Promrel] permita | VxjJ"

simular

[V:inf|"

o |A.i:dcf:s| |Pron:pess:3P:s| |Pron:dem:3p:s| processo |N:m:s| |V:cj|de

[PrepfdeJ fotointerpreta9o |\:fs| analgica |Adj:fs|utilizando [GerJ a [Anxieffs]

teledetec9o [\:f:s| por [Prepl :por] satlite [Vnr.s]. Por |Prepl :por] outro

[Pron:denrm:s| [ProirindefnrsJ lado [NmrsJ ,trata-se de [PrepfdeJ saber [V:in] se

|ConjJ [Pron:poss| os j Arrdefnrpl] [Pron:poss| [ProirdemJ dados |Pp:m:plJ [N:m:pl|

registados [Pp:m:plJ por [Prepfpor]satlite |Vm:s] possibilitam |V:cjl a [An:deffs|

classifica9o ]\:fs| do [Prep2:do:m:s] uso | Vm:s| do |Prep2:do:m:s| solo [N:m:s] em

|Prepfem| meio |Adj:m:s| |Ad\ ] densamente [Advj edificado [AdjmrsJ [Pp:m:s| e

[Conjx] o [Art:defs] [Pron:pess:3p:s| [Pron:dem:3p:s|estudo |\:nrs] diacrnico

[Adj:m:s] das [Prep2:das:fpl] modifica9es [\:fpl]ocorridas [Pp.fplJ [Adj:f:pl] .

aplica9o [N:f sj dos [Prep2:dos:m:plJ mtodos [NmrplJde [Prepfde]

fotointerpreta9o [N:fs| ao |Prep2:ao:m:s| tratamento [N:m:s| dos [Prep2:dos:m:pl|

dados [Pp:m:plJ [N:m:pll de [Prepfde] satlite [Vm.sl [Vxj] possvel [Adj:2gen:s] e

|Conj:eJ frequentemente |Ad\ J eficaz [Adj:2gen:s] atravs_da [l.oc] utiliza9o [N:l:s|

de [PrepfdeJ suporte |N:m:s] em [Prepl:em| papel [NmrsJ . de [PrcPl:de| filme

[N:m:s| ou [Conj:ou| directamente [Adv] do |PrcP2:do:m:s| monitor |N:m:s| da

[Prep2:da:f:sJ esta9o |N:fs'| de [Prepl:dc| tratamento |N:m:s| numrico [AdjmrsJ de

|Prepf.de] imagem [N:fsJ , quer [Yxj] em [Prepl :em| modo [N:m:sJ pancromtico

[ Adimrsj quer [V:ci] em [Prepl :emj composico |N:f:s] colorida [Adj:fsJ [Pp:f:s] . E

importante |Adj':2en:s| referir |V:inf| que |Adv| [PronxelJa | Arrdef f:s| resolu9o

|\:f:sj de [Preplxiei lOmetros |N:m:pl|das [Prep2:da>:f:pl| imagens |N:t:plJ SPOT

[SiglaJ . em [Prepfcmj modo [NamsJ pancromtico [AdjmrsJ . permite [ VxjJ obter

[VanfJ uma [Art:mdef:fs] imagem [N:fs| prxima | Adj:f sj duma [Prep2:duma:i:sJ

btografia |N:f: sj area |Adj:f:s| |Prep2:a:f s] escala [N:fs| aproximada |Pp:1:s]

[Pp:fs| de [Prepl :dc[ 1 : 50 . 000 e [Conjx] at [Adv] [Prepl :at] de [Prepl :de]1 : 30 .

000 A [ \rt:deff:s] fotointerpreta9o |N:fs] [V:cj] desdejogo [focj possvel

[Adj:2cen:s] ( segmenta9o [N:f:s| do [Prep2:do:m:sJ territrio [NmrsJ em [Prepfem]

entidades |N:f:pl| diferentes [Adj:2gcn:pl] , identifica9o [N:fs] das |Prep2:das:f:plJ

341

grandes |Adj:2geu:pl] unidades [N:f:pl] de [Prepl :de] paisagem [N:m:s| ) mas

[Ad\J [Conj] a [An:def:f:sJ subjectividade [N:fs| [VxjJ inevitvel |.\dj:2gemsj .

que [Adv| [ProirrelJ vamos [Y:cj| expor [V:in"| [V:cj] um [ArrindefJ procedimento

|Vm:s| . ainda | Ad\ | experimental |Adj:2gen:s| . que |Adv| |Pron:rel| permite |V:cj'|

reconhecer | V:mf| automaticamente [AdvJ as |An:def:fpl] zonas |\:f plj que [Adv]

[Promrei] mudaram [V'xi'j de [Prepl :de| afectaco [Vfs] utilizando [Ger] a

[ArrdcffsJ combina9o |\:f:sj automtica |.\dj:f:s| de [Prepl :dej ndices [Nmrplj

temticos |Adj:nrPl| calculados [Ppmrpl] a [Art:def:f:s[ partir [V:inf| de |Prepl:de|

dados |Tp:m:pl| |\:m:plj de [Prepl :dc| satlite [\:nrs| de [Prepl :dc'| alta | Adpfs]

resolu9o_espacial [\:f:s| . Consideramos | V :cj J , pois [AdvJ [Conjj . a [Art:dei:l:sj

combina9o ! Vf s| de |Prcpl :de| ndices |\:nrpi| temticos [AdjairplJ como [Adv|

|Conj| um [Art:indef| ensaio |\:nrs| preliminar [Adj:2gen:s| de [Prepfde]"

simula9o

[VfsJ"

do [Prep2:do:m:s] processo [N:nrs| de [Prepfde'] fotointerpreta9o [N:f:s] .

Exclui-se desta |Prep2:desia:fsJ fase [VfsJ a |An:def fsj determina9o [N:fs] do

[Prep2:do:nrsJ sentido [NmrsJ [Pp:m:sJ [AdjmrsJ das |Prep2:das:fpl| modifica9es

[N:f:plJ ( por [PrcpfporJ exemplo |N:m:s| : rea |N:f:s] agrcola [Adj:2gen:s|

habita9o |N:l":s] , rea [N:f:sJ florestal [Adj2gen:sJ rea [N:f: s] industrial

[Adj:2gen:s]....).. Material [Nmrsjtrabalho |N:m:sJ foi | VxjJ desenvolvido [Pp:m:s'| em [Prepl :em] esta9es [N:f:plJ de

[Prepl:de| tratamento [N:m:s| de [Prepfde] imagem |Vf:sJ de [Prepfde] tipo |N:m:sJ

SUN ( SUN 3 / 80 . SUN 3 / 1 10 e [ConjxJ SUN SPARC ) ,em [Prepl xm] ambiente

|\:m:s| UNIX . Para [PrepfparaJ os [ArrdefurplJ [Pron:poss| [ProirdemJ trabalhos

|\:nrpl| de [Prepl :de] tratamento |\:m:s| numrico [Adj:m:s| de | Prcp 1 :dc[ imagem

|\:f:s| . de [Prcp :de| correc9o ;N:f:s| geomtrica |Adj:fs| de |Prepl :de| imagem

[N:f:sj e |Conj:e| de [Prepfde] gesto [Vfs| . tratamento [NmrsJ e [Conjx]

cartografia |N:f:s] dos [Prep2:dos:m:pl| dados |Pp:nrpi] |N:m:plJ geogrficos

|Adj:m:pl| foram | Vxj] utilizados [PpmrplJ os | An:def:m:pl] [Pron:poss| |Pron:dem]

programas [NmrplJ PfANETES , RECAE e [ConjxJ SAYANE , respectivamente

[AdvJ . Estes [Pron:dem:lp:m:pl] programas [Ninrpl] foram | VxjJ desenvolvidos

|Pp:nrpl| integralmente [Adv| no [Prcp2:no:nrs| faboratoire d'

Informatique

Applique ( LIA ) do |Prep2:do:m:s] Institut Fran9ais de [Prepl :de'J Recherche

Scientifique pour le Dveloppement en Coopration- ORSTOM , centro [N:m:s] de

[Prepl :dej Bondy . laboratrio [N'amsJ onde [Ad\ J realizei [VxjJ a [Art:def:fsJ parte

|\:fs| |Y:cjJ de |Prepl:de| tratamento [Vims] numrico [AdjmrsJ de [Prepfde]

imagem [N:fs] .

imagens |N:fpl| seleccionadas [Pp:f:pl] cobrem | Vxj] uma |Ail:indef f.s] rea [N:i':s]

de[Prepfde] 10 Km |N:nrs[ x 10 Km [N:m:s| , rea |N:fs] que [Adv] [Promrel] se

[ConjJ |Pron:poss| situa | Vxj| na |Prep2:na:f:s| periferia |N:f:s| da [Prep2:da:fs|cidade [N:f:s] nova [Adj:fsj de [Prepl :dej Marne la Valle . a | Art.deffs]

[Prompcss:3p:f s| |Pron:dem:3p:f:s] [Prepl :a] NE da [Prep2:da:fs] cidade [N:fs'| de

[PrepfdeJ Paris . e [ConjxJ apresentam |V:ejj os | Aii:def:m:pl| [Pron:possJ [PromdemJ

parmetros |N:m:pl| que [AdvJ [Proirrel| constam |V:cj] no [Prep2:no:nrs] Quadro

[N:nrs] I . Os [Anxlefnrpl] |Pron:poss'| |Pron:demj dados [Pp:m:pl] [N:m:pl| foram

[ Vxj| registados |Pp:m:pl| com [Prepl :com| inclina9o [N:fs| quase [AdvJ vertical

| Adj:2gen:sJ # #"

para [Prepl :para| quaisquer |Promindef:plJ dos [Prcp2:dos:m:plJ

canais | NampIJ considerados [AdjmrplJ [PpmrplJ .

342

almjias II oc| imagens [\:f:pl] enunciadas |Pp:f:pl| foi |Vxi| utilizada |Pp:fs|a

|Ari:dcf:f:s| Carta |N:f:s| dos |Prep2:dos:m:pl| Modos [\:m:pl| de [Prepfde]

Ocupaco |'\:l>| do |PrcP2:do:m:sj Solo |N:m:>| . |!'reP2:a:f:s| eseala ]N:f:s| de

[Prepfdc] 1 : 25000. folha |Vfs j n 18.de |Prenfde| 1982 . elaborada | Adj:f:s]

|Pp:f:s| pelo |Prep2:pelo:m:s| Institut d'

Amnagement et d'

Urbanisme de [Prcpl :de|

la Rgion Ile-de-France . no |Prep2:no:nrsJ mbito | Vims] do [Prep2:do:m:sJ Atlas

|\:nrs| de |Prepl xlej 1'

Occupation du Sol [VrmsJ / Modes d'

Occupation du Sol

| Vimsj ( MOS |Sigla| ) da |Prep2:da:fs| regio |N:f:s| |N:fs| de |Prepl:dc| lle-de-

France . Esta [Promdenrlp:f:s] carta |'N:f:s] serviu [V.cfl de |Prepf.de| base [Vfs]

para [PrepfpaniJ a |Aii:def:f:sJ determina9o |N:::s| da [Prep2:da:f:s| mudan9a [N:f:s]

de [PrepfdeJ afectaco |N:f:sJ das [Prep2:das:f:pl| zonas |N:l':pl| MOS [SiglaJ . Por

|Prcpl :por| zona [\:fs| MOS |Sigla| deve | V:cj | entender-se toda | Adj:f:s| | Adv| a

|Art:dcf:1':s| unidade | Vf:s| mnima [Adj:f:s| de |Prepfde| referencia9o |\:fs]

espacial |Adj:2geirsJ para [PrepfparaJ efeitos |\:nrpl| de [PreplxleJ classifica9o

|\:l':s| da |Prep2:da:f:sJ ocupa9o [N:f:s| do |Prcp2:do:m:s| solo |\:m:sj [Prep2::f:sJ

qual |Pron:rel| tambm |.Ad\ ] esto [Y:cj| associados |Pp:m:pl| dados |Pp:m:pl|

|N:m:pl| de [Prcpfde| natureza [Vf;s| demogrfica |Adj:f:s| e [Conjx] socio-

econmica que | \d\ | [PromrelJ ,no [Prep2:no:nrsJ conjunto [\:nrsj , constituem

[ Vxjj uma |Art:mdef:f:s] base [Vf.sJ de [Prepl :dej dados [Pp:nrpi| [Nairpl]

relacionveis |Adj:2gen:plj .

I - caractersticas |Adj:fpIJ |N:m:pl] das |Prep2:das:f:plJ imagens [N.fplJ e |Conj:eJ

das [Prep2:das:fpl| bandas |N:f:plJ espectrais | Adj:2gemplJ [ Quadro [N:m:sJ ]

Mtodo |N:nrs| .

. 1 . Procedimento |\:m:s| geral |Adj:2gen:sJ .

Quadro |N:nrs| II descrevem-se as [Art:def:f:pl] etapas |N:f:pl| fundamentais

|Adj:2gen:plj do |Prep2:do:m:sJ procedimento |N:m:s| adoptado |Adj:nrs| [Pp:m:sJ .

Esse |Pron:dem:3p:nrsJ procedimento [N:m:s| apoiou-se em |Prepl:cm| dois

(NunrcardJ princpios |N:m:pf| . 0 |An:dcf:s| |Pron:pess:3p:s| |Pron:dem:3p:s|

primeiro | Adj:m:s| | \d\ | |Num:ord| . considera |\ :cj| que |Ad\ I |Promrel| a

|Ari:det':fs| detecco |N:l:s| das |Prep2:das:f:pl| modifica9es |N:f:pl| na |Prep2:na:fs|

ocupa9o |N:fs| do |Prep2:do:m:s| solo |N:m:s| se [ConjJ |Pron:poss| faz |V:cj'|

tomando |Cier| como [AdvJ |Conj] unidade |N:f:s| mnima |Adj:fs| de |Prepl:de|

anlise |N:l':s| a [Art:def:f:s] zona [N:l':s] MOS |Sigla] , o |Art:dcfs| [Pron:pess:3p:s]

|Pron:dcm:3p:s| segundo |Ad\ j [NmrsJ |Num:ord| supe [V:cj| que |Adv| |PromrelJ as

|Art:dcff:pl| muta9es |N:f:plJ procuradas |Pp:f:pl| obrigam |\ :cj| [Prep2::f:s|

generaliza9o |N:f:s| da [Prep2:da:f:s| legenda |\:f:s| e [Conj:c| da [Prep2:da:fs] Carta

|\:f:s] dos [Prep2:dos:m:pl| Modos [\:m:plj de [Prepfde] Ocupa9o |\:fsj do

[Prep2:do:m:s| Solo | Vrmsj .

generaliza9o |N:f:s] da [Prep2:da:fs| legenda [N:f:s|-

passagem |N:fs| de |Prepl:de|

47classes |N:f:pl] a |Art:deffsJ [Pron:pess:3p:f:s| |Pron:dem:3p:f:s| [Prepfa] 12

classes [N:fpl] de |Prepfde] uso [Nmrs] do |Prep2:do:nrs] solo [N:nrs]- baseou-se

no |Prcp2:no:m>| agrupamento |N:m:s| . numa |Prep2:numa:f:s| mesma [Ad\ | [N:f:s]

|Promdcm:f:s| classe |\:t:s| ,dos |Prcp2:dos:m:pl| usos |Vimpl] do |Prep2:do:m:s|

solo |\:m:s| pertencentes [Adj:2gen:plJ [Prep2::fs| mesma |Ad\ | |\:fs]

[Pron:dem:f:s| famlia |\:fs] de [PrcpfdcJ funcionalidades [N:f:pl].

343

Anexo 7

Sequncias extradas com ExtracTerm,

a partir de texto etiquetado desambiguado

Teledetecco |\:f:s| em |Prepl:eml reas IVfPi| [\:f:s- Prepfem V.fpfl

Teledetecco |N:f:s| em [Preplxm] reas |\:fp!| periurbanas |Adj:fpl| ! Vfs

Prepfem Vfpl Adffplj

reas [Vfpfl periurbanas | Adffpl] {Vfpl-

Adj:f:pl!

combina9o|\:f:s|de|Prepl:de|ndices|\:m:pl| ;Vfs Prcpfdc Vimpfl

combina9o |N:f:s| de |Prepl:de'| ndices |N:m:pl'| temticos [AdfrmplJ jVfs

Prepfde-

Vimpl Adj:m:pl|

ndices |N:m:pl| temticos |Adj:m:p!] [N:m:pl * Adjmrpf

nuidanca [Vf.s|de |Prcpfdc]uso[N:m:s| [Vfs-

Prcpfdc VnrsJ

uso |N:m:s| do |Prcp2:do:m:s] solo [N:nrs| [Vims + Prep2:do:nrs-

NmrsJ

imagens [VfplJ digitais [Adj:2gen:plJ [Vfpl-

Adj:2geirpl|

imagens |N:f:pl| digitais |Adj:2gen:plJ Spot [SiglaJ {Vfpl+ Adj:2gen:pl

-

Siglaj

imagens |N:fpl| digitais | Adj:2gen:pl| Spot [Sigla| HRV [Sigla] [N:f:pl + Adj:2gen:pl

+ Sigla-

Sigla!

Spot"[SiglaJ HRY |Sigla| [Sigla- Sigla]

Teledetecco em reas periurbanas : combinaco de ndices temticos para

localizar a mudan9a de uso do solo com recurso s imagens digitais Spot HRV .

manifestaces |N:f.pl| territoriais |Adj:2gcmpl| [N:f:pl-

Adj:2gen:plj

crescimento |N:m:>| das [Prep2:das:fPl| periferias |N:f:pl| |N:m:s;

Prep2:das:fpll

Vfplj

periferias |N:f:pl| urbanas |Adj:f:pl| !N:l:pl+ Adj:f:plj

estatstica |N:fs| descritiva | Adj:f:s| |N:f:s-

Adj:f:sJ

anlise [N:f:sJ de |Prepfdc| dados [PpairplJ [NmrplJ ;N:f:s + Prepfde-

N:m:plj

anlise [N:l':sJ individual [Adj:2gen:s] {N:fs+ Adj:2gen:s|

anlise [N:f:s| individual |Adj:2gen:s] de [Prepl :de| variveis |N:fpl| {N:fs-

Adj:2gen:s- Prcpfdc + N:f:pl]

anlise |N:f:s| de [Prepfdc] variveis [N:f:pl] |N:f:s+ Prepfde + N:f:pl}

anlise [N:f:s] em |Prepl:cm] componentes [N:f:pl] [\l:f:s+ Prepfem-

N:f:pl}

anlise |N:f:s| em |PreplxmJ componentes |N:f:pl| principais |Adj:2gen:pl] !N:f:s-

Prcpfem + N:fpl Adj:2gcn:plJ

componentes |N:f:pfl principais |Adj:2gen:pl| {N:f:pl+ Adj:2gen:pl}

anlise | Vfs) factorial | Adj:2gen:s| {N:fs'-

Adj:2gcn:s

anlise |N:fs| factorial [Adj:2gerrs| de |Prcpl:de| correspondncias [N:f:pl| [N:f:s-

Adj:2gen:s- Prcpfdc N:f:pjclassifica9o |\:f:s| ascendente [AdjxgeirsJ {\:fs

^ Adj:2gen:sJ

unidades |'N:f:pl] territoriais [Adj:2gen:pfl ;N:fpl Adj:2gen:plj

manifesta9es territoriais do crescimento das periferias urbanas tm sido

abundantemente tratadas nas pticas econmica e fmanceira ,social e poltica .

demogrfica e habitacional . fundiria e funcional . As tcnicas e os mtodos

para localizar , descrever e analisar esse crescimento baseiam-se ,sobretudo . na

estatstica descritiva e na anlise de dados ( anlise individual de variveis .

anlise de variveis duas a duas ,anlise em componentcs principais ,

anlise

345

factorial de correspondncias . classifica9o ascendente hierrquica , ete . ) . A

informaco tratada diacronicamente para deduzir . a partir de escalas muito

variadas . as iransformaces que vo ocorrendo em unidades territoriais

defmidas administrativamente ( freguesia . concelho , commune . dparlement .

ln . etc ) .

abordagem |\:!:s estatstica | Adj:fs| |N:f:s Adj:fs!

considera9o [N:f:sl da [Prep2:da:f:s| unidade |N:f:s| |N:f:s- Prep2:da:f:s N:i':s|

unidade |N:f:s| administrativa |Adi:f:s| |N:f:s- -\dj:f:sjunidade |N:l:s| mnima |Adj:fs|unidade |\:f:s| mnima |Adj:f:s] de |Prepi :de| referencia9o |N:f:s| (N:f:s + Adj:f s

-

Prepfde-i N:':sJ

referencia9o |N:f:s| espacial |Adj:2gcn:s| [N:f:s-

Adj:2gen:sJ

diversidade |N:fs| de |Prepfde| situa9es |N:i':pl| |N:f:s+ Prcpfde

-

N:f:plJ

conjunto |\:m:s| completo [AdjmrsJ jN:m:s + Adjams)

conjunto |N:m:sJ completo [AdjmrsJ de [PrepfdeJ variveis [Vfpfl [N:m:s + Adjmrs

+ Prepl:de-N:f:pl!

ocupa9o [N:f:s| fsica [Adj:fs| [N:fs + Adj:f:sj

defini9o [N:f:s| de [PrepfdeJ coroas |N:f:pl| |N:f:s t- Prepl :de -t VfplJ

zonas |N:f:plJ periurbanas [Adj:f:pl] N:l":pl + Adpfpflcaracterizaco |N:f:s| detalhada [Adj:f:s] [Pp:f:s| |N:f:s + Adffsj

detec9o |N:f:s| de jPrcpl:dc| descontinuidades [\:fpl| [\:f:s-

Prcpfdc \:f:pl]

fronteiras [Vfpfl de |Prepl:de| forma [\:fs] [\:fpl Prepfde - N:fsJ

fronteiras | VfplJ de [Prepfde] forma [N:f:s] sistemtica [Adj:fsJ {N:f:pl + Prepl :de*

N:fs+ \dj:fs!forma |\:f:s| sislemtica |Adj:f:s| [N:f:s \di:f:sj

fenmeno |N:nrs| de [PrepfdeJ periurbaniza9o |N:fs| [N:m:s + Prepf.dc N:fsj

abordagem estatistica do fenmeno delicada . Em primeiro lugar porque a

considera9o da unidade administrativa como unidade mnima de referencia9o

espacial esconde a diversidade de situa9es no seu interior . Em segundo lugar .

porque dificilmente se obtm um conjunto completo de variveis ( demogrficas

. socio-econmicas ,de uso e ocupaco fsica do territrio ) que responda em

simultneo defini9o de coroas,sectores ou zonas periurbanas e sua

caracterizac-o detalhada . Os dados , quando existem . so de difcil similaridade

e raramente permitem a detec9o de descontinuidades e de fronteiras de forma

sistemtica ,como exige a reflexo sobre o fenmeno de periurbaniza9o .

representa9o |N:f:s| cartogrfica |Adj:f:s| {N:fs + Adffs}

uso |N:m:s| do |Prcp2:do:m:s| solo |N:m:s| |N:nrs + Prep2:do:nrs + NmrsJ

crescimento |N:m:s| urbano [Adj:m:s| JN;m:s* Adjmrsj

muta9es [N:f:pl| de |Prepl :de] uso |N:nrs| |N:f:pl -i Prepl :de-

N:m:sj

introdu9o |N:f:s| de [Prepfde] dados [PpmrplJ |N:m:pl| {Vfs + Prcpl :dc-

NmrplJdados |Pp:m:pl| [N:m:pfl de |Prepl:de| natureza [N:f:s| N:m:pl

-

Prepfde + N:f:sJ

346

dados |Pp:m:p_] |N:m:pl| de |Prepl:de| natureza |N:f.s| fsica |Adj:f:sJ |N:m:pl

Prepl.de- N:fs-

Adj:f:s!natureza ]N:f:s| fsica [AdffsJ |N:f:s + Adj:f:s;

anlise |N:fs| quantitativa [AdffsJ J Vfs Adffsj

problema [N:f:s| de |Prepl:dc] crescimento [\:nrs| {N:fs Prepfde + Vm:s!

crescimento [N:nrs] das [Prep2:das:f:pfl periferias [VfplJ |N:m:s + Prep2:das:':pl-

Vfpli

periferias [N:f:pl| urbanas | Adj:f:pl] {Vfpl-

Adj:f:pl}

classifcaco e a representa9o cartogrfica do uso do solo e da sua evoluco

permitem abordar o crescimento urbano segundo uma ptica fsico-funcional . 0

ciculo,a partir de cartas . das mutaces de uso e da rea ocupada por cada uso ,

possibilita a introdu9o de dados de natureza fsica na anlise quantitativa do

problema de crescimento das periferias urbanas .

realizaco |N:f:s] de [Prepl :dej cartas [VfplJ |N:f:s-

Prepl :de-

Vfpl)

cartas [N:fplJ de [PrepfdeJ uso [N:m:s| N:l':pl + Prepfde + Vimsj

uso |Vm:s| do [Prep2:do:m:sJ solo |N:m:s| !\:nrs-

Prep2:do:nrs-

Nmrs;

evolu9o [N:fs| de [Prcpfde] uso |N:m:s| {Vfs-

Prepfde N:m:sj

uso [N:m:s] do [Prep2:do:nrs] solo [N:nrs] {N:nrs + Prep2:do:nrs-

N:m:s[

interpreta9o [N:f:sJ estereoscpica [AdffsJ [N:f s + Adj:f:s|

interpretaeo |N:fsJ estereoscpica |Adj:f:sJ de [PrepfdcJ fotografa [VfsJ ! N:f:s*

Adj:f:s- Prepfde + N:f:s)

fotografia [N:f:s] area [Adj:f:s] [N:f:s + Adrfs)

fotografia [N:f:sj area | Adffs] vertical |.-\dj:2gcn:sj JN:f:s -r Adj:f s-

Adj:2gen:s!

cartas [N:f:pl] temticas [Adj:f:pfl jVfpl-

Adj:f:pl|

uso [Nmrs] [V:cj| do [Prep2:do:m:s] solo |N:m:sJ |N:m:s-

Prep2:do:m:s + Vnrs}

Carta|N:f:sJde [Prepfde| Uso [N:m:s| N:f:s + Prepfde + N:m:sJ

Uso |N:m:s| do [Prep2:do:nrsJ Solo |\:m:s| !\:nrs- Prep2:do:m:s+ N'mrs;

Carta [Vfs] de [Prepl :dej Evolu9o [N:fsJ ; Vf.s + Prepl :de N:f:sj

Evolu9o [N:f:s| de |Prepl :de| Uso |N:m:s| :N:f:s + Prepfde-

N:m:sJ

Uso |N:m:sj do [Prcp2:do:nrs| Solo |N:m:s| [N':m:s-

Prep2:do:m:s-

Nmrsj

quantifica9o |N:f:s] das [Prep2:das:fpl| cartas |N:f:pl.| N:f:s + Prep2:das:f:pl +

N:fp]Jrea [N:f:s] das [Prep2:das:':pfl zonas [Vfpl] | N:i':s

-

Prep2:das:fpl + N:f:pl !

anl i se [N : f: sj quantitativa [Adj : f : sj { N : f: s + Adj :f:s }

destas duas hipteses conclumos em 1989 a primeira etapa de um trabalho que

teve por objectivo a defini9o duma metodologia para a realiza9o de cartas de

uso do soo e de evolu9o de uso do solo . por interpreta9o estereoscpica de

fotografa area vertical . 0 resultado fnal constitudo por duas cartas

temticas do Concelho de Almada . onde est representado o uso do solo em

1 986 ( Carta de Uso do Solo ) e a sua evolu9o entre 1 967 e 1 986 ( Carta de

Evoluco de Uso do Solo ) . segundo uma legenda em 12 classes . A

quantifica9o das cartas permitiu apurar a rea ocupada por cada uso em 1986 e

347

a rea das zonas que sofreram modifca9o enlre 1967 e 1986 . Posteriormente

procedeu-se anlise quantitativa das transforma9es ocorridasem 20 anos .

uso | Vm.si |\ xj| do |Prep2:do:m:s| solo | Vm:s| ;N:m:s- Prcp2:do:m:s

-

N:m:s}

interpreta9o |N:f:sJ de [Prepi xiej fotografia |N:fsj {N:fs-

Prepl :de-

N:t:s

interpretaco |N:f:s| de |Prcpl:dc| fotografia IVf.s] area [Adj:f:s| ! Vfs + Prepfde

N:fs~

Adj:f:s|

fbtografia [N:fs| area [Adr.fsJ {Vfs t Adj:l':s!

unidade |Vf:sJ de [PrcpfdeJ anlise [N:l:s| {Vf.s-

Prepl :dc-

N:t:s

zona |N:fs| urbana |Adj:f:s| ;N:f:s-

Adffsj

zona | N:fs] urbana | AdrfsJ homognea |Adj:f:sJ {Vfs+ Adj:f:s * Adj:fs}

abordagem [Vf s| do [Prep2:do:m:sJ crescimento [N'mrsJ !Vfs + PreP2:do:m:s +

VrmsJ

crescimento |N:m:s| urbano |Adj:m:sJ [Vims-

Adj:m:s]

fase [N:f:s| de [Prepl ;dej fotointerpreta9o [N:f:s'| '.Vfs + Prepl :de + VfsJ

fase [ V.fsJ de [Prepl :dej fotointerpreta9o | Vfs] combinada [AdffsJ |Pp:l: sj {Vf s-

Prepfde- Vfs- \di:fs)

folointerpretaco | Vfs, combinada |Adj:f:>| |Pp:f: s|'N:l:s

~

Adj:i:s!

interpreta9o |N:f:s| comparativa [Adj:f:s| [N:f:s+ Adj:f: s)

interpreta9o |N:fsJ comparativa [Adj:f:s] de [Prepl :de] fotografia [N:l:s| !N:i:s+

Adj:fs- Prepl:de+ N:f:s{

fbtografia |N:fs| area [Adj:f:s'| {N:f:s + Adj:f:sj

fotografia[N:f:s|area|Adj:fs]vertical[Adj:2gcn:s| |N:f:s* Adj:1:s

~

Ad,:2gen:s!

datas |\:f:plj diterentes |Adi:2gen:pl| N:f:pl+ Adj:2gen:plj

introdu9o [\:fsj de [Prepfdej subjectividade [VfsJ {N:fs-

Prepl :de-

N:t:s}

classifica9o |N:fs| das |Prep2:das:fpl] muta9es |N:f:plJ [N:f:s + Prep2:das::Pl-

N:fplj

muta9oes [N:fpfl de [Prepl :de] uso [N:m:s] { Vfpl + Prepl :de-

Nmrs,-

uso |N:m:s] do [Prep2:do:m:sJ solo |N:m:sJ [N:m:s + Prep2:do:m:s + Nmrsj

utiliza9o [N:fs| dos [PreP2:dosmrpl| dados |Pp:m:pl| [Nmrpl];N:f:s +

Prep2:dos:m:pl+ N:m:pl;

dados [Ppmrpl] [VimplJ de [PrepfdeJsatlite [N:m:s| [Vnrpl

> Prepfde-

N:m:s!

tratamento [N:m:s| numrico |Adj:nrs| jN:nrs -5 AdjamsJ

tratamento |N:m:s| numrico |Adj:m:s| de [Prepfdc] imagem |N:fs] [Nmrs + Adj:m:s

r Prcpf.de + N:fsJ

no9o [N:fs| de [Prepfde] anlise [N:fs] !N:f:s + Prepf.de-

Vl:s}

informa9o obtida sobre o uso do solo . por segmentaco e interpreta9o de

fotoerafia area . extraordinariamente precisa e exaustiva e a unidade de

anlise . a zona urbana homognea . responde satisfatoriamente abordagem do

crescimento urbano das periferias . Contudo ,a fase de fotointerpretaco

combinada ( interpreta9o comparativa de fotografia area verticalde datas

diferentes ) muito morosa e no evita a introdu9o de subjectividade na

classifica9o das mutaces de uso do solo . A utiliza9o dos dados de satlite e

do tratamento numrico de imagem anula parcialmente os inconvenientes

348

enunciados e permite respeitar a noco de anlise por zona .

. Problema

processo [N:m:s| [ V:cj| de [Prepl :c\ fotointerpreta9o |N:f:s| [\:m:s Prepfde t

processo |\:m:s| |V:cjJ de jPrcPl:de| fotointerpretaco |N:f:sJ analgica [Adffsj

;N:nrs-

Prepl :de- Vf.s

-

Adff.s}

fotointerpreta9o |\:f:sj analgica [Adj:fs'| {N:f;s-

Adj:f:sj

classificaco [VfsJ do [Prep2:do:nrs] uso |VimsJ [N:f:s-

Prep2:do:m:s -Nmr.s!

uso [N:m:s] do [Prep2:do:m:sJ solo [N:m:s] |N:m:s-

Prep2:do:nrs-

N:m:sJ

estudo |Vm:s| diacrnico [Adjmr.s] {N:m:s+ Adj:m:sJ

modifica9es [N:f:pl] ocorridas [Pp:f:pl] [Adj:fpfl {N:fpl-

Adpfplj

problema que se pe o da construco de um mtodo que permita"

simular"

o

processo de fotointerpreta9o analgica utilizando a teledetec9o por satlite .

Por outro lado . trata-se de saber se os dados registados por satlite possibilitam

a classifica9o do uso do solo em meio densamente edificado e o estudo

diacrnico das modifica9es ocorridas .

349

Anexo 8

Texto etiquetado com ExtracTerm,

a partir de novo corpus, com aplicaco de regras de desambiguaco

Captulo [N.m.s] 1 - A [Artdeffs] radiaco [Nf s] electromagntica Introduco

aquisigo [N:fsJ de [Prepl :de] imagens [Nfpl] por [Prepl :por]Detecco [Nfs]

Remota [Adj:f:sJ ( DR ) baseia-se no [Prep2:no:m:s] facto [N:m:s] de [Prep1.de]

os [ArfdefrmplJ [Pron:possJ [Pron.dem] objectos [N:m:pl]da [Prep2:da:f:s]

superfcie [N:f:sJ terrestre [Adj:2gen:s] reflectirem radiaco_electromagntica

[N:f:s] ( REM [SiglaJ ) proveniente [Adj:2gen:s] do [Prep2:do:m:s] Sol [N:m:s] e

[Conj:e] emitirem eles [Pron:pess:3p:m:pl] prprios [Adj:m:pl] REM [Sigla] . A

[Art:def:f:s] intensidade [N:f:s] e [Conj:eJ composico [N:f:sJ espectral

[Adj:2gen:s] da [Prep2:da:f:s] REM [Sigla] emitida [Adj:f:s] [Pp:f:s] assim_como

[Loc] a [Art:def:f:s] percentagem [N:f:s] de [Prep1:deJ REM [SiglaJ reflectida

[Pp:f:s] [Adj:fs] dependem [V:cj] das [Prep2:das:f:pl] caractersticas [N:m:pl]

fsicas [Adj:f:pl] e [Conj:e] quimicas [Adj.fpl] [N:f:pl] do [Prep2:do:m:s] objecto

[N:m:s] . Assim [Adv] , [Vcj] possvel [Adj:2gen:s] inferir [V:inf] das

[Prep2.das:f pl] caracteristicas [N:m:pl]fsicas [Adjf.pl] e [Conj:e] qumicas

[Adj:f:pl] [N:f:pl] de [Prepfde] objectos [N:m:pl] [Prep2::f:s] superfcie [N:f:s]

da [Prep2:da:f:s] Terra [N:f:s] atravs [Adv] da [Prep2:da:f:s] REM [Sigla]

proveniente [Adj:2gen:s] desses [Prep2:desses:m:pl] objectos [N:m:pl] e

[Conj.e] registada [Pp:f:s] [Adj:f.sJ por [Prepl.porJ sensores [N:m:pl]a

[Arfdeffs] bordo [N:m:s] de [Prep1:deJ satlites [N:m:plJ artificiais [Adj:2gen:pl]

da [Prep2:da:f:s] Terra [N:f:s] , designados [Adj:m:pl] [Adj:m:pl] satlites [N:m:pi]

de [Prepfde] Detecco [N:f:s] Remota [Adj:f:sj .

Propagaco [N:f:s] da [Prep2:da:f:s] Radiago [N:f:sJ Electromagntica A REM

[Sigla] propaga-se atravs_do [Loc] espago [N:m:s] sem [Prep1:sem] suporte

[N:m:s] matenal [N:m:s] e [Conj:e] s [AdjJ [V:q] observvel [Adj:2gen:s]

atravs_dos [Loc] efeitos [N:m:pl] que [Adv] [Pron:rel] provoca [V:cjJ . Apresenta

[V:cj] propriedades [N:f:pl] ondulatrias [Adj:f:pl] quando [AdvJ [Conj] se [Conj]

[Pron:poss] propaga [V:cj] no [Prep2:no:m:s] espago [N:m:sJ e [Conj.eJ quando

[AdvJ [ConjJ interage com [Prep1:com] a [Arfdeffs] matria [N:f:sJ a [Prepfa]

uma [Art:indef:f:s] escala [N:f:s] macroscpica [Adj:f:s] [Adj:f:s] e [Conj:eJ

apresenta [V:cj] propriedades [N:f:pl] corpusculares quando [Adv] [Conj]

interage com [Prep1:comJ a [Art:def:f:s] matria [N:f:s] a [Prep1:a] uma

[ArfindeffsJ escala [N:f:sJ atmica [Adj:f:s] .

fenmenos [N:m:pl] de [Prep1:de] interferncia [N:f:s] e [Conj:e] difracgo [N.fs]

explicam-se atravs_da [Loc] teoria [N:f s] ondulatria [Adj:f:s] , proposta [N:f.s]

[Pp:f:s] pelo [Prep2:pelo:m:s] fsico [Adj:m:s] britnico James C . Maxwell ; este

[Pron:dem:1p:m:s] elaborou uma [Arfindef f:sj formulago matemtica [N:f:sJ

para [Prep1:para] os [Art:def:m:plJ [Pron:poss] [Promdem]fenmenos [N:m:pl]

elctricos [Adj:m:plJ e [Conj:eJ magnticos [Adj:m:plJ que [AdvJ [Pron:rel] postula

que [Adv] [Pronrel] a [Arf.deffs] [Pron:pess:3p:f:s] [Pron:dem:3p:f:s] [Prepfa]

REM [Siga] [V:cjJ a [Art:def:f:s] manifestago [NfsJ da [Prep2:da:f:sJ

existncia [N:f:s] de [Prepl :de] dois [Num;card] campos [N:m:pl]de [Prepl :de]

forgas [N:f:pl] ( elctrico [Adj:m:s] e [Conj:e] magntico [Adj:m:s] ) , conjugados

[AdjmplJ [Pp:m:plJ ; a [Art:def:f:s] [Pron:pess:3p:f:sJ [Pron:dem:3p:f:sJ [PrepT.a]

REM [Sigla] [VcjJ gerada [Pp:f:s] quando [Adv] [Conj] se [Conj] [Pron.poss]

produzem [V:cj] variages [N:f:pl] na [Prep2:na:f:s] intensidade [N:f:s] ou

[Conj:ouJ direcgo [N:f:sJ de [Prepl :de] qualquer [Pronandef]dos

[Prep2:dos:m:plJ campos [N:m:plJ de [Prepl :dej forgas [N:fpl] presentes

[Adj:2gen:pl] e [Conj:e] propaga-se na [Prep2:na:f:s] forma [N:f sj de [Prep1:de]

351

duas [Numxard] ondas [N.fpl)sinusoidais [Adj:2gen:pl] ,

em [Prepem] fase

[N f s] ,situadas [Pp pl) [Adj:f:pl] em [Prepl em] dois [Num:card] planos

[Adjmpl] [N m:pl] ortogonais [Adj:2gen:pl] ,como [Adv] [Conj] se [Conj]

[Pron poss] apresenta [V:q] na [Prep2:na:f:s] figura [N:f:s] 1 1 .

outro [Pron denrm.s] [Pron ,ndefm.s]lado [N m:s] ,

outros [Pron:dem:m:pl]

[Pron ,ndefm:pl] fenmenos [N:m:pl] ,tais [Ad,:pl] [Promdempl] como [Adv]

Conj] o [Artdefs] [Pron:pess:3p:s] [Pron:dem:3p:s]efeito [N:m.s] fotoeednoo

explicam-se atravs.da [Loc] teoria [N:f:s] corpuscular , proposta [N.f s [Pp.f.s]

por [Preprpor] Max Planck [Np] , que [Adv] [Pron:rel] postula que [Adv]

[Pron-rel] a [Art:deffs] [Pron:pess:3p:f:s] [Pron:dem:3p:fs][Prep1:a] REM

[Siqlal [V cj] constituida [Ppfs] por [Prep1:por] corpsculos [N:m:pl]

designados [Adjmpl] [Adj:m:pl]fotes [N:f:pl] cuja [Pron:rel:f:s] quantidade

INfs] de [Prepl de] energia [N:f s] ( Q ) [Vcj] directamente [Adv] proporcional

[Adj:2gen.s] [Prep2::f:s] frequncia [N f s] ( f ) da [Prep2:da f:s] onda [N:f:s]

de [Preplde] propagago [N:f:s] :

[ Frmula [N:f s] ] ,

h = 6 626 x 10-34 Joules [V:cj] designada [Pp:fs] por [Prep1:por]constante

[Adil [N fs] de [Preplde] Planck [Np] . Em [Preplem] Detecco [Nf.s] Remota

lAdi f sl analisam-se os [Arfdefm:pl] [Pron:poss] [Pron:dem]fenomenos

N-m-pll 'de [Preprde] propaga?o [N:f:s] da [Prep2:da:f:s] REM [Sigla] a

[Prep2 f s] luz [N:f:s] da [Prep2:da:f s] teoria [N:f s] ondulatna [Adj:f:s] e

[Coni-el os [Art:def:m:pl] [Pron:poss] [Pron:dem]fenmenos [N:m:pl] de

PrepVde] interacpo [Nfs] da [Prep2:da:fs] radiapo [N:f:s] com [Prep1:com]

a [Art def f s] matria [N:f s] [Prep2::f s] luz [N:f:s] da [Prep2:da:f:s]teoria

[N f s] corpuscular . As [Art:def:f: pl] alterapes [N:f:pl] que [Adv] [Pron:rel] a

Art def f s] energia [N:f:s] electromagntica [Adj.f s] provoca [V.cj] quando [Adv]

Conj] interage com [Prep1:com] um [Artindef] corpo [N:m:s] explicam-se pela

[Prep2 pela fs] transferncia [N:fs] da [Prep2:da:f s] energia [N:f s]

transportada [Ppf:s] pelos [Prep2:pelos:m:pl]fotes [N:f:pl] para [Prepfpara]

os [Art.defm:pl] [Pron:poss[ [Promdem]tomos [N:m:pl] desse

[Prep2 desse:m:s] corpo [N:m:s]

prmcipais [Adj:2gen pl] sensores [N:m:pl] em [Prepl :em] operacao [N:f s] que

[Adv] [Pron-rel] registam [Vcj] informa9o [Nf.s] para [Preplpara] o [Art:defs]

(Pron pess 3p s] [Pron:dem:3p:s] desenvolvimento [N:m:s] de [Prep1:de]

aplicaces [N:f:pl] no [Prep2:no:m:s] mbito [N:m:s] da [Prep2:da:f s] avaliago

[N-f-s] dos [Prep2:dos:m:pl] recursos [N:m:pl]naturais [Adj:2gen:pl] sao [V:cj]

sensores [N:m:pl] pticos [Adj:m:pl] que [Adv] [Pron:rel] registam [Vcj] a

[Art deff s] [Pron:pess:3p:f:s] [Pron:dem:3p:fs] [Prep1:a]REM [Sigla] reflectida

Pp-fsl [Adi-fs] ou [Conj:ou] emitida [Adj f:s] [Pp:f:s] pela [Prep2:pela:f:s]

superfcie [N:f:s] terrestre [Adj:2gen:s] ou [Conj:ou] dispositivos [N:m :pfl de

[Prepl de] microondas [N:m:pl] designados [Adjm.pl] [Adj:m:pl]RADAR [N:m:s]

RAdio Detection And Ranging ) . Este [Pron:dem:1p:m:s] captulo [N:m:s] vai

Vcil descrever [V:inf] os [Art:def:m:pl] [Pron:poss] [Pron:dem] processos

N m pl] subjacentes [Prep2::f:s] aquisico [N:f:s] de [Preplde] imagens

[N-fpll por [Prepl por] sensores [N:m:pl] pticos [Adj:m:pl] ,sensiveis

Adi 2gen pl] s [Prep2:as:s:pl] bandas [N;f pl] em [Prep1:em] que [Adv]

Pron rel] se [Conj] [Pron:poss] propaga [V:cj] a [Art:def:f:s] [Pron:pess.3p:f:s]

Pron dem 3p f:s] [Prepfa] REM [Sigla] Solar [Adj:2gen:s] que [Adv] [Pron:rel]

352

se [Conj] [Pron:poss] reflecte [V:cjJ na [Prep2:na f.s] superfcie [N:f:s] terrestre

[Adj:2gen:sJ .

Espectro [N:m:s] Electromagntico [Adj:m:s]

ondas_electromagnticas [N:f:pl] propagam-se ,no [Prep2:no:m:s] vcuo

[Adj:m:s] , [Prep2::f:s] velocidade [N:f:sJ da [Prep2:da:f:sJ luz [N:f:sJ ( c=

299792458 m / s ) e [Conj:e] com [Prepl :com] uma [Art:indef:f:s] frequncia

[N:f:sJ ( f ) e [Conj.eJ um [Arf.indef] comprimento [N.nr.s] de [Prep1:de] onda

[N:f:sJ ( ( ) tais [Adj:plJ [Pron.dem.pl] que [Adv] [Pron:rel] :

[Frmula[N:f:s]]frequncia [N:f:sJ e [Conj.eJ o [Art:def:s] [Pron:pess:3p:sJ [Pron:dem:3p:s]

comprimento [N:m:sJ de [Prep1:deJ onda [N:fs] estabelecem [V:cj] a [Art:def:f.s]

forma [N:f:s] da [Prep2:da:f:s] onda [N:f:s] electromagntica [Adj:f:s] e [Conj:eJ

esta [Pron:dem:1p:f:s] est [V:cj] relacionada [Pp:f:s] com [Prep1:com] a

[Art deffs] quantidade [N:f:s] de [Prep1:de] energia [N:f:s] transportada [Pp:f:s]

[Adj:f:s] atravs_da [Loc] expresso [N:f:s] [N:f:sJ que [AdvJ [Pron:rel] se [Conj]

[PrompossJ obtm [V:cj] resolvendo [Ger] ( 1 . 2 ) em [Prepl :em] ordem [N:f:s] a

[Arfdeff s] [Pron:pess:3p:f:s] [Pron:dem:3p:f:s] [Prepl :ajf e [Conj.e]

substituindo [Ger] em [Prepl :em] (1.1):

[ Frmula [N:f:s] ]

assim_que [LocJ a [Art:def:f:s] quantidade [N:f:s] de [Prep1:de] energia [N:f:s]

transportada [Pp:f:sJ pela [Prep2:pela:f:s] onda [N:f.s] electromagntica [Adj:f:s]

[V:cj] inversamente [Adv] proporcional [Adj:2gen:s] ao [Prep2:ao:m:s]

comprimento [N m.s] de [Prepfde] onda [N:f:s] . Este [Pron.dem:1p:m:s] efeito

[N:m:s] [V:cjJ responsvel [Adj:2gen:sJ pelo [Prep2:pelo:m:s] facto [N:m:sJ de

[Prep1:de] sensores [Nm.pl] que [Adv] [Promre!] funcionam [V.cj] em

[Prepl :em] bandas [N:f:plJ de [Prep1.de] comprimento [N:m:s] de [Prepl :dej

onda [N:fsJ maiores [Adj:2gen:pl] ,como [AdvJ [Conj] por [Prep1:porJ exemplo

[N m:sj as [Art:def:f:plJ bandas [N:f:pl] trmicas [Adj:f:pl] do [Prep2:do:m:sJ

satlite [N:m:s] Landsat [Sigla] ,terem [V:cjJ de [Prep1:de] registar [V:inf] a

[Art:def:f:s] [Pron:pess:3p:f:s] [Pron:dem:3p:f:s] [Prep1:a]REM [Sigla] de

[Prepl :de] um [Art:indef] elemento [N:m:s] de [Prepl :de] terreno [N:m:s] de

[Prep1:de] maiores [Adj:2gen:plJ dimenses [N.fplJ , para [Prep1:para] que

[AdvJ [Pron:relJ a [Art:def:f:s] quantidade [N:f:sJ de [Prepl :de] energia [N:f:s] que

[AdvJ [Pron:rei] chega [V.cjJ ao [Prep2:ao:m:s] sensor [N:m:s] seja [V:cj]

detectvel [Adj:2gen:s] . Por [Prep1:por] outro [Pron:dem:m:s] [Pron:indefm:s]

lado [N.m s] explica [V:cjJ tambm [AdvJ o [Artdefs] [Pron:pess:3p:sJ

[Pron:dem:3p:sJ facto [N:m:sJ de [Prep1.de] os [Arfdefm:pl] [Pron:poss]

[Pron:dem] sensores [N:m:pl] de [Prep1.de] alta [Adj:f:sJ resolugo_espacial

[N:f:s] ( que [Adv] [Pron:rel] detectam [V:q] a [Art:def:fs] [Pron:pess:3p:f:s]

[Pron:dem:3p:f:sJ [Prep1:aJ REM [SiglaJ que [Adv] [Pron:rel] parte [N:f:s] [V:cjJ

de [Prep1:deJ elementos [N:m:pl] de [Prep1:de] terreno [N:m:s] de [Prep1:de]

pequenas [Adj:fpl] dimenses [N.fplj ) ficarem limitados [Pp:m:plJ [Adj:m:pl] a

[Arfdeffs] comprimentos [N:m:pl] de [Prepfde]onda [N:fs] mais [Adj] [Adv]

[Pron:indef] baixos [Adj:m:pl] como [Adv] [Conj] as [Art:def:f:plJ bandas [N:f:pl]

do [Prep2:do:m:sJ visvel [Adj:2gen:sJ e [Conj:e]infravermelho [Adj:m:s] [N:m:sJ

proximo [Adj:m:s] .

REM [SiglaJ [V:q] classificada [Pp:f:s] em [Prep1:em] fungo [N:f:s] da

[Prep2:da:fsJ sua [Pron:poss:3p:f:s] frequncia [N:f:s] ( da [Prep2:da:f:s] sua

353

[Pron poss-3p:f:s] quantidade [N.fs] de [Prepl :de] energta [N.f.s] ) por

[Preptpor] intermdio [Adj:m:s] do [Prep2:do:m:s] espectro [N:m:s]

electromagntico [Adj:m:s] que [Adv] [Pron:rel] consiste [V:cj] numa

[Prep2numaf s] escala [N:f:s] de [Prepl :de] frequncias [Nt.pl] , cujos

[Pronrelm-.pl] intervalos [N:m:pl] so [V:cj] designados [Adj:m:plJ [Adj:m:pi]

bandas [N:f:pl] espectrais [Adj:2gen:pl] Fig1 . 2 - Espectro [N:m:s]

Electromagntico [Adj:m:s]

sensores [N m:pi] multiespectrais [Adj:2gen:pl] de [Prep1:de]REM [Sigla]

colocados [Adj:m:pl] [Pp:m:pl] em [Prepl em] plataformas [N.fpl] espactais

[Adj 2gen pl] so [V.cj] concebidos [Pp:m:pl] para [Prepl :para] adquinr [V'.infJ

mformago [N:fs] em [Prep1:em] bandas [N:f:pl] muito [Adv] [Pron:mdef:m:s]

estreitas [Adj:f:pl] do [Prep2:do:m:s] espectro [N:m:s] electromagnetico

[Adjm-s] . A [Arfdeffs] localizago [N:f:s] destas [Prep2:destas:f:pl] bandas

[Nfpl] est [V:cj] condicionada [Pp:f:s] s [Prep2:s:s:pl] zonas [N.f.pl] do

[Prep2 dom s] espectro [N:m:s] , designadas [Adj.fpl] [Pp:f:pl] por [Prept.por]

janelas [N:f:pl] espectrais [Adj:2gen:pl] ,em [Prep1:em] que [Adv] [Promrel] a

[Arfdeffsj atmosfera [N:f:sJ deixa [V:cj] passar [V:inf] a [Artdeffs]

[Pron:pess:3p:f:s] [Pron:dem:3p:f:s] [Prep1:a]REM [Sigla] proveniente

[Adj'2gen:s] do [Prep2:do:m:s) Sol [N:m:s]e [Conj:e] quelas

[Prep2:quelas:f:pl] zonas [N:f:pl] em [Prepl :em] que [Adv] [Pron:rel] a

[Arfdeffs] Terra [N:f s] emite [V:cj] REM [Sigla] .

banda [N:f:s] de [Prep1:de] rdio [N:f:s] [N:m:s] cobre [V:cj] a [Art.deffs] regiao

[Nfs] [Nfs] dos [Prep2:dos:m:pl] comprimentos [N:m:pl] de [Prep1:de] onda

[Nfs] supenores [Adj:2gen:plJa [Art:def:f:s] [Pron:pess:3p:f:s] [Pron:dem:3p:f:s]

[Prepta] 10 cm ; esta [Pron:dem:1p:f:s] banda [N:fs] [V:cj] utilizada [Pp:f:s] ,

principalmente [AdvJ , por [Prep1:por] sensores [N:m:pl] de [Prep1:de] rdio

[N f s] [Nms] activos [Adj:m:pl] como [Adv] [Conj] os [Art:def:m:pl] [Pron:poss]

[Prondem] dispositivos [N:m:pl] de [Prepl :de] RADAR [N:m:s] de [Prepl :de]

imagem [N:f:s] ,os [Art:def:m:pl] [Pron.poss] [Pron:dem] altmetros

e [Conj:e] os

[Arfdefm.pl] [Promposs] [Pron:dem]sonares . A [Arfdeffs] banda [N:f:s] das

[Prep2:das:f:plJ microondas [N:m:pl] cobre [V:cj] a [ArtdeffsJ regio [N:f:s]

[Nf sj adjacente [Adj:2gen:s] quela [Prep2:quela:f:s] , at_ao [Loc]

comprimento [N:m:s] de [Preptde] onda [N:fs] de [Preptde] 1mm ; [V:q]

utilizada [Pp:f:s] por [PreptporJ radimetros [N:m:plJ de [Prep1.de] microondas

[Nm.pl] , espectmetros [N:m:pl] e [Conj:e] sistemas [N:m:pl] de [Preptde]

RADAR [N:m:s] . A [ArfdeffsJ banda [N:f:s] dos [Prep2:dos:m:pl]

infravermelhos [N:m:pl] cobre [V:cj] a [Arfdeffs] regio [N:f:s] [N:f:s] espectral

[Adj'2gens] desde [PreptdesdeJo [Artdefs] [Pron:pess:3p:sJ [Pron:dem:3p:s]

comprimento [N:m:s] de [Preptde] onda [N:f:sJ de [Prep1.de] 1mm at [Adv]

[Preptat] 0 . 7 ( m : esta [Pron:dem:1p:fs] regio [N:f:s] [N:f:sJ [V:cj]

subdividida [Pp:f:s] em [Preptem] sub-regies designadas [Adj:f:pl] [Pp:f:pl]

infra- vermelho [Adj:m:s] longnquo [Adj:m:s] ,infravermelho [Adj:m:s] [N:m:sJ

trmico [Adj:m:sJ e [Conj:e] infravermelho [Adj:m:s] [N:m:s] prximo [Adj:m:s] .

Nestas [Prep2:nestas:f:pl] bandas [N:f:pl] utilizam-se muitos [Adv]

[Pron:.ndef:m:pl] sistemas [N:m:pi] de [Preptde] imagem [N:fs] : espectro-

radimetros ,radimetros [N:m:pl] , polarmetros e [Conj:e] lasers . Estes

[Pron demip:m:plj sistemas [N:m:plJ tambm [Adv] so [V:cj] utilizados

[Ppmpl] na [Prep2:na:f:s] banda [N:f:s] do [Prep2:do:m:s] visvel [Adj:2gen:s] ,

354

de [Preptde] 0.4(m-0.7(m.As [Art:def:f:pl] bandas [N + pl] dos

[Prep2:dos:m:plJ ultravioletas [Adj:2gen:pl] . dos [Prep2:dos:m:pl] raios [N:m:pl]

x e [Conj:e] dos [Prep2:dos:m:pi] raios [N:m:pl] gama [N:m:s] no [Adv] so

[V:cjJ muito [Adv: [Pron:mdef:m:sJ utilizadas [Pp:f:pl] [Adj:f:pl] em [Prept.em] DR

por_causa_da [LocJ opacidade dos [Prep2:dos:m:pl] gases [N:m:pl]

atmosfricos [Adj:m:pl] em [Preptem] relago [N:fs] [Prep2::f:sJ REM

[SiglaJ proveniente [Adj:2gen:sJ do [Prep2:do:m:s] Sol [N:m:s] ,nestes

[Prep2:nestes:m:pl] comprimentos [N:m:pl] de [Prept.de] onda [N:f:s]

e [Conj:e] Definigo [N:fs] das [Prep2:das:f:pl] Grandezas [N:f:pl]

Radiomtricas [Adj:f:pl] .

neste [Prep2:neste:m:s] pargrafo [N:m:s] algumas [PromindeffplJ grandezas

[N:f:pl] radiomtricas [Adj:f:pl] utilizadas [Pp f pl] para [Preptpara] caracterizar

[V:inf] a [Arfdef f s] [Pron:pess:3p f:s] [Pron:dem:3p:f:s] [Prepl :a] REM [Sigla] e

[Conj:e] a [Art:def:f:s] [Pron;pess:3p:fs] [Pron:dem:3p:f:s] [Prepta] sua

[Pron:poss:3p:fs] interacgo [N:fs] com [Preptcom] a [Arfdeffs] matria

[N+s] , cuja [Pron:rel:f:s] sntese [N:f:s] se [Conj] [Pron:poss] apresenta [VxjJ

no [Prep2:no:m:sJ quadro [N:m:sJ 1.1.

Radiante [Adj:2gen:s] : a [Arfdeff s] energia [N+s] radiante [Adj:2gen:s] [V:cj]

a [At+deffs] quantidade [N:f:s] de [Preptde] energia [N:f:sJ transportada

[Pp:fs] pela [Prep2:pela:f:s] REM [Sigla] . uma [Arf.indeffs] medida [N:f:s]

[Pp+sj [Adj+ sj da [Prep2:da:f:sJ capacidade [N+sJ que [Adv] [Pron:rel] a

[Ar+deffs] [Pron:pess:3p:f:s] [Pron:dem:3p+sJ [Prepta] REM [SiglaJ tem [V:cj]

de [Preptde] produzir [V:inf] alterages [N:f:plj nos [Prep2:nos:m:pl] objectos

[N:m:pl] em [Preptem] que [AdvJ [Pron:relJ incide [V:cjJ ,alterando [GerJ a

[ArfdeffsJ sua [Pron:poss:3p:f:s] temperatura [N:f:s] ou [Conj:ou] o [Art:def:s]

[Pron:pess:3p:s] [Pron:dem:3p:s] seu [Pron:poss:3p:m:s] estado [N:m:sJ fsico

[Adj:m:sJ . A [Art:def:f:s] quantidade [N+s] de [Prept.de] energia [N+s] radiante

[Adj:2gen:sJ por [Prepl :por] unidade [N+s] de [Prepl :dej volume [N:m:s]

[V:cj] designada [Pp+.s] densidade [N+.s] de [Preptde] energia [N+s] radiante

[Adj:2gen:s](W)Radiante [Adj:2gen:sJ : [V:cjJ a [Ar+deffs] velocidade [N+s] com [Preptcom]

que [Adv] [Pron:rel] a [Art:def:f:s] energia [N:f:s] radiante [Adj:2gen:s] chega

[V:qj a [Art:deffs] [Pron:pess:3p:fsJ [Pron:dem:3p:f:s] [Prepta] um [Art:indef]

determinado [Adj:m:s] [Pp:m:s] ponto [Nms] .

de [Preptde] Fluxo [N:m:s] Radiante [Adj:2gen:s] : [V:cj] o [Art:defs]

[Pron:pess:3p:sJ [Pron:dem:3p:sJ fluxo [N:m:sJ radiante [Adj:2gen:s] que [Adv]

[Promrel] chega [V:cjJ ( irradincia [N:f:s]- E [Conj:e] ) a [Prepta] uma

[Art:indef+sJ unidade [N+s] de [Preptde] rea [N+s] de [Preptde] uma

[Artindeffsj superfcie [N:f:s] plana [Adj+s] ,ou [Conj:ou] que [AdvJ [Pron:rel]

parte [N:f:s] [V:cj] ( exitncia- M ) , por [Preptpor] reflexo [N+s] ou [Conj:ou]

emisso [N:f:sJ ,da [Prep2:da:f:s] unidade [N+sJ de [Preptde] rea [N+s] de

[PreptdeJ uma [Art:mdef:f:s] superfcie [N:fs] plana [Adj:f:s] .

[ Quadro [N:m:s] ] - Grandezas [N+pl] Radiomtricas [Adj:f:pl]

Radiante [Adj:2gen:s] : [V:cj] o [Art:def:sJ [Pron:pess:3p:sJ [Pron:dem:3p:s]

fluxo [N:m:sJ radiante [Adj:2gen:sJ por [Prep tpor] unidade [N:f:s] de [Prepl :de]

ngulo [N:m:s] slido [Adj:m:s] , que [Adv] [Pron:rel] deixa [V:cjJ uma

[Art:indef:f:s]fonte [N:f:sJ pontual [Adj:2gen:s] de [Preptde] REM [Sigla] ,numa

[Prep2;numa:f:s] determinada [Adj+s] [Pp:f:s] direcgo [N:f:s]

355

[Vxj] o [Arfdef s] [Pron:pess:3p:s] [Pron:dem:3p:s]fluxo [N:m:s] radiante

[Adj:2gen:s] , por [Preptpor] unidade [N.fs] de [Prept.de] ngulo [N:m:s] slido

[Adj:m:s] , que [Adv] [Pron.re!] deixa [V:cjJ uma [Art:indef:f:s] fonte [N+sJ de

[Preptde] radiago [N:f:sl ( no [Adv] pontual [Adj:2gen:s] ) ,numa

[Prep2numa:f s) dada [Pp+s] direcgo [N:f:s] , por [Preptpor] unidade [N:f:s]

de [Preptde] rea [N+s] projectada [Pp+s] [Adj:fs] da [Prep2:da:f:s]fonte

[N.f s] ,nessa [Prep2:nessa+s] direcgo [N:f:s] .

1.3- Nogo [N:f:s] de [Prepl :de] Radincia Os sensores [N:m:pl] pticos

[Adj:m:pl] instalados [Pp:m:pl] em [Prept.emJ plataformas [N:fpl] espaciais

[Adj 2gen:plJ medem [VcjJ a [Art:def+sJ radincia [N+s] dos [Prep2:dos:m:p!]

objectos [N:m:pl] [Prep2::f:s] superfcie [N+s] da [Prep2:da:f:s] Terra [N:f:s] .

Para [Preptpara] cada [Pron:indef] elemento [N:m:sJ de [Preptde] rea [N:f:s]

do [Prep2:do:m:sJ terreno [N:m:s] ,a [ArfdeffsJ informago [N+s] registada

[Pp.fs] [Adj:f:s] , por [Preptpor] banda [N+s] espectral [Adj:2gen:s] , [V.cj]

um [Art:indef] nmero [N:m:s] inteiro [Adj:m:s] proporcional [Adj:2gen:s]

[Prep2:+s] radincia [N+s] desse [Prep2:desse:m:s] elemento [N:m:sJ de

[Preptde] rea [N f:s] .

imagem [N:f.s] numrica [Adj:f:s] que [Adv] [Pron.relJ o [ArtdefsJ

[Pron:pess:3p:sJ [Pron:dem:3p:sJ utilizador [N:m:sJrecebe [V:cj] para

[Preptpara] processamento [N:m:s] consiste [V:cj] num [Prep2:num:m:s]

conjunto [N:m:s] de [Preptde] matrizes [N:f:pl] Inteiras [Adj:f:pl] ,tantas

[Pron:indef:f:pl] quantas [Pron:interr] as [Ar+deffpl]bandas [N:f:plJ espectrais

[Adj:2gen:plJ em [Preptem] que [Adv] [Promrel] a [Arf.deffs] imagem [N:f:s] foi

[Vq] registada [Pp:f:s] . Cada [Pronindef] elemento [N:m:s] da [Prep2:da+s]

matriz [N:f: sj [V:cjJ designado [Pp:m:s] [Pp:m:s] elemento [N.nr.s] de

[Prepl :de] imagem [N+s] ou [Conj:ou] pxel [N:m:s] ("

picture element"

) . 0

[Ar+defs] [Pron:pess:3p:s] [Pron:dem:3p:s]Inteiro [Adj:m:sJ atnbudo [Pp:m:s] a

[Arfdeffs] [Pron:pess:3p:fs] [Pron:dem:3p+sJ [Prepta]cada [Pron:indefJ

elemento [N:m:s] de [Preptde] imagem [N:f:s] [V:cj] designado [Pp;m:s]

[Pp:m:s] por [Prepl :por] nvel [N:m:s] de [Prepl :dejintensidade [N+s]

radiomtnca [Adj:f:s] ou [Conj:ou] nvel [N:m:s] radiomtrico [Adj:m:s] ( NR ) .

356

Anexo 9

Sequncias extradas com ExtracTerm,

a partir de texto etiquetado desambiguado

1 - A radia^o eleclromagnlica Introdugo .

aquisigo [N+s] de [Prepl :de] imagens [Nf.pl] {N:f:s+ Prept.de + N+pl}

Detecgo [N:f:s] Remota [Adj:f:s] {N+s + Adj+s}

objectos [N:m:pl] da [Prep2 da+s] superfcie [N f s] {N:m:pl + Prep2:da+s +

N + s}

superficie [N+s] terrestre [Adj:2gen:s] {N+.s+ Adj:2gen:s}

composigo [N+s] espectral [Adj:2gen:s] {N+s+ Adj:2gen s}

qumicas [Adj:f:pl] [N+pl] do [Prep2:do:m:s] objecto [N:m:sJ {N+.pl +

Prep2:do:m:s+ N:m:s}

qumicas [Adj+pl] [N:f:pl] de [Prepl :de] objectos [N:m:pl] {N+pl+ Prepl :de -*

N:m:pl} ,

superficie [N+s] da [Prep2:da:f:s] Terra [N+s] {N:f:s + Prep2:da+s + N:f:s}

bordo [N:m:s] de [Prepl :dej satlites [N:m:plJ {N:m:s + Preptde + N:m:pl}

satlites [N:m:pl] artificiais [Adj:2gen:pl] {N:m:pl+ Adj:2gen:pl}

satlites [N:m:pl] de [Preptde] Detecgo [N+s] {N:m:pl + Prept.de+ N+s}

satlites [N:m:p!] de [Preptde] Detecgo [N:f:s] Remota [Adj+s] {N:m:pl+

Preptde + N:f:s + Adj:f:s}

Detecgo [N:f:s] Remota [Adj:f:s] {N:f:s+ Adj+s}

aquisigo de imagens por Detecco Remota ( DR ) baseia-se no facto de os

objectos da superfcie terrestre reflectirem radiaco_electromagntica ( REM )

proveniente do Sol e emitirem eles prprios REM . A intensidade e composigo

espectral da REM emitida assim_como a percentagem de REM reflectida

dependem das caractersticas fsicas e qumicas do objecto . Assim . possvel

inferir das caractersticas fsicas e qumicas de objectos superfcie da Terra

atravs da REM proveniente desses objectos e registada por sensores a bordo de

satlites artificiais da Terra . designados satlites de Detecco Remota .

Propagago [N:f:s] da [Prep2:da+sJ Radiago [N:f:s] {N+.s + Prep2:da:f:s +

N:fs}

propriedades [N:f:pl] ondulatrias [Adj:f:pl] {N:f:pl + Adj:f pl}

escala [N:f:sJ macroscpica [Adj:f:sJ [Adj+.s] {N+s+ Adj+.s}

escala [N:fs] atmica [Adj+.s] {N:f:s+ Adj:f:s}

Propagago da Radiago Electromagntica A REM propaga-se atravs_do

espago sem suporte material e s observvel atravs_dos efeitos que provoca .

Apresenta propriedades ondulatrias quandose propaga no espaco e quando

interage com a matria a uma escala macroscpica e apresenta propriedades

corpusculares quando interage com a matria a uma escala atmica .

fenmenoslNirmpl] de [PreptdeJ interferncia [N+sJ {N:m:pl + Preptde

N+s}teoria [N+.s] ondulatria [Adj:f:sJ {N+s + Adj:fs}

fenmenos [N:m:pl] elctricos [Adj:m:pl] {N:m:pl+ Adj:m:pl}

fenmenos [N:m:plJ elctricos [Adj:m:pl] e [Conj:e] magnticos [Adj:m:pl]

358

{N:m:pl + Adj:m:pl + Conj:e+ Adj:m:pl}

manifestago [N:f:s] da [Prep2:da:f:s] existncia [N:f:s] {N:f:s + Prep2:da+s +

N+s}

campos [N:m:pl] de [Preptde] forgas [N:f:pl] {N:m:pl + Preptde + N+pl}

campos [N:m:plj de [Preptde] forgas [N:f:plj {N:m:pl + Preptde + N+pl}

forgas [N:f:pl] presentes [Adj:2gen:pl] {N:f:pl+ Adj:2gen:pl}

ondas [N+plJ sinusoidais [Adj:2gen:p!] {N+pl+ Adj:2gen:pl}

planos [Adj:m:pi] [N:m:pl] ortogonais [Adj:2gen:p!] {N:m:pl+ Adj:2gen:pl}

i'enmenos de interferncia e cliiracco explicam-se atravs_da teoria

ondulatria . proposta pelo fsico britnico James C . Maxwell : este elaborou

uma formulago matemtica para os fenmenos elctricos e magnticos que

postula que a REM e a manii'estaco da existncia de dois campos de forcas (

elctrico e magntico ) , conjugados ; a REM gerada quando se produzem

variages na intensidade ou direcco de qualquer dos campos de forgas presentes

e propaga-se na forma de duas ondas sinusoidais . em fase,situadas em dois

planos ortogonais . como se apresenta na figura 1 . 1 .

corpsculos [N:m:pl] designados [Adj:m:pl] {N:m:pl + Adj:m:pl}

quantidade [N+s] de [Preptde] energia [N:f:s] {N:f:s + Prept.de + N+s}

onda [N+sJ de [Prepl :dej propagago [N+s] {N.f.s + Prepl :de + N+s}

outro lado . outros fenmenos . tais como o efeito fotoelctrico . explicam-se

atravs_da teoria corpuscular . proposta por Max Planck , que postula que a

REM constituda por corpsculos designados fotes cuja quantidade de

energia ( Q ) directamente proporcional frequncia ( f ) da onda de

propagaco :

[ Frmula ]

constante [Adj] [N:fsJ de [Prepl :de] Planck [Np] {N:f:s + Prepl :de + Np}

Detecgo [N.f: sj Remota [Adj+sJ {N:f:s + Adj+s}

fenmenos [N:m:pl] de [Prepl :de] propagago [N+s] {N:m:pl + Prepl :de +

N:fs}luz [N:fsJ da [Prep2:da:f:s] teoria [N+s] {N:f:s

+ Prep2:da:f:s + N+s}

teoria [N+s] ondulatria [Adj:f:s] {N+s + Adj:f:s}

fenmenos [N:m:pl] de [Preptde] interacgo [N.f.s] {N:m:pl + Preptde + N+s}

interacgo [N+s] da [Prep2:da:f:s] radiago [N:f:s] {N+s + Prep2:da:f:s + N:f:s}

luz [N:f s] da [Prep2:da:fs] teoria [N+sJ {N+.s+ Prep2:da:f:s + N+s}

energia [N:fsJ electromagntica [Adj:f:s] {N+s + Adj:f:s}

transferncia [N:f:s] da [Prep2:da+sJ energia [N.f.sJ {N+s + Prep2:da:f:s +

N:f:s}

h = 6 . 626 x 10-34 Joules designada por constante de Planck . Em Detecgo

Remota ,analisam-se os fenmenos de propagaco da REM luz da teoria

359

ondulatria e os fenmenos de interacco da radiago com a matria luz da

teoria corpuscular . As alterages que a energia electromagntica provoca

quando interage com um corpo explicam-se pela transferncia da energia

transportada pelos l'otes para os tomos desse corpo .

sensores [N:m:plJ em [Preptem] operago [N:f:sJ {N:m:pl + Preptem + N:f:s}

desenvolvimento [N:m:s] de [Prepl :de] aplicages [N+pl] {N:m:s + Prepl :de +

N+pl}mbito [N:m:sJ da [Prep2:da:f:s] avaliago [N:f:sJ {N:m:s + Prep2:da:f:s + N:f:s}

avaliago [N:f:s] dos [Prep2:dos:m:pl] recursos [N:m:pl] {N+s + Prep2:dos:m:pl+ N:m:pl}recursos [N:m:pl] naturais [Adj:2gen:plJ {N:m:pl

+ Adj.2gen:pl}

sensores [N:m:pl] pticos [Adj:m:plJ {N:m:pl + Adj:m:pl}

superfcie [N:f:s] terrestre [Adj:2gen:s] {N:f:s + Adj:2gen:s}

dispositivos [N:m:pl] de [Preptde] microondas [N:m:pl] {N:m:pl + Prepl :de +

N:m:pl}

dispositivos [N:m:pl] de [Preptde] microondas [N:m:plJ designados

[Pp:m:pl][Adj:m:pl] {N:m:pi + Prepl :de + N m:pl + Adj:m:pl}

microondas [N:m:plJ designados [Adj:m:pl] {N:m:pl- Adj:m:pl}

aquisigo [N.fs] de [Preptde] imagens [N:f:pl] {N+s + Preptde + N+pl}

sensores [N:m:pl] pticos [Adj:m:p!] {N:m:pl + Adj:m:pl}

superfcie [N.fs] terrestre [Adj:2gen:s] {N:f:s + Adj:2gen:s}

principais sensores em operago que registam informaco para o

desenvolvimento de aplicages no mbito da avaliago dos recursos naturais so

sensores pticos que registam a REM reflectida ou emitida pela superfcie

terrestre ou dispositivos de microondas designados RADAR ( RAdio Detection

And Ranging ) . Este captulo vai descrever os processos subjacentes aquisico

de imagens por sensores pticos , sensveis s bandas em que se propaga a REM

Solar que se reflecte na superfcie terrestre .

Espectro [N:m:s] Electromagntico [Adj:m:s] {N:m:s + Adj:m:s}

Espectro Electromagntico

velocidade [N:f:s] da [Prep2:da:fsJ luz [N+s] {N+s + Prep2:da+s + N:f:s}

comprimento [N:m:s] de [Preptde] onda [N+s] {N:m:s+ Preptde + N+s}

ondas_electromagnticas propagam-se ,no vcuo . velocidade da luz ( c

=

299792458 m / s ) e com uma frequncia ( f ) e um comprimento de onda ( ( )

tais que :

[ Frmula ]

360

comprimento [N.m:s] de [Prepl :de] onda [N+s] {N:m:s-

Prepl :de + N:fs}

forma [N+.s] da [Prep2:da:f:s] onda [N f.s] {N+s + Prep2:da:f:s + N:f:s}

onda [N+s] electromagntica [Adj+s] {N:f:s r Adj+s}

quantidade [N+sJ de [Prepl :de] energia [N+.s] {N+s+ Prepl :de + N:f:s}

quantidade [N+s] de [Prepl :de] energia [N+sJ transportada [Pp+s] [AdJ:f:sJ

{N+s + Preptde + N+s + Adj+s}

energia [N:f:s] transportada [Pp+s] [Adj+s] {N:f:s+ Adj+.s}

frequncia e o comprimenio de onda estabelecem a forma da onda

electromagntica e esta est relacionada com a quantidade de energia

transportada atravs_da expresso que se obtm resolvendo (1.2 ) em ordem a

f e substituindo em ( 1 . 1 ) :

Frmula

quantidade [N+sJ de [Preptde] energia [N+s] {N:f:s + Preptde + N+s}

onda [N+s] electromagntica [Adj+.s] {N:f:s+ Adj.f.s}

comprimento [N:m:s] de [Preptde] onda [N+.s] {N:m:s+ Prept.de + N.f s}

facto [Nm:s] de [Prepl :de] sensores [N:m:pl] {N:m:s+ Prept.de + N:m:pl}

bandas [Nf pl] de [Prepl :dej comprimento [N:m:s] {N+pl+ Prepl :de + N:m:s}

compnmento [N:m:s] de [Preptde] onda [N+s] {N:m:s+ Preptde + N:f:s}

bandas [N+pl] trmicas [Adj:f:pl] {N+pl+ Adj+.pl}

satlite [N:m:s] Landsat [SiglaJ {N:m:s+ Sigla}

elemento [N m:s] de [Prept.de] terreno [N:m:s] {N:m:s+ Prepl :de + N:m:s}

quantidade [N:f:s] de [Preptde] energia [N+s] {N:f:s + Prept.de + N.f.s}

parte [N+sJ [Vcj] de [PreptdeJ elementos [N:m:pl] {N+s+ Preptde + N:m:pl}

elementos [N:m:pl] de [Preptde] terreno [N:m:s] {N:m:pl+ Preptde + N:m:s}

comprimentos [N:m:plJ de [Preptde] onda [N+sJ {N:m:pl+ Preptde + N+.s}

infravermelho [Adj:m:s] [N:m:s] prximo [Adj.nr.s] {N:m:s+ Adj:m:s}

assim_que a quantidade de energia transportada pelaonda electromagntica

inversamente proporcional ao comprimento de onda . Este efeito responsvel

pelo facto de sensores que funcionam em bandas de comprimento de onda

maiores ,como por exemplo as bandas trmicas do satlite Landsat ,

terem de

registar a REM de um elemento de terreno de maiores dimenses , para que a

quantidade de energia que chegaao sensor seja detectvel . Por outro lado

explica tambm o facto de os sensores de alta resolugo_espacial ( que detectam

a REM que parte de elementosde terreno de pequenas dimenses ) ficarem

limitados a comprimentos de onda mais baixoscomo as bandas do visvel e

infravermelho prximo .

quantidade [N+sJ de [PreptdeJ energia [N+.s] {N+s+ Prept.de + N+s}

espectro [N:m:sJ electromagntico [Adj:m:s] {N:m:s+ Adj:m:s}

escala [N+.s] de [Preptde] frequncias [N+pl] {N+s+ Preptde + N+pl}

361

bandas [N + pl] espectrais [Adj:2gen:pl] {N:f:pl+ Adj:2gen:pl}

Espectro [N:m:s] Electromagntico [Adj:m:s] {N:m:s + Adj:m:s}

REM e classificada em fungo da sua frequncia ( da sua quantidade de energia )

por intermdio do espectro elcctromagntico que consiste numa escala de

frequncias . cujos intervalos so designados bandas espectrais Fig . 1 . 2 -

fspectro Electromagnetico

sensores [N:m:piJ multiespectrais [Adj:2gen:plJ {N:m:pl+ Adj:2gen:pl}

plataformas [N:f:pl] espaciais [Adj:2gen:p!] {N+p!+ Adj:2gen:pl}

informago [N:f:sJ em [Prepl :em] bandas [N:f:pl] {N+s + Prep t.em + N+pl}

espectro [N:m:s] electromagntico [Adj:m:sJ {N:m:s + Adj:m:s}

zonas [N+pl] do [Prep2:do:m:s] espectro [N:m:sJ {N+.pl + Prep2:do:m:s +

N:m:s}

janelas [N+pl] espectrais [Adj:2gen:pl] {N:f:pl + Adj:2gen:pl}

sensores multiespectrais de REM colocados em plataformas espaciais . so

concebidos para adquirir informago em bandas muito estreitas do espectro

electromagntico . A localizago destas bandas est condicionada s zonas do

espectro , designadas por janelas espectrais ,em que a atmosfera deixa passar

a

REM proveniente do Sol e quelas zonas em que a Terra emite REM .

banda [N+s] de [Preptde] rdio [N:f:s] {N+s + Preptde + N:m:s}

banda [N+s] de [Preptde] rdio [N+sJ {N.+s + Preptde + N+s}

regio [N:f:sJ [N+sJ dos [Prep2:dos:m:plJ comprimentos [N:m:plJ {N:fs+

Prep2:dos:m:p! + N:m:pl}

comprimentos [N:m:plJ de [PreptdeJ onda [N.+sJ {N:m:pl + Preptde+ N+s}

sensores [N:m:plJ de [Prepl :de] rdio [N+s] {N:m:pl + Prepl :de + N:m:s}

sensores [N:m:pl] de [Prep+dej rdio [N:f:s] {N:m:pl + Preptde + N+s}

dispositivos [N:m:pl] de [PreptdeJ RADAR [Sigla] {N:m:pl + Preptde+ Sigla}

RADAR [Sigla] de [Prepfde] imagem [N:f:sJ {Sigla+ Preptde + N:fs}

regio [N+s] [N+s] adjacente [Adj:2gen:s] {N+s + Adj:2gen:s}

comprimento [N:m:s] de [Preptde] onda [N:f:s] {N:m:s + Preptde + N+s}

radimetros [N:m:pl] de [Preptde] microondas [N:m:p!] {N:m:pl + Preptde+

N:m:pl}sistemas [N:m:pl] de [Preptde] RADAR [Siglaj {N:m:pl + Preptde

+ Sigla}

banda [N.f.s] dos [Prep2:dos:m:pl] infravermelhos [N:m:pl]N:fs +

Prep2:dos:m:pl + N:m:pl}

regio [N+sJ [N+sJ espectral [Adj:2gen:s] {N+s+ Adj:2gen:s}

comprimento [N:m:sJ de [Preptde] onda [N:f:s] {N:m:s + Preptde + N:f:s}

infravermelho [Adj:m:s] [N:m:s] trmico [Adj:m:sJ {N:m:s + Adj:m:s}

infravermelho [Adj:m:s] [N:m:sj trmico [Adj:m:sj e [Conj:e] infravermelho

[Adj:m:s] [N:m:sJ {N:m:s+ Adj:m:s + Conj:e + Adj:m:s}

infravermelho [Adj:m:s] [N:m:s] prximo [Adj:m:s] {N:m:s + Adj:m:s}

sistemas [N:m:pl] de [Prepl :de] imagem [N+s] {N:m:pl + Preptde + N:f:s}

gases [N:m:pl] atmosfricos [Adj:m:pl]

gases [N:m:pl] atmosfricos [Adj:m:pl] em [Preptem] relago [N:fs] {N:m:pl +

362

*

Adj:m:pl + Preptem + N+s}

comprimentos [N:m:pl] de [Preptde] onda [N+s] {N m:pl + Preptde + Nf.s}

banda de rdio cobre a regio dos comprimentos de onda superiores a 10 cni :

esta banda e utilizada . principalmente . por sensores de rdioaclivos como os

dispnsitivos de RADAR de imagem . os altmetros e os sonares . A banda das

microondas cobre a rcgiao adjacente quela . at ao comprimento de onda de

lmm : utilizada por radimetros de microondas. espectmetros e sistemas de

RADAR . A banda dos infravermelhos cobre a regio espectral desde o

comprimento de onda de lmm at 0 .7 ( m ; esta regio c subdividida em sub-

regiocs designadas infra- vermelho longnquo . infravermelho trmico e

infravermelho prximo . Nestas bandas utilizam-se muitos sistemas de imagem :

espectro-radimetros . radimctros . polarmetros e lasers . Estes sistemas

tambm so utilizados na banda do visivel . de 0 . 4 ( m- 0 . 7 ( m . As bandas

dos ultravioletas . dos raios x e dos raios gama no so muito utilizadas em DR

por causada opacidade dos gases atmosfrieos em relagao REM proveniente

do Sol . nestes comprimentos de onda .

363


Recommended